(2)接入服務(wù)器:接入服務(wù)器為營(yíng)業(yè)系統(tǒng)提供自建營(yíng)業(yè)廳、合作營(yíng)業(yè)廳、代辦點(diǎn)、連鎖店等所有的營(yíng)業(yè)終端接入服務(wù),以及電子渠道等營(yíng)業(yè)相關(guān)業(yè)務(wù)接入,通過(guò)網(wǎng)頁(yè)的形式展現(xiàn)。前端訪問(wèn)請(qǐng)求可以通過(guò)負(fù)載均衡器,分配訪問(wèn)量到各個(gè)WEB Server。這樣,即使有某臺(tái)Server出現(xiàn)故障,其他Server將繼續(xù)提供服務(wù),接入服務(wù)器群主要采用HP ProLiant BladeSystem刀片服務(wù)器系統(tǒng),機(jī)型是基于AMD四核皓龍的HP Blade System BL465c G5,BL465c 配備兩顆AMD四核皓龍?zhí)幚砥?,具有與標(biāo)準(zhǔn) 1U 機(jī)架安裝式服務(wù)器相同的特性,集成了節(jié)能的計(jì)算功能和高密度性、擴(kuò)展的內(nèi)存和 I/O,極大地提高了性能。此款均衡架構(gòu)帶有AMD 四核皓龍TM處理器、DDR2 內(nèi)存、串行硬盤(pán)、多功能千兆網(wǎng)絡(luò)支持和多 I/O 卡,可提供一個(gè)適合多種應(yīng)用的高性能系統(tǒng)。尤其是采用的AMD四核皓龍TM處理器,憑借直連架構(gòu)以及超傳輸總線和集成內(nèi)存控制器等優(yōu)秀技術(shù),為接入服務(wù)器帶來(lái)了業(yè)界領(lǐng)先的性能和穩(wěn)定性。同時(shí),外形小巧的 BL465c 中還包括確保高可用性的特性,如熱插拔硬盤(pán)驅(qū)動(dòng)器、內(nèi)存交錯(cuò)、嵌入式 RAID 功能、以及提高的遠(yuǎn)程 Lights-Out 管理。采用HP C7000機(jī)箱,10U高,可放16個(gè)半高或8個(gè)全高的刀片服務(wù)器,
(3)數(shù)據(jù)庫(kù)服務(wù)器:直接與應(yīng)用服務(wù)器進(jìn)行數(shù)據(jù)交換,應(yīng)用服務(wù)器訪問(wèn)數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)操作,數(shù)據(jù)庫(kù)服務(wù)器采用RAC方式提供性能和可靠性的保證,數(shù)據(jù)庫(kù)服務(wù)器采用UNIX小型機(jī)。
在進(jìn)行CRM應(yīng)用服務(wù)器替換為刀片服務(wù)器的同時(shí),CRM應(yīng)用、部署進(jìn)行了相應(yīng)的優(yōu)化、調(diào)整,保證設(shè)備替換后系統(tǒng)運(yùn)行的高性能、高穩(wěn)定性。
(1)CRM應(yīng)用優(yōu)化。針對(duì)應(yīng)用部署的集群化,優(yōu)化應(yīng)用發(fā)布模塊,實(shí)現(xiàn)應(yīng)用分布式、自動(dòng)化部署。優(yōu)化系統(tǒng)監(jiān)控模塊提供對(duì)分布式系統(tǒng)應(yīng)用追蹤、監(jiān)控功能,實(shí)現(xiàn)對(duì)服務(wù)、事物/數(shù)據(jù)庫(kù)連接、系統(tǒng)訪問(wèn)、SQL的多方面監(jiān)控。及時(shí)發(fā)現(xiàn)問(wèn)題和缺陷并進(jìn)行優(yōu)化調(diào)整。如:服務(wù)跟蹤功能可以實(shí)時(shí)進(jìn)行營(yíng)業(yè)員前臺(tái)操作、后臺(tái)服務(wù)調(diào)用、數(shù)據(jù)庫(kù)數(shù)據(jù)操作的整個(gè)操作軌跡的跟蹤、分析。
(2)應(yīng)用整合。CRM應(yīng)用架構(gòu)整合所有業(yè)務(wù)功能,而不是原有的一套業(yè)務(wù)屬性對(duì)應(yīng)一套業(yè)務(wù)系統(tǒng)。在每臺(tái)服務(wù)器上均部署相同的應(yīng)用,通過(guò)設(shè)置實(shí)現(xiàn)不同服務(wù)器/業(yè)務(wù)域?qū)崿F(xiàn)不同的功能;單個(gè)模塊或者功能點(diǎn)的失效、升級(jí)或者failover通過(guò)模塊控制進(jìn)行設(shè)置。
(3)應(yīng)用部署集群化。CRM應(yīng)用采用集群部署,將若干服務(wù)器設(shè)置為一個(gè)功能域,為特定的接入渠道服務(wù);同時(shí),同一集群的刀片分布于不同的機(jī)框中,避免一個(gè)機(jī)柜故障導(dǎo)致整個(gè)應(yīng)用集群的不可用。采用分散部署的方式可以在單個(gè)進(jìn)程/設(shè)備/機(jī)柜不可用情況下由其他設(shè)備進(jìn)行應(yīng)用分擔(dān),任一點(diǎn)出現(xiàn)問(wèn)題,不會(huì)造成系統(tǒng)整體影響問(wèn)題,提高系統(tǒng)的可用性。
(4)應(yīng)用部署自適應(yīng)調(diào)整機(jī)制。不同應(yīng)用集群應(yīng)用負(fù)載設(shè)置性能壓力閾值,當(dāng)某個(gè)集群壓力超過(guò)閾值將自適應(yīng)/手工進(jìn)行調(diào)整,使用備用集群或其它集群部分資源進(jìn)行負(fù)載分擔(dān)。當(dāng)業(yè)務(wù)量降低,又會(huì)調(diào)整回去。通過(guò)自適應(yīng)調(diào)整機(jī)制均衡各應(yīng)用集群的能力。
(5)設(shè)置備用刀片集群。當(dāng)生產(chǎn)設(shè)備故障時(shí)可以將應(yīng)用接入到備用集群;同時(shí),在應(yīng)用系統(tǒng)升級(jí)、生產(chǎn)設(shè)備檢修時(shí)也可以將應(yīng)用切換到備用集群上。通過(guò)備用刀片集群的設(shè)置提升了系統(tǒng)的穩(wěn)定性和可維護(hù)性。
業(yè)務(wù)支撐系統(tǒng)應(yīng)用刀片服務(wù)器效果分析
1.降低購(gòu)置成本
如果用8臺(tái)機(jī)架式服務(wù)器和8臺(tái)基于AMD皓龍?zhí)幚砥鞯牡镀?wù)器相比較,帶有光纖通道連接的HP BladeSystem的成本比機(jī)架式服務(wù)器成本低15-2%,服務(wù)器數(shù)量超過(guò)3-4臺(tái)之后,購(gòu)買(mǎi)刀片服務(wù)器就要比傳統(tǒng)機(jī)架式服務(wù)器更加經(jīng)濟(jì)。
采用上面相同的比較,不帶光纖通道連接的HP BladeSystem(只有內(nèi)部驅(qū)動(dòng)器)的成本比同級(jí)別機(jī)架安裝基礎(chǔ)設(shè)施成本低1-4%,服務(wù)器數(shù)量超過(guò)6-8臺(tái)之后,購(gòu)買(mǎi)刀片服務(wù)器就要比傳統(tǒng)機(jī)架式服務(wù)器更加經(jīng)濟(jì)。
2.降低運(yùn)營(yíng)成本
初始設(shè)置時(shí)間從每臺(tái)服務(wù)器12小時(shí)降低到30分鐘,實(shí)施變更和重新配置的時(shí)間從4小時(shí)降低到30分鐘,假設(shè)每小時(shí)的平均管理成本為43美元,若使用基于AMD皓龍?zhí)幚砥鞯腍P BladeSystem,每年100臺(tái)服務(wù)器的成本可從68800美元降低到8600美元。
與采用專(zhuān)用服務(wù)器存儲(chǔ)相比,采用網(wǎng)絡(luò)存儲(chǔ)可管理多達(dá)6倍的存儲(chǔ),從而將從存儲(chǔ)管理節(jié)省的資源用于戰(zhàn)略創(chuàng)新。
3.更好的性能表現(xiàn)
采用分布式系統(tǒng)設(shè)計(jì)和操作系統(tǒng)優(yōu)秀的內(nèi)核應(yīng)用處理效率獲得顯著提升。CRM部分業(yè)務(wù)的性能提高在30%-50%之間。
現(xiàn)有系統(tǒng)采用集群方式部署、分布式計(jì)算,在計(jì)算能力提升的同時(shí)有效降低單主機(jī)負(fù)載。采用小型機(jī)時(shí),主機(jī)忙時(shí)平均負(fù)載在35%;替換后,單主機(jī)忙時(shí)平均負(fù)載降低到20%。
4.更高可用性
(1)系統(tǒng)可用性提升
河南移動(dòng)CRM系統(tǒng)的刀片服務(wù)器安置于多臺(tái)機(jī)柜中,應(yīng)用劃分為多個(gè)業(yè)務(wù)組,同一分組的應(yīng)用部署于不同機(jī)柜的刀片上。通過(guò)應(yīng)用部署避免設(shè)備故障導(dǎo)致全系統(tǒng)癱瘓。
系統(tǒng)提供故障節(jié)點(diǎn)判斷能力,當(dāng)發(fā)現(xiàn)某進(jìn)程/設(shè)備故障時(shí),系統(tǒng)自動(dòng)將請(qǐng)求分發(fā)至其他節(jié)點(diǎn)并進(jìn)行告警,由于采用多服務(wù)器集群方式進(jìn)行負(fù)載分擔(dān),降低了單節(jié)點(diǎn)故障對(duì)整體系統(tǒng)影響。
系統(tǒng)提供應(yīng)用分組負(fù)載自適應(yīng)調(diào)整機(jī)制,某分組壓力過(guò)大時(shí),可以將服務(wù)請(qǐng)求分流至其他低負(fù)載分組上。
設(shè)置備用刀片組作為系統(tǒng)設(shè)備冗余。備用服務(wù)器上應(yīng)用部署與其他設(shè)備相同,處于在線運(yùn)行狀態(tài),當(dāng)生產(chǎn)設(shè)備故障、應(yīng)用升級(jí)、設(shè)備檢修時(shí)可以將服務(wù)請(qǐng)求接入至備用集群。
(2)硬件可用性提升
刀片服務(wù)器具備"熱插拔"的能力。某臺(tái)刀片設(shè)備故障時(shí),僅需將故障刀片拖出機(jī)箱,插入新刀片替換即可。
整合的基礎(chǔ)設(shè)施可避免由于各種原因所造成的停機(jī)現(xiàn)象,諸如線纜、服務(wù)器、存儲(chǔ)、開(kāi)關(guān)故障;人為配置錯(cuò)誤、以及軟件、電源和散熱問(wèn)題。解決上述問(wèn)題的時(shí)間大幅度減少,每年計(jì)劃內(nèi)和計(jì)劃外的停機(jī)時(shí)間可減少近100%;設(shè)備內(nèi)建N+1冗余,因而無(wú)需閑置、備用的部件,另外還提供了N+1冗余設(shè)計(jì),因此而降低了冗余硬件成本。
5.更高可維護(hù)性
刀片服務(wù)器通過(guò)集群方式提供高性能的服務(wù),但設(shè)備數(shù)量成倍增加給系統(tǒng)的維護(hù)、管理帶來(lái)一定的難度和工作量的增加??紤]到這一問(wèn)題,CRM系統(tǒng)提供了自動(dòng)部署和系統(tǒng)服務(wù)追蹤、監(jiān)控功能,保證應(yīng)用服務(wù)器刀片化的同時(shí)系統(tǒng)仍具備高可維護(hù)性。
自動(dòng)應(yīng)用部署支持自動(dòng)化、分布式的部署方式,極大簡(jiǎn)化應(yīng)用部署。發(fā)布通過(guò)控制設(shè)備支持全量、增量可視化發(fā)布,整個(gè)發(fā)布過(guò)程無(wú)須人工干預(yù),僅需要15分鐘;支持針對(duì)不同邏輯業(yè)務(wù)組定向發(fā)布。通過(guò)平臺(tái)發(fā)布組件的應(yīng)用自動(dòng)發(fā)布功能,系統(tǒng)不因服務(wù)器數(shù)量的增加而增加發(fā)布的工作量和差錯(cuò)率。
CRM系統(tǒng)實(shí)現(xiàn)了追蹤、監(jiān)控功能,可以實(shí)現(xiàn)對(duì)服務(wù)、事物/數(shù)據(jù)庫(kù)連接、系統(tǒng)訪問(wèn)、SQL的多方面監(jiān)控。及時(shí)發(fā)現(xiàn)問(wèn)題和缺陷并進(jìn)行優(yōu)化調(diào)整。如:服務(wù)跟蹤功能可以實(shí)時(shí)進(jìn)行營(yíng)業(yè)員前臺(tái)操作、后臺(tái)服務(wù)調(diào)用、數(shù)據(jù)庫(kù)數(shù)據(jù)操作的整個(gè)操作軌跡的跟蹤、分析。系統(tǒng)的實(shí)時(shí)監(jiān)控、服務(wù)狀態(tài)跟蹤和故障定位能力使維護(hù)人員可以及時(shí)發(fā)現(xiàn)薄弱環(huán)節(jié)、準(zhǔn)確定位問(wèn)題從而指導(dǎo)系統(tǒng)優(yōu)化。
系統(tǒng)使用刀片服務(wù)器替換后,數(shù)據(jù)中心設(shè)備與管理員的比例大為降低,節(jié)省大量的管理投入。
6.更高可擴(kuò)展性
軟件系統(tǒng)由于采用J2EE技術(shù),具備了跨平臺(tái)運(yùn)行能力和極強(qiáng)的擴(kuò)展能力。系統(tǒng)在不進(jìn)行任何編碼的情況下,可以實(shí)時(shí),在線的進(jìn)行容量擴(kuò)展,利用更多的設(shè)備,為移動(dòng)業(yè)務(wù)發(fā)展提高更高的保證。
硬件設(shè)備擴(kuò)容上,刀片服務(wù)器可以通過(guò)在線/離線增加設(shè)備的方式進(jìn)行擴(kuò)容和優(yōu)化,即Scale out模式。刀片集群擴(kuò)展時(shí),僅需要根據(jù)處理能力需求將擴(kuò)容刀片插入機(jī)框即可。系統(tǒng)可以實(shí)時(shí)、在線的進(jìn)行容量擴(kuò)展。
采用全新的軟件架構(gòu)與刀片服務(wù)器的CRM系統(tǒng)擴(kuò)容更加靈活性、簡(jiǎn)便。計(jì)算能力需求實(shí)現(xiàn)的顆粒度更加細(xì)致。
7.更好的節(jié)能減排效果
通過(guò)CRM應(yīng)用服務(wù)器替換,因?yàn)橐肓斯?jié)能高效的AMD四核皓龍?zhí)幚砥?,?biāo)準(zhǔn)42U機(jī)柜占用減少40%,耗電量更是節(jié)省高達(dá)57%。
8.線纜復(fù)雜度降低
傳統(tǒng)服務(wù)器架構(gòu)的布線增加了巨大的復(fù)雜性,是系統(tǒng)停機(jī)和不靈活的一個(gè)主要根源。
采用刀片服務(wù)器可以減少87%的線纜,平均每個(gè)1000M網(wǎng)絡(luò)端口可節(jié)約100到350美元。
通過(guò)先進(jìn)的采用IP的iLO2管理功能,消除了KVM交換機(jī)和線纜的需要,每個(gè)機(jī)架可另外節(jié)省高達(dá)25000美元。
創(chuàng)新性分析
1.設(shè)備選擇創(chuàng)新
率先在業(yè)務(wù)支撐系統(tǒng)的核心應(yīng)用系統(tǒng)中采用刀片服務(wù)器,與傳統(tǒng)的UNIX服務(wù)器相比,刀片服務(wù)器的采購(gòu)成本大大降低,且具備占用空間小、耗電量低、管理和配置簡(jiǎn)單靈活等特點(diǎn),在實(shí)際的系統(tǒng)運(yùn)營(yíng)過(guò)程中同時(shí)降低了機(jī)房空間、耗電和管理成本。
2.系統(tǒng)架構(gòu)創(chuàng)新
傳統(tǒng)的業(yè)務(wù)支撐系統(tǒng)應(yīng)用服務(wù)器部署一般采用集群軟件形成主備方式的集群,當(dāng)主服務(wù)器發(fā)生故障時(shí),集群軟件監(jiān)測(cè)到故障,自動(dòng)將系統(tǒng)和應(yīng)用切換到備份服務(wù)器上。河南移動(dòng)BOSS3.0 CRM系統(tǒng)應(yīng)用服務(wù)器采用統(tǒng)一開(kāi)發(fā)、運(yùn)行平臺(tái),所有的應(yīng)用服務(wù)器統(tǒng)一提供對(duì)外服務(wù),業(yè)務(wù)邏輯分布在多個(gè)節(jié)點(diǎn)上處理,單臺(tái)節(jié)點(diǎn)發(fā)生故障不影響系統(tǒng)正常服務(wù),從另外一個(gè)層面提供了系統(tǒng)可靠性保證。
此外,系統(tǒng)性能的擴(kuò)展也可以通過(guò)增加服務(wù)器節(jié)點(diǎn)的方式實(shí)現(xiàn),不需要停止現(xiàn)有的應(yīng)用服務(wù),簡(jiǎn)單靈活。
3.系統(tǒng)運(yùn)營(yíng)管理創(chuàng)新
新系統(tǒng)建成后,整體的系統(tǒng)管理從單一服務(wù)器管理轉(zhuǎn)換為刀片服務(wù)器集群管理,利用HP刀片服務(wù)器完善的管理工具,新服務(wù)器的擴(kuò)展從傳統(tǒng)的單機(jī)安裝、連線、加電、配置、上線,轉(zhuǎn)換成插板、集群配置和發(fā)布、上線,大大降低了系統(tǒng)升級(jí)、配置和管理的工作量。