福建移動(dòng)BOSS備份任務(wù)執(zhí)行情況評(píng)測(cè)結(jié)果(2009.1.19-2.18)

當(dāng)前行業(yè)內(nèi)備份系統(tǒng)的平均水平,可以其它兩個(gè)兄弟省份公司的近期備份評(píng)估結(jié)果為例,2008年7月8日至7月30日,經(jīng)過(guò)對(duì)"甲"公司備份系統(tǒng)進(jìn)行測(cè)試后發(fā)現(xiàn),其中有個(gè)服務(wù)器不能正常備份,另有一個(gè)為營(yíng)帳數(shù)據(jù)庫(kù)BCV(業(yè)務(wù)連續(xù)性卷)做磁帶備份的服務(wù)器,出現(xiàn)了2次備份失敗,而此服務(wù)器備份的都是關(guān)鍵數(shù)據(jù)并且數(shù)據(jù)量巨大。。評(píng)估期間還發(fā)現(xiàn),因機(jī)房調(diào)整導(dǎo)致備份作業(yè)部份監(jiān)控?cái)?shù)據(jù)的收集中斷,無(wú)法得到完整的備份作業(yè)監(jiān)控報(bào)告。2009年1月8日至1月20日,在"乙"公司的BOSS備份系統(tǒng)中做備份系統(tǒng)評(píng)估時(shí),也發(fā)現(xiàn)和"甲"公司類似的問(wèn)題,還有個(gè)別服務(wù)器甚至沒(méi)有執(zhí)行部份備份任務(wù)。

備份系統(tǒng)技術(shù)改進(jìn)無(wú)止境

自2000年至今,福建移動(dòng)的備份系統(tǒng)建設(shè)主要經(jīng)歷了四個(gè)階段。

2000年到2003年的第一階段,福建移動(dòng)在Oracle數(shù)據(jù)庫(kù)引入了RMAN數(shù)據(jù)庫(kù)物理備份工具,并率先使用Oracle RMAN備份工具結(jié)合EMC Networker備份管理工具進(jìn)行數(shù)據(jù)庫(kù)的在線物理備份管理。

2003年到2006年的第二階段,福建移動(dòng)BOSS系統(tǒng)集中化改造完成,并形成了大型集中的數(shù)據(jù)中心,備份系統(tǒng)結(jié)構(gòu)上利用了SAN網(wǎng)絡(luò)搭建新型的備份系統(tǒng)架構(gòu),實(shí)現(xiàn)了備份存儲(chǔ)資源的虛擬化,以及全面的LAN-free(數(shù)據(jù)不經(jīng)過(guò)局域網(wǎng)直接進(jìn)行備份)備份方式。

福建移動(dòng)BOSS系統(tǒng)備份發(fā)展歷程

2006年到2008年的第三階段,實(shí)現(xiàn)了多個(gè)遠(yuǎn)程機(jī)房組成一套備份SAN網(wǎng)絡(luò),并由一個(gè)備份系統(tǒng)管理多個(gè)遠(yuǎn)程系統(tǒng)數(shù)據(jù)備份,并引入虛擬帶庫(kù)和ATA盤陣作為備份存儲(chǔ)介質(zhì),通過(guò)多級(jí)備份存儲(chǔ)結(jié)構(gòu)實(shí)現(xiàn)自動(dòng)化的異地備份保存。2007年,福建移動(dòng)完成了BOSS系統(tǒng)容災(zāi)建設(shè),在此基礎(chǔ)上,福建移動(dòng)通過(guò)快照數(shù)據(jù)庫(kù)的備份,實(shí)現(xiàn)了對(duì)生產(chǎn)數(shù)據(jù)庫(kù)無(wú)事務(wù)丟失的數(shù)據(jù)恢復(fù)。福建移動(dòng)的BOSS系統(tǒng)設(shè)備分布在同城的4個(gè)機(jī)房,其中一個(gè)機(jī)房關(guān)鍵業(yè)務(wù)數(shù)據(jù)量少。于是,福建移動(dòng)將其它三個(gè)機(jī)房節(jié)點(diǎn)采用2對(duì)DWDM 2GB光纖打通遠(yuǎn)程備份通道,形成三個(gè)遠(yuǎn)程節(jié)點(diǎn)備份SAN網(wǎng)絡(luò),并用一套備份系統(tǒng)管理三個(gè)遠(yuǎn)程系統(tǒng)的數(shù)據(jù)備份。由于有一個(gè)專門的備份SAN網(wǎng)絡(luò),就可以減少生產(chǎn)系統(tǒng)SAN網(wǎng)絡(luò)的不穩(wěn)定,減少備份過(guò)程對(duì)主機(jī)HBA卡數(shù)據(jù)流量過(guò)高的影響,保證備份方式的靈活性,自動(dòng)實(shí)現(xiàn)異地?cái)?shù)據(jù)備份與保存。與些同時(shí),福建移動(dòng)整體上實(shí)現(xiàn)根據(jù)不同需求進(jìn)行不同等級(jí)的備份。通過(guò)引入EMC虛擬帶庫(kù)作為備份存儲(chǔ),虛擬磁帶庫(kù)的RAID技術(shù)保證了備份數(shù)據(jù)的可靠性,從而解決傳統(tǒng)磁帶庫(kù)具有高機(jī)械故障率的特點(diǎn)。

從2008年開(kāi)始進(jìn)入第四階段,福建移動(dòng)BOSS建設(shè)完成容災(zāi)系統(tǒng),利用容災(zāi)端資源進(jìn)行數(shù)據(jù)備份。EMC Symmetrix存儲(chǔ)陣列的同步數(shù)據(jù)復(fù)制技術(shù),保證了同城模式下容災(zāi)端數(shù)據(jù)與生產(chǎn)端實(shí)時(shí)同步。這樣,可將數(shù)據(jù)庫(kù)物理備份放在容災(zāi)端的快照數(shù)據(jù)庫(kù)進(jìn)行,降低生產(chǎn)系統(tǒng)資源開(kāi)銷的需求,增強(qiáng)了數(shù)據(jù)備份的可靠性。同時(shí),能夠?qū)崿F(xiàn)增量備份,能提供歷史數(shù)據(jù)的恢復(fù)需求。

備份系統(tǒng)考驗(yàn)人員的綜合能力

IT是業(yè)務(wù)的后臺(tái),備份又是IT的后臺(tái),備份工作不那么引人注目,但是,實(shí)際上,備份工作對(duì)相關(guān)工作人員的技術(shù)和經(jīng)驗(yàn)要求都很高,需要IT管理人員對(duì)主機(jī)、服務(wù)器、網(wǎng)絡(luò)、存儲(chǔ)、操作系統(tǒng)、數(shù)據(jù)庫(kù)等方面有全面的知識(shí),特別對(duì)數(shù)據(jù)庫(kù)的備份和恢復(fù)操作非常了解,要能夠結(jié)合業(yè)務(wù)需求,規(guī)劃IT架構(gòu),制定和執(zhí)行備份策略,等等。一個(gè)好的備份系統(tǒng),要考慮備份時(shí)間、備份成功率、恢復(fù)效率和難易、運(yùn)維管理工作量等多方面的因素。

關(guān)于這一點(diǎn),看一看福建移動(dòng)備份系統(tǒng)的結(jié)構(gòu)可以窺見(jiàn)一斑。以下為福建移動(dòng)備份系統(tǒng)的邏輯架構(gòu)圖。福建移動(dòng)BOSS備份系統(tǒng)采用EMC Networker備份管理集成軟件。它是一個(gè)通用平臺(tái),支持廣泛的數(shù)據(jù)保護(hù)選項(xiàng),包括磁盤備份、復(fù)制、連續(xù)數(shù)據(jù)保護(hù),以及跨物理和虛擬環(huán)境的重復(fù)數(shù)據(jù)刪除。EMC Networker包含了介質(zhì)管理、備份服務(wù)器、存儲(chǔ)節(jié)點(diǎn)、備份客戶端、帶機(jī)資源共享、以及數(shù)據(jù)庫(kù)備份接口等模塊。其中,RMAN可以實(shí)現(xiàn)Oracle數(shù)據(jù)庫(kù)動(dòng)態(tài)物理數(shù)據(jù)的備份與無(wú)事務(wù)丟失的恢復(fù),并且能自動(dòng)夠管理備份及保存策略。EMC Networker為RMAN提供NMO接口模塊,使得RMAN能夠通過(guò)Networker將備份數(shù)據(jù)寫入磁帶或從磁帶中讀取備份數(shù)據(jù)。福建移動(dòng)BOSS系統(tǒng)中每天有大量的各種處理階段的話單文件需要保存,在備份系統(tǒng)中采用了EMC Disk-Extender工具進(jìn)行這些文件的歸檔,Disk-Extender可將文件數(shù)據(jù)在后臺(tái)通過(guò)制定策略搬遷到ATA盤陣中實(shí)現(xiàn)歸檔存放。

福建移動(dòng)BOSS備份系統(tǒng)邏輯架構(gòu)

從數(shù)據(jù)的角度看,福建移動(dòng)主要采取了四種備份方式,實(shí)現(xiàn)了BOSS系統(tǒng)多類型數(shù)據(jù)的保護(hù)。

目前,福建移動(dòng)BOSS系統(tǒng)備份的具體情況是這樣的,核心數(shù)據(jù)庫(kù)服務(wù)器白天通過(guò)災(zāi)備服務(wù)器進(jìn)行LAN-Free備份,每六天一次數(shù)據(jù)庫(kù)全備份,其他時(shí)間增量備份;生產(chǎn)服務(wù)器每天備份兩次歸檔日志;數(shù)據(jù)在虛擬磁帶庫(kù)保留2個(gè)月,每月定期克隆2-4份全備份到磁帶庫(kù)。關(guān)于客服/話單文件服務(wù)器,通過(guò)備份服務(wù)器進(jìn)行LAN備份,每天晚上增量備份;數(shù)據(jù)備份到異地的物理磁帶庫(kù)中,保留半年到1年不等。

最后,林志云談到一點(diǎn)經(jīng)驗(yàn),就是不要將備份系統(tǒng)單純看成是使用備份軟件將生產(chǎn)數(shù)據(jù)備份到備份介質(zhì)上,而應(yīng)該將其納入到信息生命周期的整體規(guī)劃中來(lái)統(tǒng)籌考慮。一般而言,生產(chǎn)數(shù)據(jù)庫(kù)數(shù)據(jù)量非常大,做物理備份難度非常高,全備份的時(shí)間非常長(zhǎng),并且跟生產(chǎn)時(shí)間重合占用資源比較多。一些兄弟公司對(duì)數(shù)據(jù)庫(kù)采用按區(qū)域劃分的方式,數(shù)據(jù)庫(kù)的體積往往很大。福建移動(dòng)采用按功能劃分的方式,分切得非常多,并根據(jù)數(shù)據(jù)在其生命周期中的不同位置,及時(shí)將數(shù)據(jù)移動(dòng)到不同級(jí)別的歷史數(shù)據(jù)庫(kù),以保持生產(chǎn)數(shù)據(jù)庫(kù)的瘦身狀態(tài),這樣可以保證最關(guān)鍵的生產(chǎn)數(shù)據(jù)得到及時(shí)備份及快速恢復(fù),也使數(shù)據(jù)的整體備份流程和管理工作可以做到規(guī)范化管理,最終取得較高的備份成功率和恢復(fù)成功率。

分享到

cuihao

相關(guān)推薦