上海市電力公司借鑒EMC BCSI,并廣泛學(xué)習(xí)國際災(zāi)難恢復(fù)協(xié)會(huì)(DRII)《Professional Practices for Business Continuity Planners》、國務(wù)院信息辦《重要信息系統(tǒng)災(zāi)難恢復(fù)規(guī)劃指南》、《國家電網(wǎng)公司信息系統(tǒng)應(yīng)急預(yù)案》等指導(dǎo)性文件,對(duì)自己的業(yè)務(wù)情況進(jìn)行了全面的風(fēng)險(xiǎn)分析、業(yè)務(wù)影響分析、IT系統(tǒng)現(xiàn)狀分析,最終制定出上海市電力公司的業(yè)務(wù)連續(xù)性策略,寫出了長達(dá)75頁的《業(yè)務(wù)連續(xù)性策略報(bào)告》,作為整個(gè)項(xiàng)目實(shí)施的指南。
關(guān)鍵二:先進(jìn)的技術(shù)平臺(tái)
根據(jù)《策略報(bào)告》,上海市電力在浦東和浦西分別設(shè)立數(shù)據(jù)中心,實(shí)現(xiàn)同城異地的數(shù)據(jù)應(yīng)急容災(zāi)。上海市電力在主、備數(shù)據(jù)中心選擇了統(tǒng)一的IBM P570主機(jī)設(shè)備,主數(shù)據(jù)中心選用2臺(tái)EMC DMX-3存儲(chǔ)陣列作為主中心CIS、PMS、ERP應(yīng)用系統(tǒng)存儲(chǔ)設(shè)備,其中1臺(tái)為CIS專用設(shè)備,另1臺(tái)為ERP、PMS共用。原CIS數(shù)據(jù)倉庫采用了EMC DMX2000存儲(chǔ)系統(tǒng),本次將數(shù)據(jù)倉庫應(yīng)用遷移到DMX-3以后,DMX2000便作為應(yīng)急系統(tǒng)備份中心CIS、PMS、ERP應(yīng)用系統(tǒng)存儲(chǔ)設(shè)備。主、備中心之間采用DWDM設(shè)備通過2條不同方向的光纖實(shí)現(xiàn)兩地SAN的高速級(jí)聯(lián),進(jìn)行存儲(chǔ)陣列2對(duì)1數(shù)據(jù)復(fù)制。在數(shù)據(jù)管理方面,用到EMC的三個(gè)重要軟件:EMC SRDF異地復(fù)制軟件、EMC TimeFinder本地復(fù)制軟件和EMC Control Center管理軟件,實(shí)現(xiàn)浦東數(shù)據(jù)中心和浦西數(shù)據(jù)中心之間的數(shù)據(jù)復(fù)制。
通過以上平臺(tái),可以確保生產(chǎn)系統(tǒng)和備份系統(tǒng)的數(shù)據(jù)完全一致,可以透明地切換業(yè)務(wù)。換句話講,用戶無需任何專門的停機(jī)時(shí)間,即可完成業(yè)務(wù)的啟動(dòng),真正實(shí)現(xiàn)用戶業(yè)務(wù)系統(tǒng)的連續(xù)性。用戶可以利用該功能,非常輕松地實(shí)現(xiàn)應(yīng)急演練和日常計(jì)劃性停機(jī)維護(hù)等工作。
結(jié)合本地?cái)?shù)據(jù)復(fù)制軟件EMC TimeFinder,上海市電力可以克隆生產(chǎn)數(shù)據(jù)或?qū)ιa(chǎn)數(shù)據(jù)執(zhí)行快照,或者用于數(shù)據(jù)倉庫系統(tǒng)的數(shù)據(jù)挖掘和抽樣等,還可以在災(zāi)備端對(duì)災(zāi)備磁盤執(zhí)行同樣的功能,克隆數(shù)據(jù)可以作為應(yīng)急演練的環(huán)境??煺諗?shù)據(jù)可以在鏈路中斷等故障、需要數(shù)據(jù)再同步時(shí),對(duì)災(zāi)備數(shù)據(jù)實(shí)現(xiàn)二次保護(hù)。
關(guān)鍵三:防患于未然的演練
正如上海市電力公司副總經(jīng)理阮前途在驗(yàn)收會(huì)上所說,"某種意義上講,安全的最大隱患是對(duì)安全的估計(jì)不足。信息系統(tǒng)尤其是電力部門的信息系統(tǒng),要把它提高到電網(wǎng)安全層面上來考慮。真正發(fā)生事故的時(shí)候,專家們并不在場(chǎng),緊急狀況下還有可能出現(xiàn)其他的突發(fā)事件。所以今后這方面的演練我們要經(jīng)常做,信息系統(tǒng)也要像電網(wǎng)事故的演練一樣要經(jīng)常進(jìn)行。不可能靠事故的發(fā)生來積累經(jīng)驗(yàn),只能通過不斷地演練來積累自己的經(jīng)驗(yàn)。同時(shí),需要充分借鑒其他行業(yè)的經(jīng)驗(yàn)。"
在10月25日的演練中,模擬場(chǎng)景是:浦東數(shù)據(jù)中心的ERP系統(tǒng)出現(xiàn)嚴(yán)重故障,預(yù)計(jì)4小時(shí)內(nèi)難以恢復(fù)。于是立即采取措施,啟動(dòng)浦西數(shù)據(jù)中心的應(yīng)急系統(tǒng),ERP、CIS、PMS三大應(yīng)用系統(tǒng)切換到浦西數(shù)據(jù)中心。從應(yīng)用處理到主機(jī)處理、存儲(chǔ)處理,切換順利完成,接著就是最為緊張的業(yè)務(wù)切回和數(shù)據(jù)恢復(fù),由于整套系統(tǒng)遵循EMC的BCSI方法論進(jìn)行了全套流程的規(guī)范和完善,一系列步驟快而不亂,不知不覺,主機(jī)恢復(fù)、應(yīng)用恢復(fù)、接口恢復(fù)、應(yīng)用內(nèi)部測(cè)試、DNS修改、業(yè)務(wù)測(cè)試一氣呵成,演練成功完成。
由于整個(gè)技術(shù)平臺(tái)設(shè)計(jì)先進(jìn)、科學(xué)、合理,使得演練過程對(duì)正常業(yè)務(wù)開展幾乎沒有影響,演練也得以經(jīng)常進(jìn)行。
據(jù)上海市電力公司科技信息部評(píng)價(jià),總體來說,整個(gè)應(yīng)急系統(tǒng)的建設(shè)是成功的。上海市電力數(shù)據(jù)中心應(yīng)急系統(tǒng)實(shí)施后的效果與前期做的總體設(shè)計(jì)及BCP計(jì)劃完全一致,也就是說主中心在出現(xiàn)主機(jī)故障、網(wǎng)絡(luò)故障、甚至火災(zāi)情況下,公司業(yè)務(wù)中斷時(shí)間可以控制在2小時(shí)之內(nèi),可以保證數(shù)據(jù)零丟失,RTO、RPO指標(biāo)完全滿足業(yè)務(wù)連續(xù)性需求,同時(shí)可有效提高一定區(qū)域內(nèi)災(zāi)難(如地理災(zāi)害、電力故障、故意破壞等)的應(yīng)對(duì)能力。
整個(gè)項(xiàng)目的成功實(shí)施充分體現(xiàn)了上海市電力的執(zhí)行能力,EMC公司的方法論和技術(shù)解決方案也經(jīng)受住考驗(yàn)。項(xiàng)目相關(guān)各方通過幾個(gè)月的努力,基于成熟的方法論、先進(jìn)的技術(shù)平臺(tái)、經(jīng)常的演練,對(duì)異外故障作好了充分的準(zhǔn)備,為我國的關(guān)鍵業(yè)務(wù)應(yīng)用樹立了又一個(gè)成功的信息化案例。
用戶資料:
上海市電力公司一直很重視信息化建設(shè),作為華東地區(qū)的電力龍頭企業(yè),上海市電力管轄的上海市電網(wǎng)位于長江三角洲的東南前緣,供電營業(yè)區(qū)覆蓋整個(gè)上海市行政區(qū),到2005年底,全網(wǎng)發(fā)電裝機(jī)容量為1317.53萬千瓦,35-500千伏變電站642座,變電容量6940.72萬千伏安,年發(fā)電量728.45億千瓦時(shí),年售電量704.62億千瓦時(shí)。為適應(yīng)龐大的企業(yè)規(guī)模和迅猛的業(yè)務(wù)發(fā)展,上海市電力陸續(xù)部署了電力營銷管理系統(tǒng)、ERP系統(tǒng),實(shí)現(xiàn)了核心業(yè)務(wù)的信息化。