無論什么級(jí)別的一名員工,從最低級(jí)別的助理到CIO,試圖掩蓋自己的錯(cuò)誤,轉(zhuǎn)嫁到災(zāi)難恢復(fù)計(jì)劃或轉(zhuǎn)嫁到別的什么無辜的員工頭上,就會(huì)造成更大的損害,并損害士氣。而且這種行為會(huì)使你的公司的功能性和財(cái)產(chǎn)的安全性受到威脅。
因此,你的災(zāi)難恢復(fù)計(jì)劃必須盡可能地不受這些人為因素的影響。如果一個(gè)人的錯(cuò)誤引發(fā)了災(zāi)難,但由于這個(gè)人掩蓋了自己的錯(cuò)誤,災(zāi)難恢復(fù)系統(tǒng)不能夠正確發(fā)現(xiàn)造成災(zāi)難的原因,那你的恢復(fù)計(jì)劃就是失敗的。你必須有一個(gè)目標(biāo),可靠性意味著你的災(zāi)難恢復(fù)計(jì)劃必須能夠跟蹤人對(duì)系統(tǒng)的操作,不然你的災(zāi)難恢復(fù)計(jì)劃就是不完善的。
清楚地說明
絕大部分災(zāi)難恢復(fù)計(jì)劃都假設(shè)所有的參與者都有同樣的愿望,強(qiáng)烈地希望盡快把危機(jī)處理掉。這些計(jì)劃的編寫者從來沒有考慮過會(huì)有人對(duì)此有不同的想法,或者甚至做出不道德的行為。讓我們回到文章開始那個(gè)餐館的例子,我敢打賭無論是誰為他們做的災(zāi)難恢復(fù)計(jì)劃,都沒有考慮到服務(wù)生帶來的安全漏洞,以及樓面經(jīng)理的瞎指揮可能帶來的災(zāi)難后果。
因此,在制定災(zāi)難恢復(fù)計(jì)劃的時(shí)候,考慮人的決策和任務(wù)的影響,對(duì)于過程文檔進(jìn)行存檔以供日后分析使用非常重要。而且這些過程文檔需要被保存相當(dāng)長的一段時(shí)間,這樣,某一個(gè)錯(cuò)誤的責(zé)任就不會(huì)被從一個(gè)人被推給另一個(gè)人。
你如何建立目標(biāo),對(duì)于操作過程進(jìn)行可供復(fù)查的跟蹤和記錄?下面的一些方法你可以參考。
- 清晰定義所有的任務(wù)目標(biāo),并為所有的任務(wù)建立文檔機(jī)制。通常在一個(gè)災(zāi)難恢復(fù)計(jì)劃里,一個(gè)任務(wù)僅僅是被簡單地劃分到某個(gè)部門或者某個(gè)經(jīng)理的名下。而在計(jì)劃之中,沒有包含任何對(duì)每一個(gè)恢復(fù)流程的清晰定義,也沒有規(guī)定針對(duì)每一個(gè)任務(wù),應(yīng)該有怎樣的文檔機(jī)制。這些看起來額外的步驟是非常重要的!當(dāng)出現(xiàn)了一個(gè)錯(cuò)誤,你就能夠?qū)栴}進(jìn)行追查,并加強(qiáng)你的計(jì)劃。
- 公布并分發(fā)整個(gè)計(jì)劃給每個(gè)人,無論他是什么級(jí)別的職員。當(dāng)你知道自己的角色是什么,你也知道別人的角色是什么,你就更有可能完成自己所承擔(dān)的任務(wù)。這種公開的做法對(duì)于每個(gè)人非常平等。如果你是CIO,就更要給其他人做好榜樣。如果你不是,完成好自己的任務(wù)。
- 在計(jì)劃里建立起清晰的人員失誤應(yīng)對(duì)計(jì)劃。一個(gè)好的計(jì)劃應(yīng)該是有自我意識(shí)的;它應(yīng)該意識(shí)到自己是有可能失敗的。所以“撤退”(fallback)程序應(yīng)該是系統(tǒng)恢復(fù)計(jì)劃的一部分,以應(yīng)對(duì)系統(tǒng)恢復(fù)出現(xiàn)問題或被拖延的情況。計(jì)劃里,人力決策和需要人完成的任務(wù)也需要清晰地寫在計(jì)劃里。作為恢復(fù)計(jì)劃的一部分,每一個(gè)工作都有可能失敗,如果這種情況出現(xiàn),該如何應(yīng)對(duì)?這就需要有一個(gè)“撤退”計(jì)劃。由于計(jì)劃是公開的,所有的參與者都了解其他人出了差錯(cuò)會(huì)造成什么影響,這就形成了另外一個(gè)推動(dòng)因素。
跟蹤軌跡
捕捉人的行為,并把它們客觀地,以數(shù)字文件的形式,安全地保存起來,這很容易做到。不用擔(dān)心這樣做你會(huì)引發(fā)另一個(gè)層面的存檔問題,或者是沒有合適的工具使用。下面是一些零散的建議。
- 建立你的災(zāi)難日志數(shù)據(jù)庫,并內(nèi)嵌報(bào)告。讓人們匯報(bào)他們的恢復(fù)工作是非常好的一個(gè)辦法,通過電話或者私下接觸的交流是非常重要的,但是還要求所有被完成的任務(wù)都必須毫不含糊地被記錄下來,并進(jìn)行存檔。電子郵件是不夠的。紙質(zhì)的記錄也是不夠的。如果你的災(zāi)難日志是一個(gè)數(shù)據(jù)庫,即便是簡單臨時(shí)的基于SQL的數(shù)據(jù)庫,你都有能力建立起針對(duì)任務(wù)、針對(duì)用戶的機(jī)制(或者兩者兼而有之),并且能夠根據(jù)已經(jīng)完成的工作報(bào)告安排后面應(yīng)該進(jìn)行的恢復(fù)工作。如果員工知道他們的任務(wù)使別的任務(wù)受到影響,只有他們能夠及時(shí)提交報(bào)告完成災(zāi)難日志才能夠保障恢復(fù)的順利進(jìn)行,他們就會(huì)非常努力地工作,并盡可能詳盡地做好記錄和存檔。
- 在企業(yè)網(wǎng)絡(luò)架構(gòu)里,如果混亂僅僅是存在于某個(gè)特定的系統(tǒng)而不是全局,就有可能在某臺(tái)信息服務(wù)器或者一臺(tái)功能比較強(qiáng)大的服務(wù)器上內(nèi)嵌一個(gè)恢復(fù)程序。如果特定的系統(tǒng)出了問題,你的網(wǎng)絡(luò)仍然是正常的,你就可以通過企業(yè)的信息系統(tǒng)來完成恢復(fù)工作,并進(jìn)行報(bào)告。這樣做除了具有上面的那些好處,還能夠大大加快你的恢復(fù)速度。
- 不要僅僅依靠電子郵件,鏈接需要認(rèn)真對(duì)待。如果由于你的網(wǎng)絡(luò)狀況和服務(wù)器的分布情況、人員的分布情況等,使得你的災(zāi)難恢復(fù)計(jì)劃需要在遠(yuǎn)距離控制,電子郵件可能是一種有效的溝通方式。但是,僅僅發(fā)送警告電子郵件是不夠的。承擔(dān)恢復(fù)工作的協(xié)調(diào)人必須收到確認(rèn),但是電子郵件在確認(rèn)某項(xiàng)工作的完成狀況方面,有些力不從心。不過,電子郵件里內(nèi)置的鏈接將能夠引導(dǎo)用戶訪問你的信息服務(wù)器。不過這樣的訪問接入應(yīng)該是針對(duì)特定任務(wù),特定用戶的,并且應(yīng)該被詳細(xì)記錄。