人們漸漸回歸理想,更加清晰地看清楚云計(jì)算的真面目??梢哉f(shuō),無(wú)論多么高遠(yuǎn)的夢(mèng)想還是要找到穩(wěn)固的立足點(diǎn),云服務(wù)最終還是要從一個(gè)數(shù)據(jù)中心被傳輸?shù)搅硗庖粋€(gè)數(shù)據(jù)中心,在這個(gè)過(guò)程仍然擺脫不了需要人、計(jì)算機(jī)、網(wǎng)絡(luò)、電能、存儲(chǔ)等之間協(xié)同工作。這樣一來(lái),整個(gè)過(guò)程出現(xiàn)錯(cuò)誤和漏洞就在所難免,再加上天災(zāi)人禍。所以,啟用云服務(wù)你必須有一定的思想準(zhǔn)備,同時(shí)要有第二手的解決方案來(lái)應(yīng)對(duì)。
編者在這里回顧一下近年來(lái)發(fā)生的一系列斷網(wǎng)事件背后的原因。從2009年-2012年之間。也許能讓你看到:即便是計(jì)算機(jī)出錯(cuò)似乎在所難免,再保險(xiǎn)的措施似乎也只能把安全事件控制在一個(gè)小概率范圍內(nèi)。
斷網(wǎng)類(lèi)型一:系統(tǒng)故障
典型事件1:亞馬遜AWS平安夜斷網(wǎng)
故障原因:彈性負(fù)載均衡服務(wù)故障
2012年12月24日,剛剛過(guò)去的圣誕節(jié)平安夜,亞馬遜并沒(méi)有讓他們的客戶過(guò)得太平安。亞馬遜AWS位于美國(guó)東部1區(qū)的數(shù)據(jù)中心發(fā)生故障,其彈性負(fù)載均衡服務(wù)(Elastic Load Balancing Service)中斷,導(dǎo)致Netflix和Heroku等網(wǎng)站受到影響。其中,Heroku在之前的AWS美國(guó)東部區(qū)域服務(wù)故障中也受到過(guò)影響。不過(guò),有些巧合的事情是Netflix的競(jìng)爭(zhēng)對(duì)手,亞馬遜自己的業(yè)務(wù)Amazon Prime Instant Video并未因?yàn)檫@個(gè)故障而受到影響。
12月24日,亞馬遜AWS中斷服務(wù)事件不是第一次,當(dāng)然也絕非最后一次。
2012年10月22日,亞馬遜位于北維吉尼亞的網(wǎng)絡(luò)服務(wù)AWS也中斷過(guò)一次。其原因與上次相似。事故影響了包括Reddit、Pinterest等知名大網(wǎng)站。中斷影響了彈性魔豆服務(wù),其后是彈性魔豆服務(wù)的控制臺(tái),關(guān)系數(shù)據(jù)庫(kù)服務(wù),彈性緩存,彈性計(jì)算云EC2,以及云搜索。這次事故讓很多人認(rèn)為,亞馬遜是應(yīng)該升級(jí)其北維尼吉亞數(shù)據(jù)中心的基礎(chǔ)設(shè)施了。
2011年4月22日,亞馬遜云數(shù)據(jù)中心服務(wù)器大面積宕機(jī),這一事件被認(rèn)為是亞馬遜史上最為嚴(yán)重的云計(jì)算安全事件。由于亞馬遜在北弗吉尼亞州的云計(jì)算中心宕機(jī),包括回答服務(wù)Quora、新聞服務(wù)Reddit、Hootsuite和位置跟蹤服務(wù)FourSquare在內(nèi)的一些網(wǎng)站受到了影響。亞馬遜官方報(bào)告中聲稱(chēng),此次事件是由于其EC2系統(tǒng)設(shè)計(jì)存在漏洞和設(shè)計(jì)缺陷,并且在不斷修復(fù)這些已知的漏洞和缺陷來(lái)提高EC2(亞馬遜ElasticComputeCloud服務(wù))的競(jìng)爭(zhēng)力。
2010年1月,幾乎6萬(wàn)8千名的Salesforce.com用戶經(jīng)歷了至少1個(gè)小時(shí)的宕機(jī)。Salesforce.com由于自身數(shù)據(jù)中心的"系統(tǒng)性錯(cuò)誤",包括備份在內(nèi)的全部服務(wù)發(fā)生了短暫癱瘓的情況。這也露出了Salesforce.com不愿公開(kāi)的鎖定策略:旗下的PaaS平臺(tái)、Force.com不能在Salesforce.com之外使用。所以一旦Salesforce.com出現(xiàn)問(wèn)題,F(xiàn)orce.com同樣會(huì)出現(xiàn)問(wèn)題。所以服務(wù)發(fā)生較長(zhǎng)時(shí)間中斷,問(wèn)題將變得很棘手。