EMC公司大中國區(qū)產(chǎn)品銷售及技術(shù)總監(jiān)杜國強(qiáng)先生在會上發(fā)表了《全面的信息基礎(chǔ)架構(gòu)》的主題演講,以下是演講內(nèi)容全文。
EMC公司大中國區(qū)產(chǎn)品銷售及技術(shù)總監(jiān)杜國強(qiáng)先生
我今天想跟各位匯報全面的信息基礎(chǔ)架構(gòu),除了跟各位匯報一些發(fā)展的趨勢和新的技術(shù)之外,我會探討一個特殊的課題??綠色。從十一五的重要規(guī)劃,建設(shè)資源節(jié)約型社會,希望在“十一五”相對“十五”單位能耗GDP相對降低20%。
談到信息存儲,大家會想到硬盤,平均一個硬盤消耗22瓦,一個服務(wù)器3個硬盤消耗66瓦,目前一個存儲系統(tǒng)里面可能有上千個硬盤。前幾天我看到一個報告,美國一些大型的數(shù)據(jù)中心一年的耗電量是2萬千瓦,大概是普通老百姓25000戶一年的耗電量。
今天我在與各位探討信息基礎(chǔ)架構(gòu)。在各種技術(shù)、各種IT技術(shù)以外,各位可以探討,國家大的戰(zhàn)略規(guī)劃、全球能源資源短缺、從國家的戰(zhàn)略如何看待信息存儲或信息架構(gòu)。我們除了提升價值降低成本以外,可能也要開始從能耗角度考慮問題。我今天會在不同地方跟各位提到這個事情。
這有一個簡單的圖,從分散的存儲架構(gòu)、IT架構(gòu),或者到整合的IT信息架構(gòu),這樣的轉(zhuǎn)變可以只花1塊做到,也可以花好幾千萬。全球有一個大企業(yè),花了540億美金來完成這樣一個步驟,從分散的架構(gòu)到以信息為核心的架構(gòu),企業(yè)總裁是喬治?布什。
為什么發(fā)生這事情,2001年的9.11事件,兩個恐怖分子以學(xué)生身份進(jìn)來的,這表示外交部、教育部、發(fā)簽證的大使館,美國CIA,很多信息沒有交流,9.11以后美國安全部用540億美金完成信息基礎(chǔ)架構(gòu)的整合。一個企業(yè)可能花1塊、1百萬、1千萬完成這樣的架構(gòu),這樣的架構(gòu)如何考慮,這是我今天跟各位探討的。
在這之前探討什么叫信息架構(gòu),去年最熱的話題就是《達(dá)?芬奇密碼》,有一個密碼叫羅丹密碼,羅丹在1882年想到信息架構(gòu)如何來做,這張圖《思想者》,企業(yè)的信息、CIO、CFO等,也就是企業(yè)的領(lǐng)導(dǎo)想如何在明天為企業(yè)帶來更大的利潤。
他坐在企業(yè)雜亂無章的數(shù)據(jù)中說,信息基礎(chǔ)架構(gòu)就是在最快的時間把這些雜亂無章的數(shù)據(jù)提升成信息,進(jìn)而在最快的時間把信息提升成為知識,用最快的時間變成知識。各位坐過飛機(jī),服務(wù)員就是以最快時間給你需要的東西,比如我需要可樂,不是在最快時間給你雪碧而是給你可樂?,F(xiàn)在就是要把企業(yè)的數(shù)據(jù)在最快時間變成智慧,這家企業(yè)知道的客戶行為,競爭對手不知道。
從這么多年信息的發(fā)展,存儲的發(fā)展,從以前簡單的SAN到NAS到網(wǎng)絡(luò)連接,各種不同的技術(shù)都出來了,在這樣的技術(shù)出來之后,這樣的發(fā)展到底會發(fā)展到哪里去?
首先簡單的是數(shù)據(jù)的復(fù)制、數(shù)據(jù)的克隆,到目前很熟悉的話題CDP,各位也很清楚,在做數(shù)據(jù)復(fù)制、數(shù)據(jù)傳輸是通過TCP/IP這條路,網(wǎng)絡(luò)存儲出來以后,數(shù)據(jù)存儲通過網(wǎng)絡(luò)存儲,這速度4GB獨(dú)享和10GB分享,這速度的差距多大。
全球最大的信用卡公司,每十分鐘可以把交易數(shù)據(jù)做交易倉庫做欺詐偵測系統(tǒng),如果各位用那家信用卡公司的信用卡,理論上只有10分鐘作案的機(jī)會,因?yàn)?0分鐘就會偵測到你使用的假信用卡。這技術(shù)是五年前十年前基于網(wǎng)絡(luò)的存儲傳輸?shù)轿涣?,現(xiàn)在發(fā)現(xiàn)越來越重要。
因?yàn)锳銀行比B銀行能夠提早一天,知道客戶行為我就立于不敗之地。必須在最短時間把數(shù)據(jù)變成信息再變成智慧,數(shù)據(jù)通過網(wǎng)絡(luò)是做不到,必須通過光纖。
備份大家都很清楚,現(xiàn)在有越來越多的技術(shù),其中有一個技術(shù)data de-duplicantion(重復(fù)數(shù)據(jù)刪除),我們做數(shù)據(jù)備份是通過光纖打到磁帶庫,但是有一個很重要的問題,備份有很多時候數(shù)據(jù)是重復(fù)的,可能有10GB要備份,現(xiàn)在在備份之前要把重復(fù)的數(shù)據(jù)單一化,這樣做備份的時候從10GB變成1GB。
依此類推我有數(shù)據(jù)從北京復(fù)制到上海,從北京復(fù)制到美國,有沒有辦法做一個簡單的技術(shù),把一些重復(fù)的技術(shù),先單一化刪除再做傳輸,這樣從速度、成本、寬帶、很多方面有非常好的節(jié)省。
有一個很重要的技術(shù),提到備份就是歸檔,我們常常把備份跟歸檔分開,當(dāng)你把備份和歸檔一并考慮的時候,帶來的效果是1+1大于3,因?yàn)橄茸鰵w檔,把80%頻繁數(shù)據(jù)先歸檔到二級存儲,你只剩下20%的數(shù)據(jù)做備份,或者只剩下20%數(shù)據(jù)做交易處理,對你整個的成本和投資降低非常大,所以備份恢復(fù)和歸檔要一并考量,雖然大家都知道,但是沒有考慮重視備份目的是為了什么?
備份就是為了恢復(fù),你備份做得很好,你敢不敢保證恢復(fù)做得很好,恢復(fù)是備份的目的,備份只是一個手段,恢復(fù)是業(yè)務(wù)的要求。
恢復(fù)的要求在信息生命周期管理中非常重要的。各位很清楚,ILM在2003年大家都在談,老百姓都知道什么ILM了,叫信息生命周期管理。這個戰(zhàn)略和思路,從全球到國內(nèi),很多企業(yè)都已經(jīng)接受而且已經(jīng)實(shí)施這樣一個思路和解決方案,根據(jù)你數(shù)據(jù)的重要性,業(yè)務(wù)的重要性選擇它的恢復(fù)時間和恢復(fù)手段,這種解決方案和產(chǎn)品已經(jīng)非常到位了。
備份、恢復(fù)和歸檔不要說已經(jīng)很清楚了,因?yàn)檫@些最根本的東西還是要做好。
剛才提到ILM,2003年炒得很熱,2005、2006年還是很熱,2007繼續(xù)在談。分級存儲很簡單,但是帶來的效果是IT界非常認(rèn)可的幾個概念,甚至一個解決方案。
ILM可否拯救地球?因?yàn)槲疫x擇不同的硬盤技術(shù),選擇不同的響應(yīng)時間的硬盤,把一些不重要的數(shù)據(jù)遷移到性能比較慢的硬盤,性能比較慢的硬盤、轉(zhuǎn)速比較慢的硬盤,這樣相對能耗比較低,進(jìn)而可以發(fā)現(xiàn)ILM在降低能耗,幫助拯救地球有很多的功能,所以ILM并不簡單解決IT,提升信息價值,降低成本,其實(shí)在能源環(huán)保上面還是有它的功效,大家可能沒考慮但的確有它的效果。
這兩條線就是從北京拉到上海,從北京拉到美國,這條線技術(shù)基本到位,很久已經(jīng)有了,現(xiàn)在要求三點(diǎn)互為備份,這個技術(shù)非常多了。
這就是信息基礎(chǔ)架構(gòu),這個架構(gòu)十年前就是這樣子,五年前也是這個樣子,今天還是這個樣子,只是很多技術(shù)都到位了,它根據(jù)你成本的要求,根據(jù)你應(yīng)用要求,根據(jù)數(shù)據(jù)的重要性,信息生命周期管理的樣子。你可以花1塊錢投資,也可能像美國政府花540億美金投資。
這樣架構(gòu)是系統(tǒng)七個層面其中兩層,它跟操作系統(tǒng)、數(shù)據(jù)庫、應(yīng)用等沒關(guān)系的,這樣的架構(gòu)有最高的平滑度,不用擔(dān)心上面運(yùn)行什么平臺,因?yàn)檫@個架構(gòu)都可以支持。
在這樣的架構(gòu)里存儲扮演什么角色,從EMC的角度來講,這非常重要,從簡單的數(shù)據(jù)保護(hù),因?yàn)閿?shù)據(jù)保護(hù)能夠讓應(yīng)用在恢復(fù)和重新啟動應(yīng)用時候做無縫的連接,讓應(yīng)用可以重新運(yùn)行。更重要的概念是我有很多在存儲上面一致性的技術(shù),這些技術(shù)非常多,可以保證我的應(yīng)用跟存儲的數(shù)據(jù)可以無縫的結(jié)合。
這樣的架構(gòu)幫助應(yīng)用運(yùn)行,進(jìn)一步提升能源部署,保證業(yè)務(wù)的連續(xù)性,很多自動化技術(shù)在流程恢復(fù)上更加快速,這種架構(gòu)就是常提到業(yè)務(wù)的連續(xù)性,考慮數(shù)據(jù)的保護(hù),考慮數(shù)據(jù)的回復(fù),跟考慮業(yè)務(wù)流程的恢復(fù)。如果對EMC有興趣,EMC很多存儲產(chǎn)品。
EMC提供這么多的產(chǎn)品和硬件環(huán)境,探討三點(diǎn),大家都在探討虛擬化,有SAN虛擬化、有文件虛擬化,大家都說基于SAN虛擬化做好夠不夠?不夠,還要針對NAS,還要針對服務(wù)器做虛擬化。
一個大型的信息中心一年能耗消耗大概2萬千瓦,根據(jù)高盛分析有70%是服務(wù)器。服務(wù)器越來越多,刀片式服務(wù)器越來越多,EMC有一個產(chǎn)品可以把所有基于I/O架構(gòu)服務(wù)器虛擬化,能夠做到30:1,有3千套服務(wù)器,能夠把3千套變成1百套,把3千個硬盒子變成1百個,從能耗管理、空間成本的角度看做的非常顯著,而且非常必要,對國家是非常有效果。
高盛講一個概念很重要,如果每個大的信息中心每年消耗2萬千瓦,全美國友商千個,上萬個這樣信息中心,每年消耗的能源占美國的GDP?大家不要忘了我們家的水龍頭在滴水個人感覺不出來,但是對于社區(qū)和自來水公司影響巨大的,所以能耗必須要考慮。
提供全面式信息架構(gòu),不是很多IT的先進(jìn)技術(shù),先進(jìn)的技術(shù)還是會在開發(fā),先進(jìn)的解決方案會出來,今天探討的是從國家的戰(zhàn)略,能耗的戰(zhàn)略,管理的戰(zhàn)略和成本戰(zhàn)略要做思考。
現(xiàn)在這么復(fù)雜的IT架構(gòu)怎么管理,EMC資源管理的技術(shù)很先進(jìn),80年代有一個重要的計劃叫衛(wèi)星收集的計劃,這計劃請三個MIT帶領(lǐng)100個工程人員設(shè)計一個管理平臺,怎么管理全球80多顆衛(wèi)星,這計劃失敗了,我們把這100個開發(fā)人員納進(jìn)來,我們推出一個資源管理的平臺,這資源管理衛(wèi)星。
前一陣子地震把海底光纜震碎了,我可以派船和專人修理,計算中心光纜、網(wǎng)絡(luò)斷了可以下去修,馬路可以挖。但是太空上面的衛(wèi)星有沒有辦法動不動就飛到太空去修理,不可能的。
EMC資源管理的設(shè)計思路是一個先進(jìn)的思路,能夠管理你沒有辦法到達(dá)的環(huán)境來管理,資源管理是智能化的管理,能夠管理存儲平臺、操作系統(tǒng)、服務(wù)器、應(yīng)用、軟件等等。在信息架構(gòu)里面智慧型資源管理非常重要的。
另外很重要的是信息安全,各位都提到信息安全跟保護(hù),EMC提一個概念,以前考慮防病毒、防火墻,這些都是防外賊,有沒有辦法防家賊。再怎么防外面很容易防,防家賊很難防的,EMC信息安全戰(zhàn)略,除了提供防外面還提供防內(nèi)部,當(dāng)小偷跑到家以后,有沒有辦法保護(hù)數(shù)據(jù)和信息。
現(xiàn)在所采購各種安全軟件都是在保護(hù)你的平臺,比如掃描病毒軟件是保護(hù)你筆記本,防火墻是防外,有沒有一個防你的業(yè)務(wù)和防公司的應(yīng)用,實(shí)際上沒有。
EMC會在信息安全方面加大力度提供更多的信息安全機(jī)制來做保護(hù),我們有一個產(chǎn)品非常簡單,各位看過湯姆克魯斯的《不可能的任務(wù)》看完一個錄像會自動5秒銷毀,我們今天已經(jīng)有這樣一個產(chǎn)品,我們這個產(chǎn)品可以在文檔、文件,可能一個PPT,我們加密,你看完以后這PPT可以設(shè)定5分鐘5秒就看不到了,這些產(chǎn)品EMC都有。
所以信息安全不是我們討論傳統(tǒng)的保護(hù)筆記本,保護(hù)你的產(chǎn)品,而是保護(hù)你的業(yè)務(wù)。這是我們討論故宮的概念,故宮真正打進(jìn)去是李自成,但是根據(jù)統(tǒng)計有15個皇帝,差一點(diǎn)被貝勒爺、宮女刺殺。
所以EMC相信所謂信息基礎(chǔ)架構(gòu)不是以應(yīng)用和平臺為核心,而是以信息為核心。因?yàn)榭梢苑从晨蛻舻氖悄愕臄?shù)據(jù)和信息,不是那臺服務(wù)器,也不是TCP/IP,也不是數(shù)據(jù)庫,是以信息為核心的架構(gòu)。
這樣的架構(gòu)從客戶到企業(yè)的優(yōu)勢,到流程、應(yīng)用、架構(gòu),在基礎(chǔ)架構(gòu)投資1塊錢,對客戶可能帶來上千倍、上萬倍的回收。如果信息基礎(chǔ)架構(gòu)做得不好,想通過業(yè)務(wù)流程要花1百倍甚至更多的精力。
各位都看到電影《指環(huán)王》,上面講過很多事情你不希望它發(fā)生,但是你唯一能做的就是在有限時間內(nèi)把該做的事情做完,這就是我今天的匯報,謝謝!