CSF2012: 英特爾中國(guó)有限公司存儲(chǔ)產(chǎn)品市場(chǎng)經(jīng)理亢海峰

當(dāng)前我們所面臨的數(shù)據(jù)和信息是變化的,數(shù)據(jù)生命周期已經(jīng)完全改變了。那么在傳統(tǒng)的數(shù)據(jù)中心方面,大家面臨什么樣的問題,如何應(yīng)對(duì)和解決?在未來的云的數(shù)據(jù)中心方面,會(huì)面臨什么樣的問題,大家又如何來解決?

在做存儲(chǔ)行業(yè)趨勢(shì)分析時(shí),亢海峰指出,“來自IDC的數(shù)據(jù)顯示,未來幾年間數(shù)據(jù)量從2011年的1.8 ZB,在2015年會(huì)增長(zhǎng)為35個(gè)ZB。十年前,大家還在使用3.5英寸的盤,5.5英寸的盤,后來有了光盤和DVD,不同的介質(zhì),存儲(chǔ)的數(shù)據(jù)越來越多。

那么這些數(shù)據(jù)來源于什么?來源于個(gè)人和企業(yè)用戶不斷的膨脹的存儲(chǔ)需求?,F(xiàn)在隨便一個(gè)手機(jī)就差不多八百萬象素?cái)z像頭,意味著什么?大家每拍一張照片, 就會(huì)上傳到網(wǎng)上,與朋友以不同形式的分享,類似這些數(shù)據(jù)不斷累計(jì)就形成了當(dāng)今爆炸性的數(shù)據(jù)時(shí)代。有越來越多的數(shù)據(jù)中90%是非結(jié)構(gòu)化的(主要是圖片和視頻 為主)。

來自IDC的報(bào)告顯示,從2010年到2016年四種類型數(shù)據(jù)的增長(zhǎng)情況來看,首先傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù),也既是說數(shù)據(jù)中心里面常見的數(shù)據(jù)庫,運(yùn)行核心的業(yè)務(wù),核心的交易。那么,這一類稱之為傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)

其次是傳統(tǒng)的非結(jié)構(gòu)化數(shù)據(jù),也就是企業(yè)里面有共享的文件和文檔,大家需要文件服務(wù)器,可以在一個(gè)系統(tǒng)里面共同分享知識(shí)。

再次,在數(shù)據(jù)備份方面,業(yè)務(wù)的數(shù)據(jù)量越來越大了,備份也增長(zhǎng)很快。很多數(shù)據(jù)是大家由于長(zhǎng)期歸檔的訴求所存在的。

最后就是共有云的數(shù)據(jù)。那么對(duì)于這種不同類型的四種數(shù)據(jù)哪一個(gè)增長(zhǎng)最快,肯定是公有云,也是大的數(shù)據(jù)領(lǐng)域的范疇。存儲(chǔ)的目的是為了滿足以上不同類型數(shù)據(jù)的存儲(chǔ)需求。

重新定義的數(shù)據(jù)生命周期

什 么叫做重新定義的數(shù)據(jù)生命周期?以前大家探討的是什么?信息生命周期. “說你有一個(gè)信息,它產(chǎn)生出來,你創(chuàng)建了這個(gè)信息,過一段時(shí)間,達(dá)到了一個(gè)價(jià)值的高峰,大家對(duì)這個(gè)信息訪問都很頻繁,都喜歡這個(gè)信息。然后過了一段時(shí)間, 這個(gè)信息過時(shí)用不到了,就把數(shù)據(jù)刪除,這是傳統(tǒng)的生命周期,從出生,到高潮,到低谷,到刪除。” 亢海峰說道。

而現(xiàn)在的數(shù)據(jù),隨著數(shù)據(jù)的累積,隨著時(shí)間的推移,相應(yīng)的數(shù)據(jù)越來越多得到的信息就越來越多。新一輪數(shù)據(jù)量的積累之后就獲得新的數(shù)據(jù)價(jià)值,稱之為價(jià)值的排浪,它會(huì)呈排浪的形式逐漸從數(shù)據(jù)中挖掘出信息,這一切取決于取決于大家對(duì)于信息的理解和積累。

對(duì)于存儲(chǔ)來講怎么劃分這種周期?“最下面的存儲(chǔ)介質(zhì)大家基本上放在磁帶上需要長(zhǎng)期的歸檔.或者放在磁盤庫上,或者是大容量的,低成本的介質(zhì)上.對(duì)性能又一定需要的數(shù)據(jù)就用高速的磁盤,性能要求再高的用閃存盤,SSD等等的數(shù)據(jù)。

可 見,數(shù)據(jù)的生命周期已經(jīng)截然的改變了。今天對(duì)于數(shù)據(jù)的劃分是邏輯的劃分。第一,大量的不常訪問的數(shù)據(jù),通過磁盤的介質(zhì)進(jìn)行長(zhǎng)期的歸檔。第二,這一層的數(shù)據(jù) 一定要滿足不斷的增長(zhǎng),因?yàn)闆]有時(shí)間去刪除,更何況是要挖掘出來大家以前沒有的,看不到的價(jià)值。第三以后要查詢數(shù)據(jù)時(shí)就要快速讀取,能不能把長(zhǎng)期存起來的 數(shù)據(jù)迅速找到,拿到一個(gè)快速的數(shù)據(jù)層,使得實(shí)現(xiàn)數(shù)據(jù)挖掘的價(jià)值,從數(shù)據(jù)變成信息,從信息變成決策,影響未來的發(fā)展。

可見,存儲(chǔ)所面臨的問題和挑戰(zhàn),首先是數(shù)據(jù)太多,其次難以管理。第三是運(yùn)營(yíng)支出。最后是資源鎖定利用率不高等。

在 傳統(tǒng)的數(shù)據(jù)中心,大家看到了交易型的數(shù)據(jù)庫,如何來解決這樣的問題,通過網(wǎng)絡(luò)連到了一個(gè)存儲(chǔ),然后為了保證這個(gè)存儲(chǔ)的可用性,把數(shù)據(jù)備份,而后多數(shù)據(jù)中心 做實(shí)時(shí)容災(zāi),這是非常經(jīng)典的存儲(chǔ)架構(gòu)。,但是對(duì)于數(shù)據(jù)的存儲(chǔ)方面,目前主流的四個(gè)需求已經(jīng)呈現(xiàn)出來,第一個(gè)是重復(fù)數(shù)據(jù)刪除:比如每天大家生活中最常見的發(fā) 郵件,大家會(huì)抄送給很多人,我們的郵件服務(wù)器上會(huì)有很多重復(fù)的郵件副本,這些數(shù)據(jù)也會(huì)占用大量空間 第二:實(shí)時(shí)的壓縮:剛剛說兩個(gè)數(shù)據(jù)中心以前產(chǎn)生一百兆的數(shù)據(jù),通過千兆和萬兆傳出去,沒有問題,如果你有5個(gè)TB的,你通過網(wǎng)上傳輸,還不如拿著硬盤坐飛 機(jī)過去來得快,因?yàn)槭苤朴诰W(wǎng)絡(luò)帶寬??刹豢梢园褦?shù)據(jù)進(jìn)行壓縮后再傳過去,這也是一個(gè)解決的方式。

第三個(gè)是分層存儲(chǔ),大家談到了在一個(gè)存儲(chǔ)里面,這個(gè)數(shù)據(jù)是不是說一開始并不是熱點(diǎn)的數(shù)據(jù),后來的由于某種需求變熱,而后變冷,存儲(chǔ)的介質(zhì)要求一定是不一樣的,如何按照需求來移動(dòng)冷熱數(shù)據(jù)到對(duì)應(yīng)的存儲(chǔ)層上這也是一個(gè)存儲(chǔ)的需求。,

第四: 是自動(dòng)精簡(jiǎn)配置也將是存儲(chǔ)的需求之一。

所 有這些存儲(chǔ)功能,都需要計(jì)算的能力,要想知道什么是重復(fù)的數(shù)據(jù),必須先要計(jì)算哪些塊是一樣的,你要想刪除的話,就要進(jìn)行大量的重復(fù)數(shù)據(jù)刪除,也要進(jìn)行計(jì) 算,分層的存儲(chǔ)也要知道哪一些數(shù)據(jù)塊熱,什么時(shí)候熱,怎么樣遷移到對(duì)應(yīng)的層次上,這些都需要用計(jì)算來感知。,現(xiàn)在的存儲(chǔ)完全和以前不一樣了不僅僅是一個(gè)倉 庫需要更為智能,更為精細(xì)的管理員,需要管理的流程和方式,這都是需要運(yùn)用計(jì)算來實(shí)現(xiàn)的。

通過計(jì)算來實(shí)現(xiàn)的存儲(chǔ)看到可以達(dá)到什么樣的目的,數(shù)據(jù)壓縮可以節(jié)省80%的空間。數(shù)據(jù)重復(fù)刪除的備份量可以減少95%,數(shù)據(jù)的精簡(jiǎn)配置大家可以釋放40-60%的空間。通過計(jì)算能力的增強(qiáng),將大幅度提升存儲(chǔ)的有效性。

所以對(duì)于傳統(tǒng)的數(shù)據(jù)中心而言,不斷豐富存儲(chǔ)的功能是大家解決很多問題的行之有效的方法,而這些方法基于存儲(chǔ)的計(jì)算的能力,基于CPU所提供的智能化的管理和存儲(chǔ)的能力。

那 么,未來的數(shù)據(jù)中心如何,在未來的數(shù)據(jù)中心里面大家看到其實(shí)有不同的數(shù)據(jù),有一部分是實(shí)施業(yè)務(wù)的數(shù)據(jù)庫在運(yùn)行,還有一部分是長(zhǎng)期歸檔的海量數(shù)據(jù)。“舉一個(gè) 簡(jiǎn)單的例子,國(guó)外的某一個(gè)數(shù)據(jù)中心,或者國(guó)內(nèi)的大網(wǎng)站,運(yùn)營(yíng)商,你走到他的數(shù)據(jù)中心里面,分不清哪些是存儲(chǔ),哪些是服務(wù)器,全部是標(biāo)準(zhǔn)的機(jī)架服務(wù)器,甚至 是密度更高的服務(wù)器,壞了怎么辦,換下來,拿走。換新的。整個(gè)的存儲(chǔ)服務(wù)都是靠軟件+標(biāo)準(zhǔn)化的硬件來提供服務(wù)的。”

這些服務(wù)器集群擁有超 大的容量,大家可以看到達(dá)到百P甚至是上到EB的級(jí)別,所以在大數(shù)據(jù)的領(lǐng)域橫向擴(kuò)展的存儲(chǔ),也是未來的一個(gè)發(fā)展方向。過去大家都說存儲(chǔ)是存儲(chǔ),服務(wù)器是服 務(wù)器。到了今天希望通過融合的架構(gòu),標(biāo)準(zhǔn)的架構(gòu),既可以做存儲(chǔ),又可以做服務(wù)器,唯一的區(qū)別是應(yīng)用模式場(chǎng)景不同,大家采用的配置不同。對(duì)于性能需求大的, 配置更高CPU更大的緩存,對(duì)于存儲(chǔ)需求較大的配置更大的硬盤等。

最終的目的,對(duì)各種應(yīng)用模式和場(chǎng)景提供經(jīng)濟(jì)的高效的擴(kuò)展平臺(tái)。

如果大家采用更多的計(jì)算能力,大家完全可以用智能化的存儲(chǔ),減少四十到五十的存儲(chǔ)空間,采用重復(fù)的數(shù)據(jù)刪除可以節(jié)省95%的備份數(shù)據(jù)。

目 前英特爾不僅擁有存儲(chǔ)、網(wǎng)絡(luò)、計(jì)算、也擁有大數(shù)據(jù)分析,管理,安全等相應(yīng)的解決方案、涵蓋了大家在整個(gè)行業(yè)里面的方方面面。但是,因特爾的角色是跟大家一 起來共建這個(gè)生態(tài)環(huán)境,和前端有硬件廠商,存儲(chǔ)廠商,軟件服務(wù)器,行業(yè)方案解決提供商,一起攜手將最好的,最優(yōu)勢(shì)的方案提供給客戶。這才最終是我們的價(jià)值 所在。

分享到

huanghui

相關(guān)推薦