以下內(nèi)容根據(jù)速記整理,未經(jīng)本人審定。
聽眾朋友大家好,我今天講的題目是“存儲技術(shù)發(fā)展的驅(qū)動力及生態(tài)系統(tǒng)”。
數(shù)字化的哲學(xué)奠基與科學(xué)奠基
首先我們從峰會的兩個關(guān)鍵詞講起,一個是數(shù)據(jù),一個是存儲。講到數(shù)據(jù)我們首先看到6000年前伏羲提出了八卦圖,一長橫代表一,兩短橫代表零,所以上面一一就是代表天,下面零零代表地,這就是數(shù)字化的思想原點。
老子說“一生二,二生三,三生萬物。”這就實際上表達(dá)了數(shù)字可以表達(dá)萬物的思想。在2500年前的希臘數(shù)學(xué)家、哲學(xué)家畢達(dá)哥拉斯說“萬物皆數(shù)”,也就是說宇宙的一切規(guī)律皆可以由數(shù)來表達(dá),大家記住這個結(jié)論,就是萬物皆數(shù),這就是數(shù)字化的哲學(xué)奠基。
2000多年過去了,我們的信息表達(dá)都還不是數(shù)字化,比如文字、聲音、電影、照相、電視、攝像這都不是數(shù)字化,我們還要等待幾位偉人的到來,這就是奠定了我們數(shù)字化科學(xué)基礎(chǔ)的四位大師,一個是萊布尼茨的二進(jìn)制,一個是喬治·布爾的布爾代數(shù),再就是香農(nóng)的信息論還有開關(guān)電路理論以及圖靈的圖靈機(jī)。
這個圖靈機(jī)是一個理論能力極強(qiáng)的智能模型,他本來是為回答一個希爾伯特的世紀(jì)之問而提出的,希爾伯特在1900年世界數(shù)學(xué)家大會上提了一個問題,他說:“存不存在解決所有數(shù)學(xué)問題的一般算法?”,1936年圖靈發(fā)表了劃時代的論文,構(gòu)建了一個圖靈機(jī),就是一個無限長的帶子在一個紙簍上對帶子進(jìn)行讀和寫,在有限的規(guī)則上把零變成一,一變成零,這個圖靈機(jī)就代表著一種智能自動化的實現(xiàn)手段就是計算,就是在有限的規(guī)則下對數(shù)據(jù)進(jìn)行序列變換,就是這個可以解決一切數(shù)學(xué)問題,所以這個能力非常強(qiáng)大。
圖靈機(jī)實際上分為三個部分,第一個就是處理部分——對讀寫頭進(jìn)行控制,第二就是存儲部分就是那個無限長的帶子,第三個就是傳出部分是帶子的移動,這個模型實際上能力特別強(qiáng)大,已經(jīng)超出圖靈的想象,圖靈說“他可以解決一切數(shù)學(xué)問題!”但是實際上他是可以解決更多的問題。
元胞自動機(jī)領(lǐng)域的一位大師Stephen Wolfram寫了一本書叫《一種新科學(xué)》,里面說“300年來,科學(xué)建立在數(shù)學(xué)的基礎(chǔ)上,而今后的科學(xué)將建立在計算機(jī)程序的基礎(chǔ)上,計算機(jī)程序也就是計算,可以表達(dá)宇宙的一切規(guī)律!”
他構(gòu)造了這樣一個元胞自動機(jī),簡單的規(guī)則可以產(chǎn)生復(fù)雜的現(xiàn)象,而且我們可以從這個上理解我們的DNA上有人的這個簡單規(guī)則,但是按照順序生長下去,他就會把一個受精卵逐漸變成一個完整的人,而且從年輕到老去都可以用計算機(jī)模擬出來,這就是我們的數(shù)字生命。
其結(jié)論是計算程序也就是計算可以表達(dá)世間的一切規(guī)律!所以Wolfram是從元胞自動機(jī)得出了這個結(jié)論,但他的同事證明“元胞自動機(jī)和圖靈機(jī)是等效的!”所以圖靈機(jī)的理論能力極強(qiáng)叫表達(dá)世間一切規(guī)律!這個科學(xué)得到的結(jié)論和哲學(xué)得到的是一樣的,就是萬物皆數(shù)!宇宙的一切規(guī)律皆可以有數(shù)來表達(dá),這就是科學(xué)給數(shù)字化定下的一個遙遠(yuǎn)的終點,我們現(xiàn)在還在路上。
數(shù)字時代開始,我們目前才走了四步
從圖靈機(jī)開始,數(shù)字時代真正開始,我們目前才走了四步,而其重點是可以表達(dá)宇宙的一切規(guī)律,那還遠(yuǎn)的很,所以存儲的第一個驅(qū)動力就是數(shù)字化進(jìn)程步伐的加快,那么數(shù)字化1.0我稱其為多媒體驅(qū)動的,就是我們敲命令行到可以表達(dá)圖像、圖片、視頻就是信息形式多媒體化;
數(shù)字化2.0是互聯(lián)網(wǎng)推動的,那么有無線和有線互聯(lián)網(wǎng),我們把社交這種關(guān)系通過網(wǎng)絡(luò)數(shù)字化我們就有微信,我們把商品交易通過網(wǎng)絡(luò)數(shù)字化就有了淘寶,這樣信息大量流動產(chǎn)生大量的數(shù)據(jù),這是第二個數(shù)據(jù)爆發(fā)點;
數(shù)字化3.0是由是由物聯(lián)網(wǎng)推動的,他的特征是由人產(chǎn)生數(shù)據(jù)到物產(chǎn)生數(shù)據(jù),那物比人多得多是不是,這樣數(shù)據(jù)量又會大爆發(fā),這是第三個爆發(fā)點;
數(shù)字化4.0就是現(xiàn)在特別熱的元宇宙,元宇宙推動數(shù)字化更進(jìn)一步向前發(fā)展,它的特征是我們信息空間本來只有物理空間一直過去,比如我們拍張照片,拍張視頻這是物理空間變成了數(shù)據(jù),然后把它映射到信息空間,但元宇宙很多東西都是世界不存在,由我們?nèi)四X構(gòu)想出來的虛擬空間,把這個思想構(gòu)成數(shù)據(jù)以后映射到空間中去,這樣就形成我們數(shù)據(jù)的第四個爆發(fā)點。
很多人說數(shù)據(jù)化后面應(yīng)該是智能化,那么智能化在哪里呢,實際上我認(rèn)為智能化是包括在數(shù)據(jù)化之中的,剛開始比較弱而已,然后逐漸從弱智變成比較聰明到現(xiàn)在是很聰明,可以識別圖像人臉,最近由于深度學(xué)習(xí)算法的流行,所以大家對智能化看的比較重,實際上智能化這個步伐還在繼續(xù)深入,智能化是隱含在這個數(shù)字化之中的,元宇宙時間點提前了,因為各大公司現(xiàn)在都涌入元宇宙這個領(lǐng)域,其標(biāo)志性事件就是Facebook把它的名字改成了Meta。
元宇宙時間點提前,將改寫IDC數(shù)據(jù)量增長預(yù)測
元宇宙是一種動態(tài)的交互式的、沉浸式的全景圖像,會引起數(shù)據(jù)量的大爆發(fā),比高清視頻數(shù)據(jù)量大很多倍,所以存儲需求呈跳躍式增長,那么一個平行于人腦的獨立的虛擬空間將是元宇宙發(fā)展的高級階段。
我們這樣假設(shè)一個場景,你與元宇宙中的虛擬人自由的交談,他是具有智慧的,那么這種就是元宇宙一個高級階段,就是他不依賴于人腦,而自己在虛擬空間有他的智慧,這還有一段時間。
那存儲的驅(qū)動力二是主流介質(zhì)的變更。硬盤從早期1956年的大硬盤到現(xiàn)在的高容量硬盤經(jīng)歷了水平記錄,中間一個巨磁阻效應(yīng)還得了諾貝爾獎,垂直記錄還有現(xiàn)在的瓦記錄還有即將出現(xiàn)的熱輔助磁記錄,容量提高了這個倍數(shù)是好幾個數(shù)量級。
1984年發(fā)明的NAND閃存目前成為手機(jī)、筆記本電腦的主流介質(zhì),而且金融數(shù)據(jù)中心固態(tài)盤,大量固態(tài)盤采用,到2026年固態(tài)盤每單位容量的成本就和硬盤持平,所以形成一類主流介質(zhì)。第三類主流介質(zhì)就是現(xiàn)在非易失的存儲器,那么現(xiàn)在有相變、磁變、阻變?nèi)N,大批量進(jìn)入商業(yè)化的就是第一種叫 3D XPoint技術(shù),現(xiàn)在已經(jīng)開始進(jìn)入市場,不過價格現(xiàn)在還比較貴。
新的介質(zhì)具有帶來體系結(jié)構(gòu)和軟件的改變。我們教科書上的老三樣,cache、DRAM、 硬盤,現(xiàn)在變成了多個層,固態(tài)盤和非易失固態(tài)盤也進(jìn)來了,還有非易失內(nèi)存,這樣存儲結(jié)構(gòu)得到很大變革,而且介質(zhì)變快,相對來說其軟件占比比較大,硬盤的軟件開銷只占0.3%,而NVM DIMM這個新介質(zhì),軟件開銷占到94%,這是UCSD的研究結(jié)果,所以我們現(xiàn)在由于介質(zhì)的改變帶來整體軟件改變。
驅(qū)動力三是冷數(shù)據(jù)的挑戰(zhàn)。冷數(shù)據(jù)在過去還不覺得是個壓力,但是現(xiàn)在各大互聯(lián)網(wǎng)公司、數(shù)據(jù)中心感覺這個冷數(shù)據(jù)壓力越來越大。什么是冷數(shù)據(jù),我們舉個例子就是我們每天微信朋友圈發(fā)照片,每天的騰訊那兒是10億張,10億張上去就有很多人點擊,訪問量就是百億次的,這是熱數(shù)據(jù),但是第二天訪問量馬上下來就變冷了,一個星期以后就沒什么人看了,這就是冷數(shù)據(jù)。
但冷數(shù)據(jù)你不能丟,日積月累下來就是一個巨大的量,結(jié)果這些公司發(fā)現(xiàn)這個冷數(shù)據(jù)現(xiàn)在越來越承受不了,冷數(shù)據(jù)是Cold Data,他既是大數(shù)據(jù)(Big Data),又是保持時間很長的長數(shù)據(jù)(Long Data),帶來成本挑戰(zhàn)、能耗挑戰(zhàn)和壽命挑戰(zhàn),我們現(xiàn)在大部分用的硬盤,一個數(shù)據(jù)中心可能有幾十萬個硬盤甚至上百萬的硬盤,這樣消耗巨大的能量,而且硬盤發(fā)熱,還要用很大的電力來冷卻,壽命也只有五年,隔五年就要換一批,所以這個成本,遷移成本非常非常大。
這種挑戰(zhàn)如何應(yīng)對?我們現(xiàn)在一個是磁帶,但我們中國發(fā)展光存儲。新的光存儲有4種,一種是藍(lán)光技術(shù)上發(fā)展叫AD現(xiàn)在有300G和500G兩種,還有第二是全息光存儲。第三種是超分辨光存儲,就是把光點縮小到以前的1/10,這樣的容量就會大大提高,而且可以記多層,這個理論上可以達(dá)到500TB的容量。還有現(xiàn)在在玻璃上用多維的方式來記錄,他是用飛馬激光打上一個微小的微納結(jié)構(gòu),這樣每張盤可以存300個T,而壽命幾乎是無限的,這樣是一個永久保存技術(shù),能很好解決冷數(shù)據(jù)問題。
如何構(gòu)建完善的存儲技術(shù)生態(tài)系統(tǒng)?
我國存儲產(chǎn)業(yè)取得很大進(jìn)步,國內(nèi)市場已占據(jù)主導(dǎo),但生態(tài)還比較脆弱,主要問題有三個。
第一完全沒有硬盤工業(yè),硬盤全部依賴進(jìn)口,大量數(shù)據(jù)一旦硬盤進(jìn)口出問題是非常嚴(yán)重的,所以這是非常脆弱的一個點;
第二點我們在國際標(biāo)準(zhǔn)上基本沒有話語權(quán),比如說NVMe這種標(biāo)準(zhǔn)我們是沒有話語權(quán),我們在通訊領(lǐng)域有很多話語權(quán),在存儲領(lǐng)域沒有,在評測領(lǐng)域也沒有,比如說我們的存儲大廠都想擠入Gartler的存儲魔力象限,企業(yè)要打榜存儲性能評測SPC-1才覺得我們得到承認(rèn),還有我們質(zhì)量的檢測要通過美國的IOL交互器實驗室得到測試才能得到承認(rèn)。
如何解決,第一我提出用光、電來代磁,我們要大力發(fā)展NAND固態(tài)盤產(chǎn)業(yè)和光存儲產(chǎn)業(yè),因為我們現(xiàn)在長江存儲可以生產(chǎn)閃存芯片了,現(xiàn)在產(chǎn)能還非常小,但要擴(kuò)大產(chǎn)能滿足國內(nèi)需要,我們發(fā)展固態(tài)盤完全有能力的這是存熱數(shù)據(jù)。冷數(shù)據(jù)國外是磁帶,我們現(xiàn)在要發(fā)展剛才說的新一代光盤,用新一代光盤做成我們大容量的光盤庫,就可以解決冷數(shù)據(jù)問題。第三我們要建成自己的評測體系,形成權(quán)威第三方機(jī)構(gòu),至少我們自己的企業(yè)要認(rèn)可我們的評測機(jī)構(gòu)、評測的結(jié)果,最后是想要世界上的企業(yè)也認(rèn)可我們的評測結(jié)果,這才是我們生態(tài)要完善的這樣一個局面。
結(jié)論
宇宙的一切皆可以由數(shù)來表達(dá)!這就是我們數(shù)字化一個非常終極的目標(biāo)。我們存儲是數(shù)據(jù)的載體,因此,發(fā)展機(jī)會也是無限的。存儲技術(shù)有三種驅(qū)動力,第一是數(shù)字化進(jìn)程的步伐加快;第二是主流存儲介質(zhì)的更新?lián)Q代;第三是冷數(shù)據(jù)的挑戰(zhàn)。
我們要完善我們存儲生態(tài)鏈三條措施。第一用電光代磁;第二加強(qiáng)引領(lǐng)性核心技術(shù)的研發(fā),掌握標(biāo)準(zhǔn)領(lǐng)域的話語權(quán);第三加強(qiáng)評測體系建設(shè),爭取評測領(lǐng)域的話語權(quán),我的報告到此為止,謝謝大家!