作者:Frank Hady,英特爾院士

還記得第一次使用固態(tài)盤時(shí)的感受嗎?我還記得,在2008年時(shí),我的搭載硬盤驅(qū)動(dòng)器(HDD)的筆記本電腦反應(yīng)遲鈍。對于它的卡頓,我已經(jīng)忍無可忍了——每當(dāng)病毒掃描程序開始訪問硬盤驅(qū)動(dòng)器時(shí),它就差不多完全卡死。終于有一天,我安裝了英特爾 X-25M固態(tài)盤。我的筆記本電腦頓時(shí)重新煥發(fā)活力,反應(yīng)迅速。筆記本電腦卡頓的日子一去不復(fù)返,我甚至注意不到病毒掃描程序什么時(shí)候開始運(yùn)行。

回想起當(dāng)時(shí)的情景,我之所以對系統(tǒng)非常不滿意,是因?yàn)樗膬?nèi)存與存儲層級結(jié)構(gòu)中存在差距。DRAM與硬盤之間的時(shí)延差距非常之大——從~80納秒到~3毫秒不等。因而我的CPU會浪費(fèi)大把時(shí)間來等待數(shù)據(jù)。之后,時(shí)延大約50微秒的NAND固態(tài)盤橫空出世,力挽狂瀾。我的內(nèi)存與存儲層級結(jié)構(gòu)問題得到了解決,其修復(fù)效果顯而易見。

時(shí)至今日,我們又一次發(fā)現(xiàn)自己需要存儲層級結(jié)構(gòu)中新的技術(shù)。NAND固態(tài)盤雖然很棒,但是它們的時(shí)延比剛面市時(shí)略長一些——這相當(dāng)于一種折中方案,目的是讓它們能夠容納更多數(shù)據(jù)。CPU的性能也在不斷提高,因此相比以前,NAND 固態(tài)盤上的數(shù)據(jù)離CPU更遠(yuǎn)了。這一次,數(shù)據(jù)中心內(nèi)的感覺最為明顯——在數(shù)據(jù)中心,數(shù)據(jù)集的規(guī)模以每三年翻一番的驚人速度增長。

近期,英特爾在韓國首爾舉辦了 “內(nèi)存&存儲日”的活動(dòng),我有幸與來自英特爾的多位專家一道,就這個(gè)主題向來自全球的影響力人士發(fā)表看法。我們展示了內(nèi)存與存儲層級結(jié)構(gòu)之間出現(xiàn)新差距的原因,以及英特爾?傲騰?技術(shù)和英特爾? 3D NAND技術(shù)如何彌合這些差距,使內(nèi)存和存儲層級結(jié)構(gòu)變得完整。今天,我將重點(diǎn)探討層級結(jié)構(gòu),以及隨著時(shí)間的推移,我們將在哪方面看到性能與容量差距。

上圖展示了內(nèi)存和存儲層級結(jié)構(gòu)。想象一下,CPU在最頂部,每一層級都(自下而上)逐漸保留“更熱”的數(shù)據(jù),使處理器可以快速訪問這些數(shù)據(jù)。根據(jù)90/10規(guī)則(90%的時(shí)間都在訪問10%的數(shù)據(jù)),我們希望每個(gè)層級的容量能夠達(dá)到上一層級的10倍,但是性能只有十分之一。該系統(tǒng)把頻繁訪問的數(shù)據(jù)向上移動(dòng)、不經(jīng)常訪問的數(shù)據(jù)向下移動(dòng)。

那么,為什么會出現(xiàn)圖中的差距呢?這些差距是日益增長的數(shù)據(jù)計(jì)算需求與底層內(nèi)存技術(shù)發(fā)展趨勢之間的不匹配造成的。還記得我剛才提到的嗎?——如今,數(shù)據(jù)以每三年翻一番的速度增長,這個(gè)速度令人難以置信。但每個(gè)DRAM裸片的容量每四年才翻一番。這種不匹配意味著我們不能在DRAM中存儲盡量多的數(shù)據(jù),就時(shí)延而言離處理器很近。因此,在DRAM下面有一個(gè)差距——內(nèi)存容量差距。

圖1:隨時(shí)間推移而變化的讀取時(shí)延

資料來源:英特爾基于多篇ISSCC、IEDM、IMW論文的薈萃分析

此外,我們發(fā)現(xiàn),雖然NAND以足夠快的速度(每2年翻一番)增加容量,但隨時(shí)間推移,它會有相對恒定的時(shí)延。因此,隨著CPU提速,NAND固態(tài)盤中的數(shù)據(jù)似乎漸行漸遠(yuǎn)。由此造成了DRAM與NAND固態(tài)盤之間的另一個(gè)差距——即:存儲性能差距。

圖2:隨時(shí)間推移而變化的寫入帶寬

資料來源:英特爾基于多篇ISSCC、IEDM、IMW論文的薈萃分析

使問題進(jìn)一步復(fù)雜化的是:我們發(fā)現(xiàn)內(nèi)存技術(shù)傾向于增加容量,而不是增加吞吐量。這意味著每單位容量的帶寬隨著時(shí)間的推移而減少,從而延長了訪問任何特定層大數(shù)據(jù)集所需的時(shí)間。這使得差距進(jìn)一步加劇。

彌合這兩個(gè)差距需要一項(xiàng)新技術(shù),這種技術(shù)的容量比DRAM更高、成本卻更低,但是它并不需要DRAM級的性能(時(shí)延和吞吐量)。由于新內(nèi)存還必須顯示為存儲,因此,它必須在整個(gè)重啟過程中擁有持久性。這一新內(nèi)存便是同時(shí)被納入英特爾傲騰?固態(tài)盤和英特爾?傲騰?數(shù)據(jù)中心級持久內(nèi)存的英特爾3D XPoint介質(zhì)。

英特爾傲騰固態(tài)盤的時(shí)延大約是10μsecs,只有NAND固態(tài)盤的十分之一。更好的一點(diǎn)是:它們能夠快速、可靠地返回?cái)?shù)據(jù),在這方面遠(yuǎn)超NAND固態(tài)盤。也就是說,英特爾傲騰固態(tài)盤彌合了部分差距,使更多內(nèi)存更靠近 CPU。

英特爾傲騰數(shù)據(jù)中心級持久內(nèi)存使得英特爾傲騰內(nèi)存可直接通過加載存儲質(zhì)量進(jìn)行訪問,并不需要操作系統(tǒng)干預(yù)。它們還允許訪問單一緩存行。數(shù)據(jù)能夠以100納秒的速度被訪問(~100納秒-~340納秒之間,具體取決于DRAM緩存命中率)。因此,作為持久內(nèi)存,英特爾傲騰內(nèi)存介質(zhì)彌合了層級架構(gòu)中的另一個(gè)差距。

我們還展示了容量每兩年翻一番的NAND如何能夠存儲當(dāng)前存在硬盤中的一些數(shù)據(jù),把這些數(shù)據(jù)遷移到更靠近處理器的地方。英特爾3D NAND在每芯片面積容量方面處于業(yè)界領(lǐng)先地位。

這意味著什么呢?也就是說,數(shù)據(jù)中心目前正在疲于應(yīng)對離CPU太遠(yuǎn)的大量數(shù)據(jù),就像我們面對2008年的筆記本電腦苦苦掙扎一樣。而現(xiàn)在,數(shù)據(jù)中心總算可以喘口氣了。我們在內(nèi)存技術(shù)和系統(tǒng)技術(shù)方面的進(jìn)步取得了成效,就如同首款固態(tài)盤一樣,改變了游戲規(guī)則。在英特爾,我們正在努力完善層級結(jié)構(gòu),以幫助數(shù)據(jù)中心重新煥發(fā)生機(jī)。

分享到

zhupb

相關(guān)推薦