而在NAND存儲(chǔ)中,英特爾此前宣布的144層QLC NAND規(guī)劃也在緊鑼密鼓地進(jìn)行中。作為目前市場(chǎng)上最高層的NAND技術(shù),144層QLC NAND的發(fā)布勢(shì)必將掀起閃存普及的又一波浪潮。所以NAND存儲(chǔ)對(duì)于英特爾NSG業(yè)務(wù)部門(mén)的重要程度也不言而喻。
從倪錦峰的介紹中了解到,2020年第一季度,突如其來(lái)的疫情面前,英特爾數(shù)據(jù)中心業(yè)務(wù)需求迎來(lái)暴增的趨勢(shì),互聯(lián)網(wǎng)、云計(jì)算廠商對(duì)擴(kuò)容都有較大需求,用戶對(duì)于TLC/QLC NAND以及傲騰+QLC的組合方案的需求明顯增多,倪錦峰認(rèn)為,以創(chuàng)新閃存能力補(bǔ)充服務(wù)能力的做法比單純添加服務(wù)器的做法要更具優(yōu)勢(shì)。
當(dāng)然,閃存的快只是一方面,另一方面,閃存的容量也越來(lái)越大,這種在性能和容量上不斷優(yōu)化的層級(jí)就是英特爾常說(shuō)的“存儲(chǔ)金字塔”,這一貫穿整個(gè)IT架構(gòu)的體系已逐步成為解決多樣化存儲(chǔ)需求不變的參照系。
在2020年4月15日舉行的軟件定義存儲(chǔ)線上峰會(huì)上,倪錦峰詳細(xì)介紹了AI對(duì)數(shù)據(jù)基礎(chǔ)設(shè)施的挑戰(zhàn),也介紹了英特爾如何基于“存儲(chǔ)金字塔”解決AI存儲(chǔ)的問(wèn)題。
AI帶來(lái)的數(shù)據(jù)存儲(chǔ)新挑戰(zhàn)!
事實(shí)上,AI作為一種新的數(shù)據(jù)處理技術(shù),它的數(shù)據(jù)管道(Data Pipeline)涵蓋采集、準(zhǔn)備、訓(xùn)練和推理四個(gè)階段,每個(gè)階段對(duì)于數(shù)據(jù)存儲(chǔ)的要求都不盡相同。
數(shù)據(jù)采集階段:數(shù)據(jù)從不同來(lái)源聚攏并存儲(chǔ)起來(lái),數(shù)據(jù)的大小和格式存在各種差異,數(shù)據(jù)類(lèi)型往往是文件或者對(duì)象形式的非結(jié)構(gòu)化數(shù)據(jù)。
采集過(guò)程的特點(diǎn)是首先要進(jìn)行百分之百的順序?qū)懭?,從多個(gè)數(shù)據(jù)源進(jìn)行數(shù)據(jù)的批處理或者流傳輸,如果存儲(chǔ)性能跟不上,數(shù)據(jù)就會(huì)被丟棄,所以,數(shù)據(jù)采集階段對(duì)存儲(chǔ)性能的要求非常高。采集完后,還要將收集來(lái)的數(shù)據(jù)重新放入更大的存儲(chǔ)池內(nèi),對(duì)讀性能也提出很高要求。
數(shù)據(jù)準(zhǔn)備階段:由于數(shù)據(jù)大小和格式不一樣,為了便于訓(xùn)練,必須改為統(tǒng)一格式,以便后續(xù)訓(xùn)練階段使用。這一過(guò)程要對(duì)不同格式和尺寸的數(shù)據(jù)進(jìn)行規(guī)范化處理,其快慢就取決于計(jì)算節(jié)點(diǎn)的內(nèi)存以及存儲(chǔ)的性能。在數(shù)據(jù)轉(zhuǎn)化過(guò)程中,其工作負(fù)載跟采集過(guò)程也很不一樣,包括順序讀寫(xiě)、隨機(jī)讀寫(xiě),在最極端的情形下,甚至可能是50%:50%的讀寫(xiě)混合。
訓(xùn)練階段:AI訓(xùn)練過(guò)程的工作負(fù)載非常密集,往往需要高性能的GPU或者加速器等來(lái)執(zhí)行一系列的數(shù)學(xué)函數(shù),對(duì)資源要求非常高,在做特定訓(xùn)練時(shí),AI訓(xùn)練所需的時(shí)間更加取決于所部署的高性能內(nèi)存與高性能存儲(chǔ)的數(shù)量。
推理階段:推理過(guò)程是檢驗(yàn)人工智能的重要階段,可以真正認(rèn)識(shí)到人工智能的強(qiáng)大之處。推理基礎(chǔ)設(shè)施根據(jù)不同場(chǎng)景,所需配置的處理器、內(nèi)存、存儲(chǔ)都不盡相同。
從以上可以看出,AI對(duì)于存儲(chǔ)的需求是復(fù)雜多變的,英特爾的思路是希望更多數(shù)據(jù)能夠更加靠近處理器,建立以數(shù)據(jù)為中心的高效存儲(chǔ)架構(gòu),也就是我們說(shuō)的“存儲(chǔ)金字塔”。
以數(shù)據(jù)為中心的高效架構(gòu)解決AI存儲(chǔ)難題
英特爾以數(shù)據(jù)為中心的存儲(chǔ)架構(gòu)中,最上層是DRAM,最下層是磁盤(pán)和磁帶。其中,DRAM和英特爾傲騰持久內(nèi)存提供超高性能和超低延遲,英特爾傲騰固態(tài)盤(pán)以及英特爾TLC、QLC大容量、高性能固態(tài)盤(pán)相配合則作為更好的溫?zé)釘?shù)據(jù)存儲(chǔ)層。
因?yàn)槊恳粚蛹?jí)間的容量和時(shí)延特性有一個(gè)數(shù)量級(jí)的差距,所以系統(tǒng)可根據(jù)不同數(shù)據(jù)的工作負(fù)載進(jìn)行冷熱分層,然后根據(jù)需求和成本預(yù)算來(lái)不斷優(yōu)化性能,解決各種存儲(chǔ)難題。
作為一種革命性的技術(shù),英特爾傲騰是過(guò)去20多年以來(lái),在內(nèi)存和存儲(chǔ)方面的革命性進(jìn)步,它的出現(xiàn)讓“存儲(chǔ)金字塔”真正完整起來(lái),成為解決各種存儲(chǔ)難題的殺手锏。
相比傳統(tǒng)的NAND、HDD技術(shù),革命性的傲騰技術(shù)具有以下重要特性:
第一,支持就地寫(xiě)入(Write in Place),不需要像NAND一樣先擦除再寫(xiě)入,引起對(duì)IO工作負(fù)載不利的問(wèn)題,例如垃圾回收(Garbage Collection)等。
第二,支持字節(jié)尋址(Bit addressable),最大程度的獲得超低的延遲。
上圖展示的是硬盤(pán)在70%/30%的隨機(jī)讀寫(xiě)工作負(fù)載下,所展現(xiàn)的IOPS/TB擴(kuò)展能力。
隨著容量提升,機(jī)械硬盤(pán)的IOPS并沒(méi)有什么提升,SATA NAND固態(tài)盤(pán)受接口限制,容量和性能提升也有限,PCIe固態(tài)盤(pán)受限于NAND介質(zhì)的特性,擴(kuò)展能力有限。而英特爾傲騰則從介質(zhì)層突破種種限制,展現(xiàn)出良好的性能可擴(kuò)展性,成為低性能存儲(chǔ)的有益的補(bǔ)充。
同時(shí),英特爾傲騰P4800X固態(tài)盤(pán)的延遲極低,一致性及壽命表現(xiàn)非常強(qiáng)。
據(jù)上圖最左顯示,在不同的隨機(jī)寫(xiě)入負(fù)載下的平均讀取延遲,隨著寫(xiě)入壓力的不斷增加,NAND固態(tài)盤(pán)的讀延遲也在不斷增加。相比之下,英特爾傲騰固態(tài)盤(pán)的超低延遲始終沒(méi)有變化(橫軸藍(lán)色線),在圖例中的極端情況下,傲騰固態(tài)盤(pán)比NAND固態(tài)盤(pán)的讀取延遲能降低63倍左右,差異非常顯著。
此外,英特爾傲騰P4800X固態(tài)盤(pán)有超高的壽命,通常我們用DWPD來(lái)表示寫(xiě)入壽命,英特爾傲騰固態(tài)盤(pán)的DWPD便多達(dá)60 DWPD,相對(duì)英特爾的NAND SSD比如P4600、P4610只能支持3DWPD,傲騰固態(tài)盤(pán)在壽命上的進(jìn)步是非??捎^的。
低延遲、高壽命的傲騰也帶來(lái)極高的系統(tǒng)效率,比如,可以用更低的緩存比例,來(lái)實(shí)現(xiàn)更好的性能,同時(shí)又承受巨大的寫(xiě)入壓力。
在人工智能場(chǎng)景中,四個(gè)階段通常用一個(gè)存儲(chǔ)數(shù)據(jù)管道來(lái)支撐,需要的是持續(xù)的、一致的吞吐量,以及超低的延遲,英特爾傲騰加上英特爾QLC 3D NAND的組合方案可以幫助改善客戶的超融合或者相應(yīng)的軟件定義存儲(chǔ)的解決方案,為即將到來(lái)的人工智能的爆發(fā),做好相應(yīng)的準(zhǔn)備。
在落地應(yīng)用方面,百度已率先于2018年發(fā)布了基于英特爾傲騰固態(tài)盤(pán)加英特爾QLC 3D NAND固態(tài)盤(pán)技術(shù)的存儲(chǔ)解決方案,這一解決方案極大提升了AI、Big Data、Cloud的存儲(chǔ)性能。比如說(shuō)在AI的訓(xùn)練場(chǎng)景中,相比原來(lái)的磁盤(pán)方案可以得到21倍的性能提升, 96%的延遲下降,同時(shí)TCO也下降了60%左右。此外,這一解決方案很好地解決了性能以及容量的可擴(kuò)展性,百度對(duì)于該方案非常滿意。
以數(shù)據(jù)為中心的高效架構(gòu)面向廣泛應(yīng)用場(chǎng)景
除了解決AI存儲(chǔ)難題,以數(shù)據(jù)為中心的高效架構(gòu)在許多其他場(chǎng)景中都展現(xiàn)出了巨大價(jià)值。
例如在VMWare vSAN方案中,將高性能緩存從NAND PCIe固態(tài)盤(pán)換成英特爾傲騰固態(tài)盤(pán)以后,虛擬機(jī)密度提升了60%,同時(shí)系統(tǒng)整合率能夠提升30%,也就是說(shuō),可以節(jié)省更多的服務(wù)器,更多的空間,減少更多的功耗等。
在Hadoop方案中,將英特爾傲騰固態(tài)盤(pán)作為Hadoop的臨時(shí)數(shù)據(jù)緩存,吞吐量或者性能可提升40%左右。
在開(kāi)源分布式存儲(chǔ)Ceph方案中,英特爾傲騰固態(tài)盤(pán)替換NAND固態(tài)盤(pán)存放Journal,作為元數(shù)據(jù)(metadata)緩存,能夠使得99%延遲降低73%,同時(shí)IOPS性能提升了大概40%左右。
微軟Azure Stack HCI使用英特爾傲騰固態(tài)盤(pán)作為緩存盤(pán),每個(gè)系統(tǒng)、每個(gè)節(jié)點(diǎn)所能夠支持的虛擬機(jī)數(shù)量提升達(dá)60%左右,同時(shí)虛擬機(jī)的跑分也提升了80分。
此外還有很多國(guó)內(nèi)企業(yè)也在積極利用英特爾傲騰技術(shù)進(jìn)行創(chuàng)新,在本屆軟件定義存儲(chǔ)峰會(huì)上可以看到的浪潮、VMWare、XSKY、QingCloud青云等都有相應(yīng)的方案展示。
結(jié)語(yǔ)
在如今應(yīng)用類(lèi)型越來(lái)越復(fù)雜多樣,數(shù)據(jù)類(lèi)型和數(shù)據(jù)存儲(chǔ)需求也多種多樣的發(fā)展趨勢(shì)下,我們也許無(wú)法預(yù)測(cè)未來(lái)的存儲(chǔ)技術(shù)是什么,但可以肯定的是未來(lái)存儲(chǔ)將由工作負(fù)載來(lái)驅(qū)動(dòng)。
英特爾不斷推動(dòng)存儲(chǔ)技術(shù)演進(jìn),滿足不斷變化的需求,通過(guò)傲騰持久內(nèi)存以及傲騰固態(tài)盤(pán)使得數(shù)據(jù)更加靠近CPU,通過(guò)QLC 3D NAND固態(tài)盤(pán)為海量數(shù)據(jù)存儲(chǔ)提供一個(gè)最佳選擇,英特爾所打造的“存儲(chǔ)金字塔”已在當(dāng)下這個(gè)工作負(fù)載多樣化且密集的時(shí)代成為解決不同存儲(chǔ)需求的一大利器,而在各層級(jí)產(chǎn)品不斷演進(jìn)的過(guò)程中,我們也有理由相信這一“金字塔”架構(gòu)將在數(shù)據(jù)負(fù)載的指導(dǎo)下發(fā)揮出更大的價(jià)值。