我們都知道NAND閃存的一些基本特性,那就是隨著TLC、QLC及PLC的升級,P/E壽命會下降,同時制程工藝升級的話P/E壽命也會下降,雙重疊加之后先進工藝的QLC、PLC壽命就會很難看。而且從SLC、MLC、TLC、QLC到PLC,這一路上的性能也是逐漸下降。原本NAND主打的就是性能,沖著高性能,大家才去容忍NAND的低容量高成本。

NAND介質照這樣發(fā)展下去,會不會有商用的HLC恐怕都要兩說了。有人說,那怕什么,只要容量大,性能低一些,耐久度低一些,照樣會有應用場景,比如冷存儲啊什么的。實際上,NAND目前已經開始與機械硬盤正面交鋒了。機械硬盤除了性能,在容量、耐久度、成本上,NAND目前望塵莫及。此外,機械硬盤也在使用新技術來提升密度和容量,比如單盤體含雙盤的Dual Actuator雙磁頭臂技術, 下一代的BPMR技術等等。

感覺上,NAND在技術上不斷閹割自己,而機械硬盤則是不斷提升自己,一個往下走,一個往上走,這怎么說也感覺怪怪的,前者還能走多遠?甚至除了3D堆疊之外,還能不能走出一條新路?我持懷疑態(tài)度。

目前的NAND市場已經是硝煙滾滾,大家已然殺紅了眼,而且性能上似乎已經遇到了天花板,前途不好說??傊?,此地不宜久留。作為老江湖,Intel已經覺察到了。

 2轉戰(zhàn)新領域

Intel作為業(yè)界的Explorer和Pioneer以及Leader,善于在無人問津的地帶從零開始建立生態(tài)。比如,NAND的出現填補了RAM和HDD之間的性能落差,而在RAM和NAND之間,仍然有較大的性能落差,尤其是隨著大數據業(yè)務增長,對于這種細化的性能分級又有了大量的剛需。

從CPU核數的提升和內存容量提升的趨勢來看,內存的發(fā)展步伐出現了明顯放緩的趨勢,以前的內存容量大概每三年翻一番,而現在大概是四年翻一番。不僅如此,從一臺服務器的成本構成來看,內存的成本越來越高,甚至有時候能占到服務器整體成本的一半,內存不僅容量提升困難,成本也越來越高。

作為一種極具創(chuàng)新和顛覆性的解決方案,傲騰為傳統(tǒng)計算體系結構提供了新的內存和存儲層級,解決內存成本高和NAND SSD性能不足的問題,彌補DRAM內存和NAND SSD之間的空白。

英特爾傲騰作為一種創(chuàng)新的解決方案,憑借四大技術特性,構建了DRAM和內存之間的存儲層級,與DRAM內存相比,它具有非易失性,掉電之后也不會丟失數據。與NAND SSD相比,傲騰還支持字節(jié)尋址,可以每次只訪問部分字節(jié),而不是像硬盤需要訪問512字節(jié)或者4KB那么多,有效減少了寫放大,同時,傲騰支持的就地寫入,從而省去了垃圾回收機制,最后,配合低延遲的特性,最終讓傲騰的性能表現遠超普通NAND SSD。

傲騰持久內存有兩種操作模式,一種叫做內存模式,在這種情況下,傲騰也具有內存一樣的易失性,與DRAM構成內存池,DRAM作為高頻熱數據的緩存,用戶無需對應用做任何修改就可以直接啟用這種模式。

另一種模式是App Direct模式,這種模式下傲騰具有非易失性,需要低延遲同時不需要永久存儲的數據可以放在DRAM上。需要持久存儲或者結構化存儲的大量數據適合放在傲騰數據中心持久內存上。如果想讓內存中的數據持久化,那么肯定就得選App Direct模式了。

App Direct模式其實還有一個變種叫Storage over AD,這種模式中傲騰持久內存仍舊保持非易失性,這是一種NVDIMM方案,插在DIMM插槽上的存儲,這種模式要求操作系統(tǒng)提供NVDIMM驅動,而且,無需修改應用就可以直接用。值得一提的是,它支持塊尋址而非字節(jié)尋址。

隨著第三代至強可擴展處理器發(fā)布的還有新一代傲騰持久內存——Optane Persistent Memory 200系列,傲騰持久內存的提升非常明顯,就是容量更大,性能更高,更安全。

與上一代100系列相比,200系列的帶寬提升了32%,容量方面,可為每一路服務器提供高達6TB的總內存。從性價比來看,200系列傲騰持久內存能將運行每臺虛擬機的成本降低25%。 

2020年,英特爾還發(fā)布了第二代傲騰SSD P5800X系列,號稱是全球最快的SSD。P5800X與上代相比,性能提升了近四倍,延遲降低了一半。與英特爾自家最快的NAND SSD相比,P5800X的延遲低了13倍,QoS高了66倍,IOPS/GB的性能是27倍,耐久性是33倍。

在系統(tǒng)架構中,傲騰SSD主要是配合NAND SSD使用,作為NAND SSD的加速層,具體用法上有三種:加速(accelerating),緩存(caching)和分層(tiering)。在optane上加快系統(tǒng)性能,例如與TOC解決方案相比,可將延遲降低70%。

用作加速時,傲騰SSD上存放大量元數據(Metadata),與單純使用TLC相比,能降低70%的延遲。用作緩存時,能大幅提高應用性能,比如在VMware vSAN集群里使用,能將支撐的虛擬機數量提高60%。分層也非常好理解,熱數據先放在傲騰SSD上,數據變冷之后則遷移到NAND SSD上,這種方案能將延遲降低50%,同時降低TCO。

 3生態(tài)加速鋪開

英特爾傲騰多用在數據挑戰(zhàn)比較多的場景,比如數據庫、高級分析(包括AI)、云計算、HPC以及存儲系統(tǒng)方面,用戶覆蓋包括云服務商、金融行業(yè)、醫(yī)療健康、政府、能源運輸等多個行業(yè),全球許多大型知名企業(yè)都用上了傲騰。

據了解,《財富》世界500強中有200多家已部署英特爾傲騰持久內存,其中,企業(yè)客戶占比最多,達到了40%,其次是云服務提供商占13%,金融服務領域占12%?!敦敻弧肥澜?00強公司中的80多家都部署了英特爾傲騰固態(tài)硬盤,其中,云服務提供商占24%,企業(yè)占17%。

傲騰的POC轉化率非常高,也就是說,只要是做了PoC的企業(yè),大部分都成了傲騰的用戶,用戶對于傲騰價值的認可度還是非常高的。

從應用類型來看,傲騰持久內存最常見的應用就是內存數據庫(IMDB),占比達37%,其次是AI和數據分析應用。傲騰SSD的最典型場景是定制化場景,占到了27%,vSAN的場景占到了21%,然后是云服務商以及數據庫這類應用。

以中國用戶更熟悉的燕京啤酒為例,燕京啤酒使用了傲騰持久內存和傲騰SSD兩種方案,在傲騰持久內存的幫助下,超融合方案可以支撐更多的虛擬機,在傲騰SSD幫助下,提高了存儲的性能并降低了延遲。

凱克薩銀行(CaixaBank)是西班牙著名的金融服務公司,他們在未來業(yè)務發(fā)展特別看重分析能力。凱克薩銀行有20%的交易都是在移動端完成的,業(yè)務形態(tài)正在向金融服務的數字化轉型,同時,基于對多渠道的客戶數據進行分析創(chuàng)建新的商業(yè)模式。

為了實現這些目標,凱克薩銀行部署了一個Oracle Exadata大數據解決方案,該方案使用了英特爾至強處理器和英特爾傲騰持久內存。這套方案在存儲層中采用持久內存,可加快密集型數據分析,并提供實時響應能力,從而獲得更具可操作性的客戶洞察。

為了更好了解新冠病毒的傳播方式和對患者的影響,美國醫(yī)療機構Mercy使用了基于SAP HANA、英特爾至強可擴展器和傲騰持久內存的數據分析系統(tǒng),使用自然語言處理和人工智能技術從臨床數據中獲得了很多重要信息。在內存層中使用持久內存后,能快速分析大量結構和非結構化數據,從而為病人提供更智能的護理,提高響應和協調疫情的能力。

西班牙電信是全球最大的電信運營商之一,在16個國家和地區(qū),為3.36億人提供服務。它所提供的虛擬數據中心服務于關鍵工作負載,要求有持續(xù)的高吞吐量和低存儲延遲,西班牙電信開發(fā)了基于VMware vSAN和英特爾志強可擴展處理器的超融合解決方案,提供整合的、易于管理的解決方案,有較高的吞吐量和低延遲表現,在vSAN的緩存層中使用了英特爾數據中心SSD,最終基于vSAN架構構建了滿足SLA要求的存儲方案。

時至2021年,傲騰的應用生態(tài)越發(fā)壯大,越來越多的軟件開發(fā)商,云服務商以及OEM服務商加入了傲騰生態(tài)。

在一次測試中,阿里的Mars分布式內存計算框架利用傲騰持久內存,取得了很不錯的性能加成。如下圖所示,當需要處理的數據集超過了主存承載能力之后,溢出后的數據被放置在傲騰存儲器而不是之前的NVMe硬盤中,隨著數據量溢出主存,傲騰方案的性能會有顯著提升。 

 Mars是一個基于張量的統(tǒng)一分布式計算框架,突破了現有大數據計算引擎以關系代數為主的計算模型,將分布式技術引入科學計算和數值計算領域,極大地擴展了科學計算的計算規(guī)模和效率。目前Mars已經實現了70%的Numpy常見接口,用戶只需要通過import Mars就可以將已經編寫好的基于Numpy的代碼移植到Mars中。 

Mars會將張量自動在各個維度上切分成小的chunk來分布式處理從而提升并行性,以便于將小顆粒任務派發(fā)到GPU,或者網絡遠端的其它集群節(jié)點上并行計算。

舉例來講,對于張量矩陣乘法,Mars會生成如下圖所示的chunk級別執(zhí)行圖。在執(zhí)行過程中,會有大量的中間過程,這些過程生成大量的數據會占用寶貴的主存資源。

每個chunk執(zhí)行完畢之后,結果數據會被放置在shared memory中,當share memory中數據過多時,Mars會啟動spill溢出控制機制,將溢出的數據轉移到下層更大容量的存儲器中。

經過評估,阿里發(fā)現使用Intel傲騰持久內存來作為主存的下一層存儲器,無論是在性能上還是TCO上,相比直接用NVMe盤作為下層,都非常符合Mars系統(tǒng)的預期。

 傲騰持久內存提供128GB、256GB和512GB容量,遠高于目前最大容量僅限于每DIMM 128GB的可用SDRAM DIMM,而且與傳統(tǒng)DRAM DIMM相比,傲騰持久內存的每GB成本更低。傲騰持久內存通過內存總線直接連接到處理器,在基于App Direct(簡稱AD)模式下,應用程序可以完全繞過操作系統(tǒng),不需要設備驅動程序、系統(tǒng)調用、中斷和上下文切換,就可以從用戶空間直接訪問持久內存上的數據。下圖所示為采用NVMe閃存盤、NVMe傲騰盤和傲騰持久內存的訪問延遲對比。

總體而言,使用Intel傲騰持久內存,解決了Mars科學計算中因數據溢出傳到硬盤,導致I/O開銷增大,計算性能降低的問題。通過測試,驗證了在TCO成本相當的情況下,使用傲騰持久內存能夠有效提升Mars科學計算性能。

分享到

崔歡歡

相關推薦