截圖來自美光:《CXL Memory Expansion:A Closer Look on Actual Platform 》

為了應(yīng)對這些問題,英特爾在努力打造與之匹配的內(nèi)存系統(tǒng)。我們看到,英特爾至強(qiáng)6 6900P系列已經(jīng)將內(nèi)存通道數(shù)從8個(gè)提升到了12個(gè),同時(shí)對CXL的支持也進(jìn)一步成熟。除此之外,英特爾至強(qiáng)6性能核還率先支持MRDIMM,大幅提高內(nèi)存性能。

英特爾至強(qiáng)6率先支持MRDIMM,獨(dú)享這一技術(shù)

2024年,英特爾發(fā)布了支持MRDIMM技術(shù)的英特爾至強(qiáng)6性能核處理器,這是目前業(yè)內(nèi)唯一一個(gè)支持MRDIMM技術(shù)的服務(wù)器處理器,此前發(fā)布的英特爾至強(qiáng)6能效核處理器,以及AMD最新的服務(wù)器處理器都暫不支持。

英特爾從第四代英特爾至強(qiáng)可擴(kuò)展處理器開始支持DDR5 4800內(nèi)存。DDR5不僅帶來了更大的單條容量,也帶來了更高的內(nèi)存?zhèn)鬏斔俾?。盡管現(xiàn)在至強(qiáng)6已經(jīng)提高到了6400MT/s,但遠(yuǎn)遠(yuǎn)趕不上核心的增幅,而MRDIMM則開辟了新的提升路徑。

數(shù)據(jù)中心常用的RDIMM(注冊內(nèi)存模塊)設(shè)計(jì)通常包括兩個(gè)內(nèi)存陣列(性能陣列和容量陣列)。RDIMM雖然可以讓內(nèi)存讀和寫發(fā)生在多個(gè)陣列之間,但卻無法同時(shí)進(jìn)行,也就是說,每個(gè)周期(Cycle)同一時(shí)間只能對一個(gè)Rank(陣列)進(jìn)行讀取或者寫入。

圖片:來自SK海力士

為了解決這個(gè)問題,聰明的工程師通過在 DRAM 模塊中引入多路復(fù)用器(Mux),利用片上數(shù)據(jù)緩沖區(qū),讓數(shù)據(jù)在同一個(gè)時(shí)刻跨兩個(gè)陣列(Rank)進(jìn)行傳輸,每個(gè)陣列(Rank)64個(gè)字節(jié),實(shí)現(xiàn)了128 字節(jié)的同步傳輸,從而大幅提升帶寬和性能。

由此誕生了英特爾有史以來最快的系統(tǒng)內(nèi)存。峰值帶寬從英特爾至強(qiáng)6默認(rèn)支持的6,400MT/s躍升至8,800MT/s,提高近40%。這種幅度的提升,按照過去的方式大概需要經(jīng)過3代才能實(shí)現(xiàn)。

從英特爾技術(shù)專家的介紹中了解到,MRDIMM從2018年開始做原型設(shè)計(jì),到如今正式發(fā)布已歷經(jīng)了很多年。之所以在至強(qiáng)6這一代開始支持MRDIMM,主要是因?yàn)?,MRDIMM的8800MT/s內(nèi)存與英特爾至強(qiáng)6性能核處理器性能非常匹配。

MRDIMM的落地幾乎沒有任何障礙

MRDIMM和現(xiàn)有的DDR5內(nèi)存生態(tài)有很好的兼容性。英特爾不僅于2022年底將組件規(guī)格作為新的開放標(biāo)準(zhǔn)捐贈(zèng)給了JEDEC,成為了JEDEC標(biāo)準(zhǔn)。而且,還一直都與內(nèi)存廠商保持深度合作,目前三星、SK海力士、美光等都推出了相應(yīng)的內(nèi)存產(chǎn)品。

MRDIMM的技術(shù)生態(tài)非常完善。MRDIMM采用與常規(guī)RDIMM相同的連接器和外形規(guī)格,無需對主板做任何更改。同時(shí),它還具有與RDIMM相同的RAS功能。這意味著,數(shù)據(jù)中心客戶可以直接用上MRDIMM,不需要更改任何代碼。

MRDIMM帶來的性能優(yōu)勢非常明顯。有媒體測試對比了兩套配置相同的至強(qiáng)6系統(tǒng),分別使用MRDIMM和RDIMM。測試結(jié)果顯示,使用MRDIMM的系統(tǒng)在完成速度上比使用RDIMM的系統(tǒng)快了33%。

英特爾專家表示,MRDIMM帶來的帶寬提升,對于內(nèi)存帶寬敏感型應(yīng)用非常受用。它非常適用于小語言模型、深度學(xué)習(xí)、推薦系統(tǒng)、科學(xué)計(jì)算、內(nèi)存數(shù)據(jù)庫等工作負(fù)載。未來,隨著12800MT/s和17600 MT/s MRDIMM的推出,提升效果會更明顯。

第五代英特爾至強(qiáng)可擴(kuò)展處理器的最高核心數(shù)為64個(gè),而至強(qiáng)6900P的性能核處理器則達(dá)到了128核,在這種翻倍的提升面前,不僅需要MRDIMM帶來的40%帶寬提升,因此,英特爾也在推動(dòng)CXL等技術(shù)的落地。

解決內(nèi)存瓶頸的其他方式

當(dāng)然,有朋友會注意到HBM技術(shù)在提高內(nèi)存帶寬方面的價(jià)值。英特爾也曾將HBM集成到了x86處理器,推出了至強(qiáng)CPU Max處理器。但事實(shí)證明,用HBM來解決通用處理器內(nèi)存瓶頸問題,可能還有待進(jìn)一步探索。

實(shí)際上,現(xiàn)在單路服務(wù)器里MRDIMM的帶寬,基本與英特爾CPU Max里HBM提供的帶寬持平。此外,HBM不僅提供的帶寬有限,而且需要特殊封裝,所以不僅通用性比MRDIMM差,成本也會高出很多,其容量上限也遠(yuǎn)不如MRDIMM。

英特爾專家認(rèn)為,CXL是另外一個(gè)比較推薦的緩解內(nèi)存瓶頸的方式,這是一種靈活、高性價(jià)比的內(nèi)存架構(gòu)。與MRDIMM和HBM等追求極致帶寬和性能的技術(shù)不同,CXL 更注重靈活性和成本優(yōu)化。

它既可以提供內(nèi)存擴(kuò)展器來擴(kuò)展本地內(nèi)存,也可以通過搭建CXL 內(nèi)存池共享內(nèi)存資源,而且通過支持DDR4內(nèi)存,它可以提供更有性價(jià)比的內(nèi)存資源。此外,其在某些場景下的性能可達(dá)到傳統(tǒng)內(nèi)存的 90%-95%,可以很好地滿足業(yè)務(wù)系統(tǒng)對內(nèi)存擴(kuò)展的需求。

鑒于這種靈活性和低成本的優(yōu)勢,CXL的內(nèi)存擴(kuò)展方案更受歡迎。目前,CXL的生態(tài)正在逐步完善,各種基于CXL的創(chuàng)新產(chǎn)品正在快速涌現(xiàn),應(yīng)用場景也不斷拓展。不久前,英特爾還宣布了一項(xiàng)與阿里云的一項(xiàng)關(guān)于CXL的合作,可以看到CXL的技術(shù)和生態(tài)都正在日漸成熟的過程中。

英特爾至強(qiáng)6可以更好地支持CXL,提供更強(qiáng)的CXL內(nèi)存分層支持,而且,目前只有英特爾至強(qiáng)6處理器可以實(shí)現(xiàn)Flat內(nèi)存模式。搭配MRDIMM技術(shù),英特爾至強(qiáng)6可以最大程度上緩解內(nèi)存瓶頸問題,而這也正是市場上其他服務(wù)器方案所不具有的優(yōu)勢。

分享到

zhupb

相關(guān)推薦