在介紹MRDIMM和CXL 2.0之前,先來看看超大的3級緩存。高達(dá)504MB的三級緩存,應(yīng)該是英特爾正常的通用處理器當(dāng)中最大的了,平均單核有近4MB緩存,超大的緩存使得核心更高效地獲取數(shù)據(jù),降低內(nèi)存訪問延遲,提升整體系統(tǒng)的并行處理能力。
MRDIMM為性能核英特爾至強(qiáng)6提供了更大內(nèi)存的帶寬
接下來看看MRDIMM內(nèi)存部分。首先,它的傳統(tǒng)DRAM內(nèi)存頻率從DDR5 5600提高到了6400MT/s,如果用MRDIMM內(nèi)存,頻率直接就來到了驚人的8800MT/s。那么,什么是MRDIMM呢?
MRDIMM(Multiplexed Rank DIMM)是一種新型的內(nèi)存模塊架構(gòu),通過使用多路復(fù)用技術(shù),使得多個Rank可以同時傳輸數(shù)據(jù),從而減少了數(shù)據(jù)傳輸?shù)却龝r間,最終提升了內(nèi)存帶寬和吞吐量。
簡而言之,相比傳統(tǒng)的DIMM(雙列直插式內(nèi)存模塊),MRDIMM能夠支持更高的內(nèi)存頻率。這次,英特爾把MRDIMM內(nèi)存速度提升至8800MT/s,顯著提高了內(nèi)存的性能,在數(shù)據(jù)密集型應(yīng)用中,比如高性能計算、數(shù)據(jù)庫和人工智能工作負(fù)載都比較受用。
目前,MRDIMM第一代產(chǎn)品可達(dá)到8800 MT/s,而未來版本計劃達(dá)到12800 MT/s甚至17600 MT/s,MRDIMM會顯著提高內(nèi)存的帶寬和數(shù)據(jù)處理能力,讓單顆核心享受到更大的內(nèi)存帶寬,從而緩解內(nèi)存墻的問題。
英特爾的中國專家表示,英特爾希望通過支持MRDIMM內(nèi)存來在一定程度上替代原來CPU Max產(chǎn)品的市場空間。相比之下,CPU Max是英特爾獨有的產(chǎn)品,而MRDIMM是業(yè)內(nèi)公開的標(biāo)準(zhǔn),這一做法也符合英特爾一直以來比較開放的作風(fēng)。
英特爾至強(qiáng)6性能核處理器支持CXL 2.0的Flat內(nèi)存模式
在IO方面,性能核至強(qiáng)6支持多達(dá)96條PCIe 5.0通道,包含64條CXL 2.0通道。特別想說的是對于CXL 2.0的支持,CXL 2.0支持內(nèi)存共享、池化,支持CXL交換機(jī),從而可以讓多個設(shè)備靈活共享更多內(nèi)存資源,從而緩解內(nèi)存墻的問題。
此前發(fā)布的至強(qiáng)6能效核處理器和這次的至強(qiáng)6性能核處理器都支持CXL 2.0,整個至強(qiáng)6支持三種CXL模式,整個至強(qiáng)6都可以使用更大的內(nèi)存池,滿足多樣化的工作負(fù)載需求,有更高的內(nèi)存資源利用率。這次,英特爾特別強(qiáng)調(diào),僅至強(qiáng)6性能核處理器支持Flat 內(nèi)存模式。
Flat內(nèi)存模式可以將DRAM和CXL內(nèi)存統(tǒng)一為一個內(nèi)存層,為操作系統(tǒng)呈現(xiàn)一個單一的內(nèi)存空間。這個模式下,硬件級別的分層管理完全透明,不需要操作系統(tǒng)進(jìn)行干預(yù),內(nèi)存訪問也不會因軟件調(diào)度而受到影響,這會使得內(nèi)存管理會更加高效。
Flat內(nèi)存模式的優(yōu)勢有很多。從公開資料可見,這種模式下,硬件會根據(jù)內(nèi)存訪問頻率,自動將熱點數(shù)據(jù)放在DRAM中,較少訪問的數(shù)據(jù)存儲在CXL內(nèi)存中,從而降低延遲。
Flat內(nèi)存模式還支持即插即用的內(nèi)存擴(kuò)展。由于Flat內(nèi)存模式通過CXL實現(xiàn)了即插即用的內(nèi)存擴(kuò)展,企業(yè)可以輕松增加內(nèi)存容量,特別適合需要大規(guī)模內(nèi)存支持的應(yīng)用場景,例如AI和科學(xué)計算場景。
有意思的是,使用Flat內(nèi)存模式時,用戶可以將較便宜的內(nèi)存模塊,或者說即將淘汰的DDR4內(nèi)存與新服務(wù)器平臺支持的高性能DDR5內(nèi)存結(jié)合使用,從而顯著降低內(nèi)存成本,成為降本增效的一把利器。
發(fā)布會現(xiàn)場,超聚變展示了超聚變CXL 2.0內(nèi)存池解決方案。這是業(yè)界首款支持CXL 2.0+內(nèi)存池,支持靈活分配內(nèi)存資源,高效內(nèi)存資源共享,提升系統(tǒng)效能。結(jié)合英特爾至強(qiáng)6性能核處理器,能充分發(fā)揮所有PCIe/CXL端口的帶寬潛力,提升系統(tǒng)整體性能。
從展區(qū)看到的數(shù)據(jù)顯示,該方案提供的共享內(nèi)存訪問時延不到300ns,支持48塊內(nèi)存條,可擴(kuò)展至80個內(nèi)存條,并且支持從16GB到128GB的內(nèi)存條容量。該方案可用在云計算/虛擬化、科學(xué)計算以及AI與推理等場景。
幾年前,CXL就描繪了很美好的未來。目前看來,考慮到AI等場景對內(nèi)存帶寬和容量的需求都在快速增加,內(nèi)存池化的部分將會是最先落地的。英特爾專家介紹稱,英特爾在至強(qiáng)6性能核處理器的內(nèi)存控制器里做了很多工作,有助于改善CXL的延遲情況。
目前,英特爾在積極推進(jìn)CXL技術(shù)落地,已經(jīng)構(gòu)建了較為完備的CXL技術(shù)生態(tài)。在國內(nèi)也有包括瀾起科技、超聚變等技術(shù)伙伴以及騰訊和阿里巴巴等終端用戶。2024年7月,CXL技術(shù)應(yīng)用俱樂部(CXL Tech Application Club)成立,預(yù)示著CXL國內(nèi)產(chǎn)業(yè)生態(tài)步入?yún)f(xié)調(diào)發(fā)展階段。