在下午分論壇“大模型存儲分論壇”上,西安紫光國芯半導體股份有限公司發(fā)表了《用CXL設備實現(xiàn)服務器內(nèi)存的容量及帶寬擴展》的演講。
以下內(nèi)容根據(jù)速記整理,未經(jīng)本人審定:
紫光國芯:大家好,今天我分享的題目是用CXL設備實現(xiàn)服務器內(nèi)存的容量和帶寬擴展。
首先,給大家介紹一下西安紫光國芯半導體股份有限公司。
紫光國芯的前身是2004年德國英飛凌成立的西安研發(fā)中心存儲器事業(yè)部,到如今已有近20年的歷史,我們是一家以存儲技術為核心的產(chǎn)品和服務提供商。早在2019年隨著CXL技術的正式發(fā)布,紫光國芯就開始緊密關注這一技術的發(fā)展,并于2020年加入了CXL技術聯(lián)盟成為contributor級會員,深度參與相關標準制定的技術討論,并一直積極參與相關技術的探索與布局產(chǎn)品落地。2022年紫光國芯發(fā)布了CXL產(chǎn)品路線圖,并于2023年開始自研CXL相關產(chǎn)品的客戶送樣工作。
CXL技術基本概念
CXL即Compute Express Link,是一種開放式高速互連技術標準,旨在實現(xiàn)計算和存儲系統(tǒng)的高效數(shù)據(jù)訪問,特別是為了解決計算和存儲之間的“存儲墻”問題。
CXL的技術聯(lián)盟成立于2019年3月,全球頭部的CPU廠家與服務器廠家都參與其中,聯(lián)盟2019年3月份成立時發(fā)布了CXL1.0協(xié)議標準。半年時間后發(fā)布了CXL1.1協(xié)議標準,后續(xù)首批落地的產(chǎn)品都是基于CXL1.1的標準。
2020年10月,聯(lián)盟發(fā)布了CXL2.0協(xié)議標準。2.0協(xié)議最大的特點是可以實現(xiàn)內(nèi)存的池化,支持多個主機和存儲器設備之間的互聯(lián),實現(xiàn)帶寬和容量的有效擴展。
2022年8月,聯(lián)盟發(fā)布了CXL3.0協(xié)議標準,增加了fabric的概念,支持多個Switch之間更高維度的互聯(lián),可以應用到更高的體系架構中,實現(xiàn)進一步內(nèi)存和帶寬的擴展。
到目前為止,CXL技術聯(lián)盟擁有超過200多家成員, CPU廠家、服務器廠家、存儲器廠家陸續(xù)加入,整個生態(tài)在飛速發(fā)展階段,各種各樣的產(chǎn)品已經(jīng)落地應用。
CXL相關產(chǎn)業(yè)生態(tài)
以英特爾和AMD兩個CPU廠家為例來介紹一下CXL的生態(tài)。
2023年初,英特爾發(fā)布了支持CXL1.1協(xié)議的SPR CPU,接著又發(fā)布了另外一款基于CXL1.1協(xié)議的EMR CPU。今年三季度,英特爾發(fā)布了兩款支持CXL2.0協(xié)議的CPU, Granite和Sierra Forest,CXL通道數(shù)從SPR和EMR的32個增加到64個。
AMD也是2023年發(fā)布了支持CXL1.1協(xié)議的Genoa CPU,今年二季度發(fā)布了支持CXL2.0協(xié)議的Turin CPU。
同時國內(nèi)越來越多的CPU廠家、服務器廠商也在布局CXL技術,推動應用加速落地,尤其是CXL TYPE3領域。
基于CXL技術的典型應用場景
基于CXL技術的典型應用場景整體有TYPE1、TYPE2和TYPE3三種。在詳細介紹三種應用之前,先了解一下CXL協(xié)議本身。
CXL本身是一個開放互連的協(xié)議,從內(nèi)部子協(xié)議來看支持CXL.io、CXL.cache和CXL.memory,CXL.io跟PCIe協(xié)議非常類似,其實CXL本身采用了PCIe的物理層,比如CXL2.0和PCIe Gen5的物理層相同,CXL3.0跟PCIe Gen6的物理層也一樣。從協(xié)議的角度,支持.io,主要是實現(xiàn)計算機的配置,.Cache可以實現(xiàn)Cache類型的memory的訪問,.memory可以實現(xiàn)memory類型存儲設備訪問。
基于三種子協(xié)議可以組合出來各種各樣的應用場景,比如TYPE1支持CXL.io和CXL.cache,這樣就可以應用在一些Cache類型的設備上,比如智能網(wǎng)卡。
TYPE2類型支持CXL.io、CXL.cache、CXL.memory三種協(xié)議,可以應用在GPU、PGI的加速卡等。
TYPE3類型支持CXL.io和CXL.memory,實現(xiàn)memory內(nèi)存和容量的擴展。
從業(yè)界已經(jīng)落地的產(chǎn)品來看,TYPE3類型最多,重點是要解決存儲的帶寬和容量的問題。
TYPE3類型在系統(tǒng)中如何應用?對于傳統(tǒng)的系統(tǒng)來說,一個服務器里面有CPU,有DRAM的內(nèi)存模組,相當于是一個CPU可以訪問自己獨立的內(nèi)存模組,但是整個存儲容量和帶寬是有限制的,內(nèi)存負載也不能更好的分配。當服務器的負載高的時候可能內(nèi)存不夠,低的時候空閑內(nèi)存又是浪費,一個CPU對于配套內(nèi)存的獨立訪問,不能實現(xiàn)內(nèi)存共享。
基于這個問題,紫光國芯采用CXL TYPE3的設備,首先可以插在panel上實現(xiàn)內(nèi)存的擴展。另外一個很大的優(yōu)勢,比如以CXL2.0和3.0的設備實現(xiàn)內(nèi)存的池化或者fabric,這樣可以多個CPU共享內(nèi)存,有的內(nèi)存負載輕,有的內(nèi)存負載高,通過CXL協(xié)議來實現(xiàn)均衡,提升系統(tǒng)內(nèi)存的利用率,降低TCO。
從整體實現(xiàn)的成果來看,通過CXL的memory TYPE3設備可以在原來基礎上實現(xiàn)整個系統(tǒng)內(nèi)存帶寬和容量非常好的擴展。
紫光國芯的CXL布局
紫光國芯在CXL技術方面有著全面的布局。2019年這項技術發(fā)布,紫光國芯一直緊密關注CXL技術演進和產(chǎn)業(yè)生態(tài)的發(fā)展,積極布局相關產(chǎn)品,并于2021年啟動了CXL相關產(chǎn)品的研發(fā)工作。2022年公司正式發(fā)布了CXL產(chǎn)品路線圖,2023年,完成了CXL相關產(chǎn)品樣品的客戶送樣。今年,我們的CXL產(chǎn)品已在客戶端實現(xiàn)成功導入,未來還會發(fā)布更多CXL相關的產(chǎn)品。
紫光國芯當前的CXL產(chǎn)品主要針對內(nèi)存擴展方案,提供主控芯片或模組部件方案。介質(zhì)可以支持非易失性內(nèi)存(PCM)介質(zhì)和DRAM介質(zhì)。
支持PCM介質(zhì)的是SCM設備,可支持128GB到2TB的存儲容量,基于CXL2.0的協(xié)議標準,支持PCIe Gen5 X8/X4的物理層,對外接口帶寬與PCIe Gen5速率一樣。目前正在送樣,預計明年Q3量產(chǎn)。
支持DRAM介質(zhì)的產(chǎn)品控制器芯片可支持64GB到2TB的存儲容量,也是基于CXL2.0的協(xié)議,支持PCIe Gen X16/X8/X4的接口形態(tài),目前也在送樣階段,預計明年年底量產(chǎn)。
目前,紫光國芯積極布局下一代產(chǎn)品,已經(jīng)規(guī)劃基于CXL3.x協(xié)議的控制器芯片,對應的物理層接口是PCIe Gen6,進一步提升性能。
今天峰會上,紫光國芯還設有專門的CXL產(chǎn)品的展示區(qū),歡迎大家到展臺參觀交流。
以上便是紫光國芯關于用CXL設備實現(xiàn)服務器內(nèi)存的容量及帶寬擴展的分享,感謝大家的關注和支持!