西安紫光國(guó)芯左豐國(guó):以存儲(chǔ)系統(tǒng)結(jié)構(gòu)創(chuàng)新突破存儲(chǔ)墻
算力和存力雖然也在不斷提升,但是比不過數(shù)據(jù)爆炸式增長(zhǎng)的速度,于是便出現(xiàn)了不平衡的現(xiàn)象,這被叫做 “存儲(chǔ)墻”。提起存儲(chǔ)墻這個(gè)問題,其實(shí)行業(yè)里的朋友都很清楚,它是一個(gè)由來已久的問題。從上個(gè)世紀(jì)80年代開始,處理器的性能基本上是按照每1.5年兩倍的速度向前演進(jìn)……
8月29日,西安紫光國(guó)芯半導(dǎo)體股份有限公司(以下簡(jiǎn)稱“西安紫光國(guó)芯”)副總裁左豐國(guó)在杭州開元名都大酒店召開的以“芯存儲(chǔ) AI未來”為主題的2023閃存峰會(huì)上,發(fā)表“以存儲(chǔ)系統(tǒng)結(jié)構(gòu)創(chuàng)新突破存儲(chǔ)墻”的演講,以及西安紫光國(guó)芯在相關(guān)技術(shù)領(lǐng)域的儲(chǔ)備和突破。
以下內(nèi)容根據(jù)演講速記整理。
左豐國(guó):各位嘉賓,各位行業(yè)的朋友,非常榮幸接受邀請(qǐng)來參加FMW會(huì)議。我是來自西安紫光國(guó)芯的左豐國(guó)。西安紫光國(guó)芯是一家以DRAM技術(shù)為核心的產(chǎn)品和服務(wù)提供商。
今天我分享的題目是“用存儲(chǔ)系統(tǒng)結(jié)構(gòu)創(chuàng)新突破存儲(chǔ)墻”。
提起存儲(chǔ)墻這個(gè)問題,其實(shí)行業(yè)里的朋友都很清楚,它是一個(gè)由來已久的問題。從上個(gè)世紀(jì)80年代開始,處理器的性能基本上是按照每1.5年兩倍的速度向前演進(jìn),而存儲(chǔ)系統(tǒng)則是按照每10年兩倍的速度向前演進(jìn),最終出現(xiàn)的性能鴻溝表現(xiàn)為“存儲(chǔ)墻”問題。
今天,面對(duì)大數(shù)據(jù)大算力需求的情況下,僅僅談CPU處理器的算力顯然是不夠的。我們已經(jīng)進(jìn)入了一個(gè)大算力的時(shí)代,在過去的幾年里,我們每個(gè)人都見證了大模型數(shù)規(guī)模從千萬級(jí)別到千億級(jí)別的驚人增長(zhǎng)。同時(shí)也都感受了ChatGPT這個(gè)超級(jí)怪物的強(qiáng)大實(shí)力,它反映出的是大模型的落地。近年來,大模型帶來的算力需求是以每?jī)赡?50倍驚人的速度向前發(fā)展。作為當(dāng)前全世界算力芯片擔(dān)當(dāng)?shù)腘VIDIA公司,因?yàn)樗懔Ρㄐ孕枨笠苍趧?chuàng)造一個(gè)又一個(gè)歷史,它的市值在2020年首次超過了Intel,今年二季營(yíng)收135億美元,更是首次單季營(yíng)收超Intel。
可以說,算力時(shí)代帶來了太多意外和驚喜。
回到“存儲(chǔ)墻”話題。事實(shí)上,在大算力時(shí)代,存儲(chǔ)墻問題比以往任何時(shí)候都要凸顯。這個(gè)圖上列了兩個(gè)存儲(chǔ)基礎(chǔ)圖,上面講了HBM的發(fā)展趨勢(shì),下面講的是GDDR的發(fā)展趨勢(shì)??梢钥闯?,從2014年之后,算力芯片已經(jīng)切入到HBM賽道上,隨后HBM芯片一路飆升,今天HBM3已經(jīng)進(jìn)入量產(chǎn),但是頭部廠商依然覺得HBM3無法滿足需求。所以大家已經(jīng)開始討論HBM3E,說明在大算力時(shí)代存儲(chǔ)系統(tǒng)依然是算力系統(tǒng)拖后退的“人”,“存儲(chǔ)墻”問題依然很突出。
今天,我從兩個(gè)點(diǎn)分享自己關(guān)于突破“存儲(chǔ)墻”的思考。
在芯片級(jí),3D嵌入式DRAM技術(shù)是一個(gè)非常有潛力的技術(shù)?;仡櫼幌翯PU系統(tǒng)存儲(chǔ)方案的演進(jìn),左邊的圖可以看到典型的板級(jí)系統(tǒng),十年前GPU系統(tǒng)都是典型的平面結(jié)構(gòu),GPU芯片和GDDR芯片之間通過毫米級(jí)的連接進(jìn)行數(shù)據(jù)傳輸。2014年HBM器件進(jìn)入人們的視野,本質(zhì)上是2.5D封裝技術(shù)進(jìn)入到算力芯片領(lǐng)域。它的連接距離達(dá)到微米級(jí)別。按照這個(gè)趨勢(shì),采用3D異質(zhì)集成嵌入式技術(shù)在實(shí)現(xiàn)提升存儲(chǔ)性能方面有極大的幫助,可為算力系統(tǒng)提供上百TB級(jí)別的帶寬,同時(shí)在能效比、延遲上好于2.5D結(jié)構(gòu)的。整個(gè)存儲(chǔ)系統(tǒng)在結(jié)構(gòu)上,完成了從平面的2D到2.5D再到3D面的演進(jìn)。
西安紫光國(guó)芯提供成熟的三維異質(zhì)集成嵌入式DRAM技術(shù),可以提供數(shù)十到數(shù)百TB的超大帶寬,同時(shí)也是一種超低延遲、超低功耗的存儲(chǔ)方案。
目前西安紫光國(guó)芯在該技術(shù)上已經(jīng)做了比較多的積累,研發(fā)了三代產(chǎn)品。這三代產(chǎn)品不是替換關(guān)系,而是針對(duì)不同的細(xì)分領(lǐng)域。
第一代是實(shí)現(xiàn)一層邏輯和一層DRAM的堆疊;第二代實(shí)現(xiàn)一層邏輯和兩層DRAM的堆疊;今年推出的第三代產(chǎn)品實(shí)現(xiàn)了多層邏輯和多層的DRAM堆疊。這三代結(jié)構(gòu)被證明對(duì)于目前的大算力芯片在解決帶寬問題方面是非常好的對(duì)策。在設(shè)計(jì)的時(shí)候需要在代碼集成階段、在后端實(shí)現(xiàn)的階段把相應(yīng)的IP集成進(jìn)去,隨后關(guān)鍵點(diǎn)在于在拿到邏輯晶圓的時(shí)候做一個(gè)3D的堆疊,完成之后多張晶圓變成形式上的單張晶圓,再去做CP測(cè)試、封裝。這是在工程上非常容易實(shí)現(xiàn)的方案。
接下來分享的是從系統(tǒng)級(jí)對(duì)于突破存儲(chǔ)墻的思考。CXL技術(shù)本身一個(gè)開放性的互聯(lián)標(biāo)準(zhǔn),是Intel在2019年提出來的技術(shù)方案,隨后得到了行業(yè)上下游大廠的支持。從本質(zhì)上講CXL技術(shù)其實(shí)是為了解決處理器和設(shè)備之間如何實(shí)現(xiàn)存儲(chǔ)數(shù)據(jù)高速訪問的辦法,發(fā)展比較快,2019年提出來第一版,2022年第三版都已經(jīng)推出了。
從技術(shù)上,CXL設(shè)計(jì)的初衷有三個(gè)方面,一是實(shí)現(xiàn)智能網(wǎng)卡、加速卡的接口的形式存在;二是作為內(nèi)存一致性的接口存在;三是把CXL協(xié)議作為存儲(chǔ)模組或者器件的接口使用,這是在各個(gè)場(chǎng)景中跑的比較快的應(yīng)用。用CXL type 3器件來實(shí)現(xiàn)內(nèi)存的容量擴(kuò)展、帶寬擴(kuò)展。
CXL Type3如何實(shí)現(xiàn)內(nèi)存帶寬的擴(kuò)展?這個(gè)圖是一個(gè)典型的2DPC的方案,CPU旁邊還有8個(gè)X8的CXL接口,如果在這個(gè)方案里面把2DPC改成1DPC,插上另外的一組CXL,內(nèi)存容量保持不變但帶寬增加了。如果在現(xiàn)有的接口上插上CXL的設(shè)備,發(fā)現(xiàn)容量和帶寬均實(shí)現(xiàn)了拓展。
目前CXL Type3在設(shè)備接口和物理形態(tài)上已經(jīng)基本定型,比如接口物理層采用PCIe 5或6,物理形態(tài)上推薦度最高的是E3.S 1T或2T的形態(tài)。
西安紫光國(guó)芯是國(guó)內(nèi)比較早關(guān)注這個(gè)技術(shù)的公司,在2019年聯(lián)盟開放擴(kuò)容的時(shí)候第一時(shí)間加入了,并非常緊密的跟隨技術(shù)向前走,參與了標(biāo)準(zhǔn)和技術(shù)的討論。基于前面的積累,也發(fā)布了自己相關(guān)產(chǎn)品的路線圖,形成了自身CXL技術(shù)上的積累。
西安紫光國(guó)芯歷史比較久,前身為成立于2004年德國(guó)英飛凌西安研發(fā)中心的存儲(chǔ)事業(yè)部,2015年加入到紫光集團(tuán),是以DRAM(動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器)技術(shù)為核心的產(chǎn)品和服務(wù)提供商。作為以科技創(chuàng)新為驅(qū)動(dòng)的綜合性集成電路設(shè)計(jì)企業(yè),核心業(yè)務(wù)包括標(biāo)準(zhǔn)存儲(chǔ)芯片,模組和系統(tǒng)產(chǎn)品,嵌入式DRAM和存儲(chǔ)控制芯片,以及專用集成電路設(shè)計(jì)開發(fā)服務(wù)。
憑借領(lǐng)先的科技研發(fā)能力、豐富的設(shè)計(jì)測(cè)試量產(chǎn)經(jīng)驗(yàn)、完善的產(chǎn)品開發(fā)流程和嚴(yán)謹(jǐn)?shù)馁|(zhì)量管理體系,公司研發(fā)的DRAM存儲(chǔ)系列產(chǎn)品實(shí)現(xiàn)了包括DRAM KGD、DRAM顆粒、模組產(chǎn)品的全系列、全種類覆蓋,填補(bǔ)了國(guó)內(nèi)存儲(chǔ)器領(lǐng)域多項(xiàng)高端產(chǎn)品的空白。同時(shí),公司成功開發(fā)超大帶寬、超低功耗、超大容量嵌入式DRAM,多款搭載該技術(shù)的高性能SoC芯片產(chǎn)品已實(shí)現(xiàn)大規(guī)模量產(chǎn)和銷售。
紫光集團(tuán)創(chuàng)建于1988年,是具有全球競(jìng)爭(zhēng)力的領(lǐng)先智能科技產(chǎn)業(yè)集團(tuán),擁有覆蓋芯片半導(dǎo)體、信息通信基礎(chǔ)設(shè)施、云服務(wù)和數(shù)字化解決方案的廣泛產(chǎn)業(yè)布局,致力于成為數(shù)字經(jīng)濟(jì)時(shí)代科技創(chuàng)新的中堅(jiān)力量,推動(dòng)智能科技全產(chǎn)業(yè)鏈生態(tài)體系建設(shè)。
這是我報(bào)告的所有內(nèi)容,謝謝大家!
【編注:由DOIT傳媒主辦、杭州華瀾微電子股份有限公司協(xié)辦,以“芯存儲(chǔ) AI未來”為主題的2023閃存峰會(huì),由杭州市蕭山區(qū)人民政府、蕭山經(jīng)濟(jì)技術(shù)開發(fā)區(qū)管理委員會(huì)指導(dǎo),中國(guó)計(jì)算機(jī)學(xué)會(huì)信息存儲(chǔ)專委會(huì)、中國(guó)計(jì)算機(jī)行業(yè)協(xié)會(huì)信息存儲(chǔ)與安全專委會(huì)、武漢光電國(guó)家研究中心、浙江省半導(dǎo)體行業(yè)協(xié)會(huì)等單位支持?!?