文字編輯|李祥敬

1

算力躍遷倒逼存力革命

在AI蓬勃發(fā)展的當(dāng)下,算力的迅猛提升使得存力必須加速變革才能與之匹配。以ChatGPT為代表的大語(yǔ)言模型訓(xùn)練,需要處理海量的數(shù)據(jù),其對(duì)算力的需求呈指數(shù)級(jí)增長(zhǎng),這同時(shí)也給存儲(chǔ)系統(tǒng)帶來(lái)了巨大壓力。數(shù)據(jù)顯示,ChatGPT訓(xùn)練一次所產(chǎn)生的數(shù)據(jù)量高達(dá)PB級(jí),如此龐大的數(shù)據(jù)讀寫與存儲(chǔ),傳統(tǒng)的存儲(chǔ)技術(shù)根本無(wú)法滿足。在這種背景下,存儲(chǔ)技術(shù)的進(jìn)化路徑呈現(xiàn)出多維度的突破:1、性能突破:HBM(高帶寬內(nèi)存)技術(shù)不斷迭代,HBM3E內(nèi)存帶寬突破1TB/s,為數(shù)據(jù)的快速傳輸提供了有力保障。三星計(jì)劃2025年推出的HBM4,其數(shù)據(jù)傳輸速率將進(jìn)一步提升至9.8Gbps,這意味著在相同時(shí)間內(nèi)可以傳輸更多的數(shù)據(jù),大大提高了數(shù)據(jù)處理效率。在NAND閃存方面,QLC NAND通過(guò)321層堆疊技術(shù)實(shí)現(xiàn)了128TB SSD的量產(chǎn)。這種高密度的存儲(chǔ)方式,不僅可以在有限的空間內(nèi)存儲(chǔ)更多數(shù)據(jù),而且也滿足了AI訓(xùn)練對(duì)大容量存儲(chǔ)的迫切需求。以字節(jié)跳動(dòng)的云存儲(chǔ)業(yè)務(wù)為例,采用了這種高密度的SSD后,存儲(chǔ)成本降低了30%,同時(shí)存儲(chǔ)容量提升了50%。2、架構(gòu)創(chuàng)新:存算一體架構(gòu)成為當(dāng)前研究和應(yīng)用的熱點(diǎn)。傳統(tǒng)的馮·諾依曼架構(gòu)存在數(shù)據(jù)搬移的瓶頸,數(shù)據(jù)在存儲(chǔ)單元和計(jì)算單元之間來(lái)回傳輸,消耗了大量的時(shí)間和能源。存算一體架構(gòu)則將存儲(chǔ)和計(jì)算功能相結(jié)合,減少了數(shù)據(jù)搬移的時(shí)間和能耗。華為的FusionCube A3000訓(xùn)推一體機(jī)采用存算一體架構(gòu),通過(guò)將計(jì)算資源和存儲(chǔ)資源緊密結(jié)合,使得GPU利用率從傳統(tǒng)架構(gòu)的40%提升至70%以上,大大提高了計(jì)算效率。CXL(Compute Express Link)技術(shù)的出現(xiàn),實(shí)現(xiàn)了內(nèi)存與存儲(chǔ)的統(tǒng)一尋址。美光的PCIe 6.0 SSD結(jié)合Astera Labs交換機(jī),能夠直接與GPU內(nèi)存進(jìn)行通信,這就消除了CPU緩存帶來(lái)的瓶頸,使得數(shù)據(jù)可以更快速地在存儲(chǔ)和計(jì)算單元之間流動(dòng),進(jìn)一步提升了系統(tǒng)的整體性能。3、綠色轉(zhuǎn)型:隨著數(shù)據(jù)中心規(guī)模的不斷擴(kuò)大,能源消耗成為一個(gè)重要問(wèn)題。存儲(chǔ)設(shè)備作為數(shù)據(jù)中心的重要組成部分,其能耗也備受關(guān)注。長(zhǎng)江存儲(chǔ)的Xtacking 4.0架構(gòu),通過(guò)技術(shù)創(chuàng)新使QLC閃存的耐久度提升了33%。這意味著存儲(chǔ)設(shè)備的使用壽命更長(zhǎng),減少了因設(shè)備老化而需要更換的頻率,從而降低了能源消耗和成本。宇瞻的CoreEnergy節(jié)能技術(shù),通過(guò)優(yōu)化存儲(chǔ)設(shè)備的電源管理,降低了SSD功耗20%。萬(wàn)潤(rùn)科技推出的低功耗存儲(chǔ)方案,在滿足終端設(shè)備存儲(chǔ)需求的同時(shí),推動(dòng)了終端設(shè)備的能效優(yōu)化,為實(shí)現(xiàn)綠色數(shù)據(jù)中心和可持續(xù)發(fā)展做出了貢獻(xiàn)。

2

存力重構(gòu)算力生態(tài)

存儲(chǔ)技術(shù)的革新不僅僅是自身的發(fā)展,更重要的是它正在重塑AI算力的應(yīng)用場(chǎng)景,推動(dòng)整個(gè)算力生態(tài)的重構(gòu):1、邊緣智能:在自動(dòng)駕駛領(lǐng)域,車輛在行駛過(guò)程中每小時(shí)會(huì)產(chǎn)生高達(dá)10TB的數(shù)據(jù)。如果將這些數(shù)據(jù)全部傳輸?shù)皆贫诉M(jìn)行處理,不僅會(huì)面臨網(wǎng)絡(luò)帶寬的限制,而且還會(huì)產(chǎn)生較大的延遲,無(wú)法滿足自動(dòng)駕駛對(duì)實(shí)時(shí)性的要求。邊緣存儲(chǔ)技術(shù)的出現(xiàn)解決了這一難題,通過(guò)在車輛本地進(jìn)行數(shù)據(jù)緩存和實(shí)時(shí)處理,可以將數(shù)據(jù)傳輸量減少90%,滿足L4級(jí)自動(dòng)駕駛對(duì)響應(yīng)時(shí)間在毫秒級(jí)的嚴(yán)格需求。隨著AI手機(jī)和PC的普及,端側(cè)存儲(chǔ)的重要性日益凸顯。LPDDR5X內(nèi)存的容量在AI應(yīng)用的推動(dòng)下增長(zhǎng)了50%-100%,這使得手機(jī)和PC能夠在本地處理更復(fù)雜的AI任務(wù),如語(yǔ)音識(shí)別、圖像識(shí)別等,實(shí)現(xiàn)了算力的下沉,提升了用戶體驗(yàn)。2、數(shù)據(jù)中心:AI服務(wù)器對(duì)存儲(chǔ)的需求呈現(xiàn)爆發(fā)式增長(zhǎng),年增長(zhǎng)率高達(dá)107%。32TB QLC SSD憑借其大容量和相對(duì)較低的成本,已經(jīng)占據(jù)了服務(wù)器存儲(chǔ)45%的產(chǎn)能。HBM3E在AI芯片中的滲透率預(yù)計(jì)突破85%,成為AI芯片的關(guān)鍵組件。分布式存儲(chǔ)系統(tǒng)如GooseFS,通過(guò)在計(jì)算端設(shè)置緩存和優(yōu)化元數(shù)據(jù)管理,將對(duì)象存儲(chǔ)的讀寫性能提升了3倍以上。這使得數(shù)據(jù)中心在處理大規(guī)模AI任務(wù)時(shí),能夠更高效地獲取和存儲(chǔ)數(shù)據(jù),提高了整體的算力水平。3、科學(xué)計(jì)算:千卡級(jí)AI集群在運(yùn)行過(guò)程中面臨著內(nèi)存故障的挑戰(zhàn),每3-4小時(shí)就可能出現(xiàn)一次內(nèi)存故障。這不僅會(huì)導(dǎo)致計(jì)算任務(wù)中斷,還會(huì)造成數(shù)據(jù)丟失和計(jì)算資源的浪費(fèi)。華為通過(guò)研發(fā)內(nèi)存主動(dòng)容錯(cuò)技術(shù),能夠在內(nèi)存出現(xiàn)故障時(shí)快速進(jìn)行修復(fù)和數(shù)據(jù)恢復(fù),將訓(xùn)練中斷恢復(fù)時(shí)間從24小時(shí)大幅縮短至2小時(shí)。美光的HBM錯(cuò)誤預(yù)測(cè)框架Calchas,通過(guò)對(duì)4.6億次錯(cuò)誤事件的分析和學(xué)習(xí),實(shí)現(xiàn)了故障預(yù)測(cè)準(zhǔn)確率提升40%。這使得在內(nèi)存故障發(fā)生前,系統(tǒng)能夠及時(shí)采取措施,避免計(jì)算任務(wù)的中斷,保障了科學(xué)計(jì)算的穩(wěn)定性和可靠性。

3

2025全球閃存峰會(huì):開(kāi)啟存力覺(jué)醒時(shí)代

作為存儲(chǔ)行業(yè)年度盛會(huì),本屆峰會(huì)將呈現(xiàn)諸多亮點(diǎn):新一代閃存與AI智能體的契合探索——AI智能體產(chǎn)品解決方案的全方位展示;AI智能體構(gòu)建過(guò)程中,私域數(shù)據(jù)與AI大模型相結(jié)合的方法;AI智能體對(duì)于算力、存儲(chǔ)、運(yùn)力基礎(chǔ)設(shè)施的需求;新一代閃存技術(shù)發(fā)展與AI智能體需求的契合程度;都在2025全球閃存峰會(huì)上得到一一揭示,實(shí)現(xiàn)行業(yè)企業(yè)用戶零距離。發(fā)布《2025存儲(chǔ)芯圖》:覆蓋閃存關(guān)鍵領(lǐng)域——峰會(huì)期間發(fā)布2025閃存產(chǎn)業(yè)數(shù)據(jù)庫(kù)與全景圖——《2025存儲(chǔ)芯圖》;覆蓋閃存介質(zhì)、內(nèi)存介質(zhì)、SSD控制器、閃存模組、陣列控制器及存儲(chǔ)系統(tǒng)等關(guān)鍵領(lǐng)域, 內(nèi)容齊全,分類清晰;同時(shí),提供在線小程序數(shù)據(jù)庫(kù),支持動(dòng)態(tài)查詢,掌握最新信息。應(yīng)對(duì)數(shù)據(jù)訪存墻挑戰(zhàn),為技術(shù)產(chǎn)品選型提供參考——HBM、GDDR、PCIe、CXL等技術(shù),都在攻克數(shù)據(jù)訪存墻難題;不同技術(shù),解題思路有別,市場(chǎng)成熟度各異,應(yīng)用場(chǎng)景和價(jià)值點(diǎn)也大不相同;把握產(chǎn)業(yè)新機(jī)遇,挑對(duì)技術(shù)產(chǎn)品,考驗(yàn)用戶眼光;“CXL技術(shù)應(yīng)用俱樂(lè)部” 將舉辦論壇專場(chǎng),全方位剖析數(shù)據(jù)訪存墻問(wèn)題。閃存風(fēng)云榜 挖掘前沿樹(shù)標(biāo)桿——2025年度閃存風(fēng)云榜發(fā)布,自2014年起,DOIT每年在全球閃存峰會(huì)期間舉辦“閃存風(fēng)云榜”評(píng)選,旨在挖掘前沿技術(shù)與應(yīng)用,樹(shù)立行業(yè)標(biāo)桿,推動(dòng)創(chuàng)新發(fā)展;該評(píng)選由專家評(píng)審組及DOIT資深編輯團(tuán)隊(duì)嚴(yán)格篩選;榜單將在峰會(huì)現(xiàn)場(chǎng)、活動(dòng)官網(wǎng)及DOIT官方微信公眾號(hào)等平臺(tái)同步公布。

結(jié)語(yǔ)

在算力與存力深度耦合的2025年,存儲(chǔ)技術(shù)進(jìn)化為人工智能發(fā)展的”核心引擎”。7月9日南京,2025全球閃存峰會(huì)將匯聚行業(yè)領(lǐng)袖,共同解鎖存力密碼,為AI注入新動(dòng)能。立即登錄峰會(huì)官網(wǎng)(www.flashmemoryworld.com),搶占技術(shù)先機(jī),共赴這場(chǎng)存儲(chǔ)革命的饕餮盛宴!

分享到

lixiangjing

算力豹主編

相關(guān)推薦