文字編輯|李祥敬
1
算力躍遷倒逼存力革命
在AI蓬勃發(fā)展的當下,算力的迅猛提升使得存力必須加速變革才能與之匹配。以ChatGPT為代表的大語言模型訓練,需要處理海量的數(shù)據(jù),其對算力的需求呈指數(shù)級增長,這同時也給存儲系統(tǒng)帶來了巨大壓力。數(shù)據(jù)顯示,ChatGPT訓練一次所產生的數(shù)據(jù)量高達PB級,如此龐大的數(shù)據(jù)讀寫與存儲,傳統(tǒng)的存儲技術根本無法滿足。在這種背景下,存儲技術的進化路徑呈現(xiàn)出多維度的突破:1、性能突破:HBM(高帶寬內存)技術不斷迭代,HBM3E內存帶寬突破1TB/s,為數(shù)據(jù)的快速傳輸提供了有力保障。三星計劃2025年推出的HBM4,其數(shù)據(jù)傳輸速率將進一步提升至9.8Gbps,這意味著在相同時間內可以傳輸更多的數(shù)據(jù),大大提高了數(shù)據(jù)處理效率。在NAND閃存方面,QLC NAND通過321層堆疊技術實現(xiàn)了128TB SSD的量產。這種高密度的存儲方式,不僅可以在有限的空間內存儲更多數(shù)據(jù),而且也滿足了AI訓練對大容量存儲的迫切需求。以字節(jié)跳動的云存儲業(yè)務為例,采用了這種高密度的SSD后,存儲成本降低了30%,同時存儲容量提升了50%。2、架構創(chuàng)新:存算一體架構成為當前研究和應用的熱點。傳統(tǒng)的馮·諾依曼架構存在數(shù)據(jù)搬移的瓶頸,數(shù)據(jù)在存儲單元和計算單元之間來回傳輸,消耗了大量的時間和能源。存算一體架構則將存儲和計算功能相結合,減少了數(shù)據(jù)搬移的時間和能耗。華為的FusionCube A3000訓推一體機采用存算一體架構,通過將計算資源和存儲資源緊密結合,使得GPU利用率從傳統(tǒng)架構的40%提升至70%以上,大大提高了計算效率。CXL(Compute Express Link)技術的出現(xiàn),實現(xiàn)了內存與存儲的統(tǒng)一尋址。美光的PCIe 6.0 SSD結合Astera Labs交換機,能夠直接與GPU內存進行通信,這就消除了CPU緩存帶來的瓶頸,使得數(shù)據(jù)可以更快速地在存儲和計算單元之間流動,進一步提升了系統(tǒng)的整體性能。3、綠色轉型:隨著數(shù)據(jù)中心規(guī)模的不斷擴大,能源消耗成為一個重要問題。存儲設備作為數(shù)據(jù)中心的重要組成部分,其能耗也備受關注。長江存儲的Xtacking 4.0架構,通過技術創(chuàng)新使QLC閃存的耐久度提升了33%。這意味著存儲設備的使用壽命更長,減少了因設備老化而需要更換的頻率,從而降低了能源消耗和成本。宇瞻的CoreEnergy節(jié)能技術,通過優(yōu)化存儲設備的電源管理,降低了SSD功耗20%。萬潤科技推出的低功耗存儲方案,在滿足終端設備存儲需求的同時,推動了終端設備的能效優(yōu)化,為實現(xiàn)綠色數(shù)據(jù)中心和可持續(xù)發(fā)展做出了貢獻。
2
存力重構算力生態(tài)
存儲技術的革新不僅僅是自身的發(fā)展,更重要的是它正在重塑AI算力的應用場景,推動整個算力生態(tài)的重構:1、邊緣智能:在自動駕駛領域,車輛在行駛過程中每小時會產生高達10TB的數(shù)據(jù)。如果將這些數(shù)據(jù)全部傳輸?shù)皆贫诉M行處理,不僅會面臨網(wǎng)絡帶寬的限制,而且還會產生較大的延遲,無法滿足自動駕駛對實時性的要求。邊緣存儲技術的出現(xiàn)解決了這一難題,通過在車輛本地進行數(shù)據(jù)緩存和實時處理,可以將數(shù)據(jù)傳輸量減少90%,滿足L4級自動駕駛對響應時間在毫秒級的嚴格需求。隨著AI手機和PC的普及,端側存儲的重要性日益凸顯。LPDDR5X內存的容量在AI應用的推動下增長了50%-100%,這使得手機和PC能夠在本地處理更復雜的AI任務,如語音識別、圖像識別等,實現(xiàn)了算力的下沉,提升了用戶體驗。2、數(shù)據(jù)中心:AI服務器對存儲的需求呈現(xiàn)爆發(fā)式增長,年增長率高達107%。32TB QLC SSD憑借其大容量和相對較低的成本,已經占據(jù)了服務器存儲45%的產能。HBM3E在AI芯片中的滲透率預計突破85%,成為AI芯片的關鍵組件。分布式存儲系統(tǒng)如GooseFS,通過在計算端設置緩存和優(yōu)化元數(shù)據(jù)管理,將對象存儲的讀寫性能提升了3倍以上。這使得數(shù)據(jù)中心在處理大規(guī)模AI任務時,能夠更高效地獲取和存儲數(shù)據(jù),提高了整體的算力水平。3、科學計算:千卡級AI集群在運行過程中面臨著內存故障的挑戰(zhàn),每3-4小時就可能出現(xiàn)一次內存故障。這不僅會導致計算任務中斷,還會造成數(shù)據(jù)丟失和計算資源的浪費。華為通過研發(fā)內存主動容錯技術,能夠在內存出現(xiàn)故障時快速進行修復和數(shù)據(jù)恢復,將訓練中斷恢復時間從24小時大幅縮短至2小時。美光的HBM錯誤預測框架Calchas,通過對4.6億次錯誤事件的分析和學習,實現(xiàn)了故障預測準確率提升40%。這使得在內存故障發(fā)生前,系統(tǒng)能夠及時采取措施,避免計算任務的中斷,保障了科學計算的穩(wěn)定性和可靠性。
3
2025全球閃存峰會:開啟存力覺醒時代
作為存儲行業(yè)年度盛會,本屆峰會將呈現(xiàn)諸多亮點:新一代閃存與AI智能體的契合探索——AI智能體產品解決方案的全方位展示;AI智能體構建過程中,私域數(shù)據(jù)與AI大模型相結合的方法;AI智能體對于算力、存儲、運力基礎設施的需求;新一代閃存技術發(fā)展與AI智能體需求的契合程度;都在2025全球閃存峰會上得到一一揭示,實現(xiàn)行業(yè)企業(yè)用戶零距離。發(fā)布《2025存儲芯圖》:覆蓋閃存關鍵領域——峰會期間發(fā)布2025閃存產業(yè)數(shù)據(jù)庫與全景圖——《2025存儲芯圖》;覆蓋閃存介質、內存介質、SSD控制器、閃存模組、陣列控制器及存儲系統(tǒng)等關鍵領域, 內容齊全,分類清晰;同時,提供在線小程序數(shù)據(jù)庫,支持動態(tài)查詢,掌握最新信息。應對數(shù)據(jù)訪存墻挑戰(zhàn),為技術產品選型提供參考——HBM、GDDR、PCIe、CXL等技術,都在攻克數(shù)據(jù)訪存墻難題;不同技術,解題思路有別,市場成熟度各異,應用場景和價值點也大不相同;把握產業(yè)新機遇,挑對技術產品,考驗用戶眼光;“CXL技術應用俱樂部” 將舉辦論壇專場,全方位剖析數(shù)據(jù)訪存墻問題。閃存風云榜 挖掘前沿樹標桿——2025年度閃存風云榜發(fā)布,自2014年起,DOIT每年在全球閃存峰會期間舉辦“閃存風云榜”評選,旨在挖掘前沿技術與應用,樹立行業(yè)標桿,推動創(chuàng)新發(fā)展;該評選由專家評審組及DOIT資深編輯團隊嚴格篩選;榜單將在峰會現(xiàn)場、活動官網(wǎng)及DOIT官方微信公眾號等平臺同步公布。
結語
在算力與存力深度耦合的2025年,存儲技術進化為人工智能發(fā)展的”核心引擎”。7月9日南京,2025全球閃存峰會將匯聚行業(yè)領袖,共同解鎖存力密碼,為AI注入新動能。立即登錄峰會官網(wǎng)(www.flashmemoryworld.com),搶占技術先機,共赴這場存儲革命的饕餮盛宴!