AI 智能體的崛起對存儲系統(tǒng)提出了嚴苛要求:不僅需要處理 PB 級私域數(shù)據(jù)的高效存取,更要支撐實時推理的毫秒級響應(yīng)。復(fù)旦大學(xué)團隊研發(fā)的 “破曉” 皮秒閃存器件,擦寫速度達 400 皮秒,性能超越同技術(shù)節(jié)點下的 SRAM,為 AI 大模型提供了極速存儲支持。與此同時,江波龍等企業(yè)通過自研主控芯片和 PTM 全棧定制化服務(wù),構(gòu)建了從芯片設(shè)計到封裝測試的全鏈條解決方案,滿足智能穿戴、工業(yè)物聯(lián)網(wǎng)等場景的多樣化需求。這些技術(shù)突破印證了閃存作為 AI 時代 “數(shù)字基石” 的不可替代性。
在人工智能從通用大模型向行業(yè)智能體縱深發(fā)展的關(guān)鍵節(jié)點,2025全球閃存峰會(FMW 2025)的AI智能體與行業(yè)應(yīng)用論壇,正聚焦于一個核心命題——如何讓企業(yè)私域數(shù)據(jù)與大模型技術(shù)真正產(chǎn)生化學(xué)反應(yīng),催生能落地、可復(fù)用的行業(yè)智能解決方案。這不僅是大模型商業(yè)化的必由之路,更是存儲技術(shù)在AI時代實現(xiàn)價值重構(gòu)的重要戰(zhàn)場。
企業(yè)私域數(shù)據(jù)天然帶有行業(yè)屬性:金融機構(gòu)的交易日志蘊含風(fēng)險控制邏輯,制造企業(yè)的設(shè)備傳感器數(shù)據(jù)記錄著工藝參數(shù),醫(yī)療機構(gòu)的病歷文本藏著臨床決策經(jīng)驗。這些數(shù)據(jù)若想與大模型一體機深度結(jié)合,需突破三大技術(shù)關(guān)卡。
首先是數(shù)據(jù)異構(gòu)性壁壘,非結(jié)構(gòu)化的文檔、圖像、視頻等需通過向量化技術(shù)轉(zhuǎn)化為大模型可處理的語義單元,這要求存儲系統(tǒng)具備高效的多模態(tài)數(shù)據(jù)解析與索引能力,例如通過動態(tài)Embedding技術(shù)將企業(yè)知識庫轉(zhuǎn)化為高維向量空間,實現(xiàn)毫秒級的語義檢索。
其次是安全合規(guī)挑戰(zhàn),敏感數(shù)據(jù)的本地化處理需求(如醫(yī)療隱私、金融合規(guī))推動存儲架構(gòu)向“數(shù)據(jù)不動模型動”的聯(lián)邦學(xué)習(xí)模式演進,需要存儲系統(tǒng)提供全鏈路加密、權(quán)限細粒度管控等功能,確保數(shù)據(jù)“可用不可見”。
最后是算力協(xié)同效率瓶頸,大模型推理時對KV Cache的高頻訪問容易形成數(shù)據(jù)搬運瓶頸,而閃存的低延遲特性與分層存儲架構(gòu)(如顯存-內(nèi)存-閃存三級緩存體系)正成為破局關(guān)鍵,通過將熱數(shù)據(jù)駐留高速閃存、冷數(shù)據(jù)下沉低成本存儲介質(zhì),可顯著降低算力資源浪費,提升模型響應(yīng)速度。 ?
AI智能體對數(shù)據(jù)處理的實時性、規(guī)模性與多樣性要求,正重塑存儲技術(shù)的演進方向。傳統(tǒng)存儲“存得下、找得到”的基礎(chǔ)能力,已升級為“算得快、析得準”的核心競爭力。企業(yè)級SSD憑借微秒級延遲與百萬級IOPS,成為支撐大模型實時推理的標配,其智能化演進(如內(nèi)置AI算法預(yù)測訪問熱點、動態(tài)優(yōu)化數(shù)據(jù)布局)讓存儲不再是被動的后端載體,而是主動參與算力調(diào)度的智能單元。QLC閃存的成熟則改寫了成本與性能的平衡公式,其單位容量成本較TLC降低40%以上,使PB級私域數(shù)據(jù)的長期留存與深度挖掘成為可能,尤其適合構(gòu)建行業(yè)專屬的RAG知識庫——將歷史案例、操作規(guī)范等數(shù)據(jù)轉(zhuǎn)化為可被大模型調(diào)用的知識節(jié)點,形成“通用模型+領(lǐng)域數(shù)據(jù)”的雙輪驅(qū)動。
在更底層的技術(shù)架構(gòu)層面,RDMA(遠程直接數(shù)據(jù)存?。┡c并行文件系統(tǒng)的協(xié)同創(chuàng)新,正在打破“存儲墻”限制。通過RDMA技術(shù),計算節(jié)點可直接訪問存儲設(shè)備中的數(shù)據(jù),避免傳統(tǒng)網(wǎng)絡(luò)傳輸?shù)钠款i,使GPU集群的算力利用率從30%提升至70%以上;而龍存LoongStore等并行文件系統(tǒng)通過分布式架構(gòu)實現(xiàn)EB級數(shù)據(jù)的高效管理,支持數(shù)千節(jié)點并發(fā)訪問,為工業(yè)AI中的產(chǎn)線實時監(jiān)控、醫(yī)療AI中的影像批量處理等場景提供了底層支撐。這些技術(shù)的融合,讓存儲系統(tǒng)從“數(shù)據(jù)管道”進化為“智能引擎”,直接參與AI模型的訓(xùn)練與推理過程。
此次論壇搭建技術(shù)供給與行業(yè)需求的對話橋梁,當技術(shù)專家探討NAND閃存制程突破(如3D堆疊層數(shù)邁向300層)如何提升存儲密度時,企業(yè)用戶更關(guān)心如何將這些技術(shù)轉(zhuǎn)化為智能客服的響應(yīng)速度提升;當學(xué)者分析向量化存儲對RAG系統(tǒng)的優(yōu)化原理時,金融機構(gòu)關(guān)注的是如何在合規(guī)框架下構(gòu)建風(fēng)險預(yù)警智能體。論壇將圍繞這些現(xiàn)實需求,解析存儲技術(shù)如何適配行業(yè)場景:例如在智能客服領(lǐng)域,通過閃存的高速讀寫能力實現(xiàn)用戶歷史對話數(shù)據(jù)的實時調(diào)取,結(jié)合大模型的上下文理解能力,讓客服系統(tǒng)從“關(guān)鍵詞匹配”升級為“意圖預(yù)測”;在制造領(lǐng)域,利用KVCache技術(shù)緩存設(shè)備實時數(shù)據(jù),通過大模型分析工藝參數(shù)異常,實現(xiàn)產(chǎn)線故障的預(yù)判與自優(yōu)化。 ?
結(jié)語:數(shù)據(jù)“存力”覺醒,激活智能體無限可能 ?
AI智能體的行業(yè)落地,本質(zhì)是“技術(shù)理性”與“行業(yè)經(jīng)驗”的深度融合。私域數(shù)據(jù)是行業(yè)經(jīng)驗的數(shù)字化載體,大模型是釋放數(shù)據(jù)價值的智能引擎,而存儲技術(shù)則是連接兩者的神經(jīng)中樞。2025全球閃存峰會的AI智能體與行業(yè)應(yīng)用論壇,正通過解構(gòu)技術(shù)細節(jié)、剖析場景痛點、展望融合路徑,為企業(yè)智能化轉(zhuǎn)型提供“從理念到落地”的完整圖譜。當存儲不再是幕后的“數(shù)據(jù)倉庫”,而是臺前的“智能伙伴”,AI與行業(yè)的融合將真正突破“概念層”,在千行百業(yè)生根發(fā)芽。7月9日,南京金陵飯店,這場關(guān)于“存力”與“智能”的對話,值得每一個期待技術(shù)落地的從業(yè)者共同參與。
【峰會信息】