生成式AI的爆發(fā),首先是一個(gè)數(shù)據(jù)總量與處理方式改變的問題。無論是文本生成、圖像合成還是多模態(tài)大模型,其底層都依賴海量異構(gòu)數(shù)據(jù)和高頻訪問的存儲(chǔ)支持。
過去訓(xùn)練階段以“順序讀寫、離線處理”為主,但今天的大模型迭代更強(qiáng)調(diào):
這意味著:
簡而言之,生成式AI將“讀多寫少”的AI存儲(chǔ)模型推向極限,高性能、分層調(diào)度、低延遲成為基礎(chǔ)要求。
如果說生成式AI需要的是“高效的數(shù)據(jù)加載”,那么智能體時(shí)代(Agentic AI)則提出了一個(gè)更復(fù)雜的命題:“持久、可追溯、可互動(dòng)”的數(shù)據(jù)與行為記錄系統(tǒng)。
智能體不同于傳統(tǒng)模型調(diào)用,其核心特征是:
這對(duì)存儲(chǔ)系統(tǒng)提出了四類全新要求:
這意味著:傳統(tǒng)以“模型調(diào)度”為核心的數(shù)據(jù)架構(gòu),必須升級(jí)為以“行為持久化與交互協(xié)同”為目標(biāo)的Agent-native存儲(chǔ)體系。
結(jié)合上述生成式AI和智能體雙向演進(jìn),我們認(rèn)為未來AI基礎(chǔ)設(shè)施中的“存儲(chǔ)底座”需具備以下六大核心能力:
支持上萬個(gè)模型/Agent的同時(shí)調(diào)用,讀寫IOPS數(shù)量級(jí)需上升兩個(gè)維度。
支持大規(guī)模并行訓(xùn)練與推理任務(wù)的靈活擴(kuò)展,適配GPU集群與邊緣節(jié)點(diǎn)部署。
自動(dòng)識(shí)別數(shù)據(jù)冷熱,動(dòng)態(tài)遷移至不同介質(zhì)(高性能SSD/QLC/磁帶等),優(yōu)化成本與訪問效率。
同時(shí)支撐AI數(shù)據(jù)湖、推理緩存、日志寫入等多種數(shù)據(jù)類型。
實(shí)時(shí)掌握數(shù)據(jù)流動(dòng)與存儲(chǔ)瓶頸,配合AIOps實(shí)現(xiàn)資源智能分配。
在多Agent/多模型/跨域部署場(chǎng)景下,確保數(shù)據(jù)隔離、訪問審計(jì)與隱私保護(hù)。
我們正在步入一個(gè)模型不再“冷啟動(dòng)”,而是持續(xù)運(yùn)行、動(dòng)態(tài)演化的AI時(shí)代。生成式AI讓算力成為焦點(diǎn),但智能體的興起正在讓“存力”成為關(guān)鍵支柱。
在這個(gè)過程中,存儲(chǔ)不再只是數(shù)據(jù)倉庫或緩存中轉(zhuǎn)站,而是變成了支撐AI行為邏輯、決策協(xié)同與知識(shí)記憶的核心基礎(chǔ)設(shè)施。未來真正強(qiáng)大的AI系統(tǒng),不僅要擁有強(qiáng)算力,更需要一套“懂行為、會(huì)協(xié)作、有記憶”的存儲(chǔ)體系。
以“釋放數(shù)據(jù)潛能,加速智能涌現(xiàn)”為主題的2025中國數(shù)據(jù)與存儲(chǔ)峰會(huì)將于11月18日在北京舉行,共探AI時(shí)代的數(shù)據(jù)基礎(chǔ)設(shè)施演進(jìn)、存儲(chǔ)技術(shù)創(chuàng)新、智能應(yīng)用實(shí)踐及未來發(fā)展趨勢(shì),迎接智能時(shí)代新機(jī)遇。