從2025年來(lái)看,AI與數(shù)據(jù)存儲(chǔ)的關(guān)系已經(jīng)發(fā)生了變化。原本存儲(chǔ)只是支持AI工作負(fù)載運(yùn)行的數(shù)據(jù)基礎(chǔ)設(shè)施,在現(xiàn)在的實(shí)踐中,兩者已經(jīng)升級(jí)成了一種相互促進(jìn),相互成就的共生關(guān)系。

一方面,如今的AI不僅是存儲(chǔ)系統(tǒng)支撐的一種負(fù)載,也逐漸成為存儲(chǔ)系統(tǒng)的核心智能組件。另一方面,存儲(chǔ)系統(tǒng)所提供的海量高質(zhì)量數(shù)據(jù),以及對(duì)數(shù)據(jù)管理能力,已成為決定AI模型成敗的關(guān)鍵因素之一,存儲(chǔ)系統(tǒng)本身也在發(fā)生變化。

首先,AI正在為數(shù)據(jù)存儲(chǔ)注入智能能力

通過(guò)AIOps技術(shù),存儲(chǔ)基礎(chǔ)設(shè)施獲得了更高的自動(dòng)化管理水平。AI不僅能夠預(yù)測(cè)硬件故障、自動(dòng)診斷性能瓶頸,還能智能優(yōu)化資源分配,將人工運(yùn)維從繁瑣的被動(dòng)響應(yīng)中解放出來(lái)。

AIOps超越了基于規(guī)則的被動(dòng)式IT管理模式,利用先進(jìn)算法分析海量的數(shù)據(jù)流,從而識(shí)別出人眼難以察覺(jué)的復(fù)雜模式和異常行為。這種方式,使得IT運(yùn)營(yíng)從被動(dòng)響應(yīng),轉(zhuǎn)變?yōu)橹鲃?dòng)預(yù)測(cè)和預(yù)防。

通過(guò)對(duì)歷史數(shù)據(jù)和實(shí)時(shí)傳感器數(shù)據(jù)的學(xué)習(xí),能夠在設(shè)備發(fā)生故障前提前預(yù)警。比如,AI能夠持續(xù)分析SSD內(nèi)置的SMART信息,從而預(yù)測(cè)SSD的剩余壽命,然后在出現(xiàn)問(wèn)題前有計(jì)劃地進(jìn)行更換,從而避免不必要的問(wèn)題。

現(xiàn)代IT環(huán)境的復(fù)雜性使得故障排查變得異常困難,而AIOps平臺(tái)能夠從整個(gè)IT堆棧中采集并關(guān)聯(lián)數(shù)據(jù),自動(dòng)診斷性能下降或服務(wù)中斷的根本原因。它的優(yōu)勢(shì)在于能迅速定位問(wèn)題源頭,而無(wú)需工程師手動(dòng)在數(shù)不清的監(jiān)控系統(tǒng)里排查。

類似的,傳統(tǒng)監(jiān)控系統(tǒng)常常產(chǎn)生大量低價(jià)值的告警,導(dǎo)致運(yùn)維團(tuán)隊(duì)進(jìn)入告警疲勞狀態(tài)。而AIOps能將數(shù)千個(gè)相關(guān)告警進(jìn)行聚合,形成一個(gè)具有明確根源和影響范圍的核心事件,從而大幅縮短平均解決時(shí)間。

基于AIOps進(jìn)行資源優(yōu)化與容量規(guī)劃也非常實(shí)用。通過(guò)分析資源使用模式,AIOps能夠預(yù)測(cè)需求,幫助企業(yè)更精準(zhǔn)地規(guī)劃,避免浪費(fèi)。在存儲(chǔ)管理中,AIOps能根據(jù)數(shù)據(jù)的實(shí)際訪問(wèn)頻率自動(dòng)遷移數(shù)據(jù)到成本更低的存儲(chǔ)層,從而降低存儲(chǔ)開(kāi)支。

除此之外,由機(jī)器學(xué)習(xí)增強(qiáng)的壓縮與去重以及異常安全行為檢測(cè),都在極大的提升存儲(chǔ)的成本效益和安全性??傊?,有了AI之后,存儲(chǔ)系統(tǒng)正從一個(gè)被動(dòng)的數(shù)據(jù)大倉(cāng)庫(kù)轉(zhuǎn)變?yōu)橐粋€(gè)具備自我管理和自我保護(hù)能力的智能數(shù)據(jù)平臺(tái)。

其次,數(shù)據(jù)存儲(chǔ)行業(yè)正在面向AI進(jìn)行自我重塑

Garbage In, Garbage Out,這句古老格言在AI時(shí)代被賦予了新的內(nèi)涵——低質(zhì)量的數(shù)據(jù)是導(dǎo)致AI項(xiàng)目失敗的重要原因。于是,為了滿足AI對(duì)數(shù)據(jù)在規(guī)模、性能和多樣性上的要求,數(shù)據(jù)存儲(chǔ)系統(tǒng)的架構(gòu)、存儲(chǔ)硬件和數(shù)據(jù)管理范式都有新的要求。

首先,數(shù)據(jù)規(guī)模的重要性不難理解,數(shù)據(jù)的規(guī)模直接決定了AI的能力上限。數(shù)據(jù)越大,模型能學(xué)到的模式和細(xì)節(jié)就越豐富,訓(xùn)練出的AI也更精準(zhǔn)、更智能。同時(shí),大規(guī)模數(shù)據(jù)還能覆蓋更多場(chǎng)景,避免模型產(chǎn)生偏差。

同時(shí),數(shù)據(jù)的多樣性對(duì)AI表現(xiàn)的影響也非常大。比如,早期的面部識(shí)別系統(tǒng)主要使用白人面孔訓(xùn)練,導(dǎo)致其在識(shí)別深色皮膚個(gè)體時(shí)準(zhǔn)確率極低。因此,一個(gè)強(qiáng)大的AI模型必須在多元化的數(shù)據(jù)上進(jìn)行訓(xùn)練。

存儲(chǔ)系統(tǒng)需要規(guī)模龐大的、多種多樣的數(shù)據(jù),存儲(chǔ)架構(gòu)也需要發(fā)生變化。從數(shù)據(jù)存儲(chǔ)架構(gòu)的趨勢(shì)來(lái)看,當(dāng)前,存儲(chǔ)架構(gòu)正從孤立的數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)湖,轉(zhuǎn)向統(tǒng)一的數(shù)據(jù)湖倉(cāng)一體化的架構(gòu)。

這是因?yàn)?,原本企業(yè)通常維護(hù)兩套數(shù)據(jù)系統(tǒng),一個(gè)是用于支持BI和報(bào)表的數(shù)據(jù)倉(cāng)庫(kù),里面存的是結(jié)構(gòu)化數(shù)據(jù)。另一套是用于數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的數(shù)據(jù)湖,里面都是非結(jié)構(gòu)化數(shù)據(jù)。這種雙層架構(gòu)導(dǎo)致了嚴(yán)重的數(shù)據(jù)孤島問(wèn)題,系統(tǒng)間進(jìn)行ETL會(huì)有很多問(wèn)題。

數(shù)據(jù)湖倉(cāng)一體將數(shù)據(jù)湖與數(shù)據(jù)倉(cāng)庫(kù)結(jié)合在了一起,它統(tǒng)一了結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),它消除了數(shù)據(jù)孤島,為企業(yè)創(chuàng)建了一個(gè)單一的可信數(shù)據(jù)源,減少了因數(shù)據(jù)冗余帶來(lái)的成本和管理開(kāi)銷,也加速了從數(shù)據(jù)到模型再到洞察的迭代進(jìn)程。

在硬件層面,一方面,以NVMe SSD為代表的高性能存儲(chǔ)層,可以最大化GPU的利用率。另一方面,以大容量HDD和磁帶為代表的高容量存儲(chǔ)層,則以極低的單位成本存儲(chǔ)海量訓(xùn)練數(shù)據(jù)。

為了更好地服務(wù)于AI數(shù)據(jù)存儲(chǔ)的I/O模式,市場(chǎng)上出現(xiàn)了“AI原生”的存儲(chǔ)平臺(tái)。這類平臺(tái)強(qiáng)調(diào)大規(guī)模并行與可擴(kuò)展性、極致的低延遲、與AI生態(tài)的深度集成、對(duì)統(tǒng)一多協(xié)議訪問(wèn)的支持。

AI與數(shù)據(jù)存儲(chǔ)之間形成了一個(gè)牢固創(chuàng)新循環(huán)

我們看到,AI與數(shù)據(jù)存儲(chǔ)之間形成了一個(gè)創(chuàng)新循環(huán),這一個(gè)創(chuàng)新循環(huán)能帶來(lái)哪些價(jià)值呢?

對(duì)于存儲(chǔ)廠商而言,AI與數(shù)據(jù)平臺(tái)的融合,推動(dòng)存儲(chǔ)廠商的商業(yè)模式從靜態(tài)、基于產(chǎn)品銷售的模式,向動(dòng)態(tài)、基于數(shù)據(jù)洞察和服務(wù)的模式轉(zhuǎn)型。從產(chǎn)品到預(yù)測(cè)性服務(wù)的轉(zhuǎn)變,讓存儲(chǔ)廠商從一次性銷售產(chǎn)品轉(zhuǎn)向提供可預(yù)測(cè)的成果或服務(wù),創(chuàng)造持續(xù)價(jià)值流。

存儲(chǔ)架構(gòu)的數(shù)據(jù)湖倉(cāng)一體架構(gòu)匯集了所有數(shù)據(jù),而AI模型則能從中挖掘出每個(gè)個(gè)體的獨(dú)特偏好。二者的結(jié)合使得大規(guī)模提供深度個(gè)性化體驗(yàn)成為可能,而個(gè)性化的服務(wù)能夠顯著提升用戶粘性,為企業(yè)創(chuàng)造更多價(jià)值。

那些擁有較高治理水平數(shù)據(jù)的組織,可以利用AI將其轉(zhuǎn)化為有價(jià)值的產(chǎn)品。比如,向市場(chǎng)銷售匿名的行業(yè)趨勢(shì)數(shù)據(jù);為金融機(jī)構(gòu)提供預(yù)測(cè)性的信用風(fēng)險(xiǎn)評(píng)分服務(wù);或者提供在特定領(lǐng)域數(shù)據(jù)上預(yù)訓(xùn)練好的、開(kāi)箱即用的AI模型。

隨著智能體技術(shù)的興起,AI會(huì)變得更加自主。在這些模式中,AI代理能夠以極少的人工干預(yù)執(zhí)行復(fù)雜任務(wù),它們能直接與數(shù)據(jù)系統(tǒng)交互以完成工作流。這是今年以來(lái)最為廣受關(guān)注的技術(shù)趨勢(shì),這種模式將自動(dòng)化提升到了全新的高度,也帶來(lái)了很多可能。

2025年11月18日,以“釋放數(shù)據(jù)潛能,加速智能涌現(xiàn)”為主題的2025中國(guó)數(shù)據(jù)與存儲(chǔ)峰會(huì)將于在北京舉行,大會(huì)將共同探討AI時(shí)代的數(shù)據(jù)基礎(chǔ)設(shè)施演進(jìn)、存儲(chǔ)技術(shù)創(chuàng)新、智能應(yīng)用實(shí)踐及未來(lái)發(fā)展趨勢(shì),希望幫助企業(yè)構(gòu)建AI與數(shù)據(jù)存儲(chǔ)螺旋上升的良性循環(huán)。

分享到

zhupb

相關(guān)推薦