華為云副總裁黃瑾在近日舉行的“逐光向新·智領(lǐng)未來”華為云AI峰會上表示,過去八年單卡算力提升40倍,但節(jié)點間帶寬僅增長4倍,導(dǎo)致集群算力利用率普遍低于30%。這種”算力供給與架構(gòu)效率的錯配”,使企業(yè)即便投入巨額硬件成本,也難以突破”算力孤島”困境。

具體到行業(yè)實踐,硅基流動聯(lián)合創(chuàng)始人、首席產(chǎn)品官胡健指出,當(dāng)DeepSeek模型需要支持億級用戶推理時,傳統(tǒng)架構(gòu)下的顯存不足、通信延遲等問題,導(dǎo)致單卡推理成本飆升3-5倍。而中國科學(xué)院自動化研究所研究員李林靜團隊的研究表明,在大模型訓(xùn)練中,學(xué)習(xí)率策略與算力分配的不匹配,可能導(dǎo)致模型收斂速度下降40%以上。這些痛點集中反映出:算力競爭已從”硬件堆砌”轉(zhuǎn)向”架構(gòu)創(chuàng)新”,傳統(tǒng)基于GPU堆疊的算力方案,正在被超節(jié)點架構(gòu)顛覆。

超節(jié)點破局:重新定義算力架構(gòu)的技術(shù)范式

華為云CloudMatrix 384超節(jié)點的核心突破,在于重構(gòu)算力單元的底層連接邏輯。其全對等互聯(lián)架構(gòu)通過2.8T高速總線,實現(xiàn)GPU/NPU/DPU等資源的無阻塞通信,較傳統(tǒng)架構(gòu)提升10倍帶寬——這一改進直接擊中”集群通信瓶頸”的命門。華為云數(shù)據(jù)中心全球DC運維首席專家謝峰透露,為實現(xiàn)40天長穩(wěn)訓(xùn)練,團隊在光模塊清潔度控制、液冷系統(tǒng)微生物抑制等細節(jié)上投入數(shù)百項專利,將硬件故障率控制在0.001次/千小時以下。

在算力效率優(yōu)化層面,”以存強算”的EMS彈性內(nèi)存技術(shù)具有顛覆意義。該技術(shù)通過內(nèi)存池化,使顯存擴展成本降低60%,同時支持KV計算卸載,單卡吞吐量提升100%。黃瑾舉例稱,某互聯(lián)網(wǎng)公司使用384超節(jié)點后,大模型訓(xùn)練效率較傳統(tǒng)GPU集群提升67%,算力成本降低40%。這種”精準(zhǔn)優(yōu)化關(guān)鍵路徑”的技術(shù)路線,使超節(jié)點在MoE模型訓(xùn)練、多模態(tài)推理等場景中展現(xiàn)出顯著優(yōu)勢:DeepSeek R1推理性能提升3倍,千問2.5稠密模型效率提升2倍。

生態(tài)重構(gòu):從技術(shù)競爭到產(chǎn)業(yè)協(xié)同的范式轉(zhuǎn)換

算力架構(gòu)的革新,正在重塑AI產(chǎn)業(yè)的分工體系。傳統(tǒng)行業(yè)如保險、制造的實踐表明,企業(yè)無需自建算力基礎(chǔ)設(shè)施,而是通過華為云MaaS服務(wù)聚焦場景創(chuàng)新。大家保險信息科技部總經(jīng)理郝曉波指出,其團隊通過”小切口+中臺化”策略,在智能核保、客戶分群等場景中,利用昇騰云服務(wù)將AI應(yīng)用開發(fā)周期縮短70%,試錯成本降低80%。這種”輕資產(chǎn)+重場景”的模式,標(biāo)志著算力服務(wù)從”技術(shù)奢侈品”變?yōu)?#8221;產(chǎn)業(yè)基礎(chǔ)設(shè)施”。

生態(tài)協(xié)同的深度,體現(xiàn)在技術(shù)與場景的雙向滲透。德勤中國合伙人劉曉羽展示的”AI智造助手”,通過拆解33個原子能力(如智能閱單、流程編排),使制造企業(yè)可快速組合出適配自身的智能應(yīng)用。這種”標(biāo)準(zhǔn)化原子能力+個性化場景編排”的模式,既解決了80%通用需求的效率問題,又通過20%的定制化開發(fā)滿足行業(yè)特性。華為云”百模千態(tài)”戰(zhàn)略則進一步放大這種協(xié)同效應(yīng):160多個大模型在昇騰云平臺實現(xiàn)高效適配,覆蓋制造、金融等30多個行業(yè)400+場景,形成”模型-算力-場景”的閉環(huán)生態(tài)。

產(chǎn)業(yè)影響:算力平權(quán)如何改寫競爭規(guī)則

超節(jié)點架構(gòu)的普及,正在推動”算力平權(quán)”趨勢加速到來。華為云在蕪湖、貴安等地部署的超節(jié)點集群,通過10ms時延圈覆蓋全國19個城市群,使中小企業(yè)可按需獲取毫秒級響應(yīng)的算力服務(wù),算力使用門檻降低90%。這種”云化算力供給”模式,打破了頭部企業(yè)對高端算力的壟斷——硅基流動數(shù)據(jù)顯示,其平臺上500萬用戶中,中小企業(yè)占比達78%,使用昇騰云服務(wù)的推理成本僅為GPU方案的1/3。

從產(chǎn)業(yè)競爭維度看,超節(jié)點架構(gòu)正在重構(gòu)全球算力格局。當(dāng)華為云實現(xiàn)”全棧自主可控”(從芯片、互聯(lián)協(xié)議到液冷系統(tǒng)),中國AI產(chǎn)業(yè)首次擁有了可替代的算力底座選項。黃瑾強調(diào),華為云2024年金融行業(yè)80%的贏單率,本質(zhì)是”安全可靠+算力效率”的雙重優(yōu)勢驅(qū)動。這種從技術(shù)自主到生態(tài)主導(dǎo)的躍遷,標(biāo)志著中國在AI核心基礎(chǔ)設(shè)施領(lǐng)域,已從”跟跑者”轉(zhuǎn)變?yōu)?#8221;規(guī)則定義者”。

結(jié)語:算力戰(zhàn)爭的終局是產(chǎn)業(yè)效率革命

回顧AI算力演進史,從單卡計算到集群架構(gòu),再到超節(jié)點時代,本質(zhì)是人類對算力利用效率的持續(xù)突破。當(dāng)CloudMatrix 384將300Pflops算力濃縮至單個機柜,當(dāng)”朝推夜訓(xùn)”機制使算力利用率提升至90%以上,技術(shù)革新的終極目標(biāo)始終未變:讓算力更高效地服務(wù)于產(chǎn)業(yè)升級。對于中國AI產(chǎn)業(yè)而言,超節(jié)點架構(gòu)的價值不僅在于突破技術(shù)封鎖,更在于建立”以我為主”的算力生態(tài)——當(dāng)算力成為可靈活調(diào)度、高效利用的公共資源,AI對千行萬業(yè)的賦能,才真正具備大規(guī)模落地的基礎(chǔ)。這場算力革命的終局,不是硬件性能的攀比,而是通過效率提升,讓智能技術(shù)成為所有企業(yè)的”通用生產(chǎn)力”。

分享到

lixiangjing

算力豹主編

相關(guān)推薦