(圖片引自SemiAnalysis報(bào)道)
據(jù)SemiAnalysis披露,華為云CM384基于384顆昇騰芯片構(gòu)建,通過(guò)全互連拓?fù)浼軜?gòu)實(shí)現(xiàn)芯片間高效協(xié)同,可提供高達(dá)300 PFLOPs的密集BF16算力,接近達(dá)到英偉達(dá)GB200 NVL72系統(tǒng)的兩倍。此外,CM384在內(nèi)存容量和帶寬方面同樣占據(jù)優(yōu)勢(shì),總內(nèi)存容量超出英偉達(dá)方案3.6倍,內(nèi)存帶寬也達(dá)到2.1倍,為大規(guī)模AI訓(xùn)練和推理提供了更高效的硬件支持。
(圖片引自SemiAnalysis報(bào)道)
報(bào)道分析稱(chēng),盡管單顆昇騰芯片性能約為英偉達(dá)Blackwell架構(gòu)GPU的三分之一,但華為通過(guò)規(guī)模化系統(tǒng)設(shè)計(jì),成功實(shí)現(xiàn)整體算力躍升,并在超大規(guī)模模型訓(xùn)練、實(shí)時(shí)推理等場(chǎng)景中展現(xiàn)更強(qiáng)競(jìng)爭(zhēng)力。SemiAnalysis也指出,華為的工程優(yōu)勢(shì)不僅體現(xiàn)在芯片層面,更在于系統(tǒng)級(jí)的創(chuàng)新,包括網(wǎng)絡(luò)架構(gòu)、光學(xué)互聯(lián)和軟件優(yōu)化,使得CM384能夠充分發(fā)揮集群算力,滿(mǎn)足超大規(guī)模AI計(jì)算需求。
此次華為云CloudMatrix 384的發(fā)布,標(biāo)志著中國(guó)在A(yíng)I計(jì)算系統(tǒng)領(lǐng)域已具備與國(guó)際巨頭正面競(jìng)爭(zhēng)的實(shí)力。SemiAnalysis在報(bào)道中特別指出,華為的規(guī)?;鉀Q方案“領(lǐng)先于英偉達(dá)和AMD目前市場(chǎng)上的產(chǎn)品一代”,并認(rèn)為中國(guó)在A(yíng)I基礎(chǔ)設(shè)施上的突破將對(duì)全球AI產(chǎn)業(yè)格局產(chǎn)生深遠(yuǎn)影響。