芯東西(公眾號(hào):aichip001)
作者 |  GACS

芯東西9月6日?qǐng)?bào)道,一年一度的全球AI芯片峰會(huì)(GACS 2024)今日在北京火爆開幕?,F(xiàn)場(chǎng)座無(wú)虛席,云直播全網(wǎng)觀看人數(shù)達(dá)到120萬(wàn)人次。

▲會(huì)場(chǎng)內(nèi)和場(chǎng)外展臺(tái)人潮涌動(dòng)

大會(huì)由智一科技旗下芯東西聯(lián)合智猩猩發(fā)起主辦,以「智算紀(jì)元 共筑芯路」為主題,邀請(qǐng)50+位嘉賓來(lái)自AI芯片、Chiplet、RISC-V、智算集群、AI Infra等領(lǐng)域的嘉賓與會(huì)作干貨分享。

正值國(guó)產(chǎn)GPGPU獨(dú)角獸壁仞科技成立五周年,會(huì)上,壁仞科技宣布取得多芯混訓(xùn)核心技術(shù)突破,打造出異構(gòu)GPU協(xié)同訓(xùn)練方案HGCT,業(yè)界首次能夠支持3種及以上異構(gòu)GPU訓(xùn)練同一個(gè)大模型。

直擊國(guó)產(chǎn)AI芯片生存現(xiàn)狀:GPU造血,TPU突襲,Chiplet成大勢(shì),網(wǎng)絡(luò)卡脖子

▲壁仞科技推出國(guó)產(chǎn)異構(gòu)GPU協(xié)同訓(xùn)練方案HGCT

智一科技聯(lián)合創(chuàng)始人、CEO龔倫常作為主辦方發(fā)表致辭,今年是全球AI芯片峰會(huì)舉辦的第七年,峰會(huì)已成為國(guó)內(nèi)在該領(lǐng)域里最有影響力的行業(yè)會(huì)議,是了解國(guó)內(nèi)外AI芯片發(fā)展動(dòng)態(tài)的重要窗口。

▲智一科技聯(lián)合創(chuàng)始人、CEO龔倫常

全球AI芯片峰會(huì)為期兩日,主會(huì)場(chǎng)包括開幕式和三大專場(chǎng)(AI芯片架構(gòu)、數(shù)據(jù)中心AI芯片、邊緣端AI芯片),分會(huì)場(chǎng)包括Chiplet技術(shù)論壇、智算集群技術(shù)論壇和RISC-V創(chuàng)新論壇。

在開幕式上,清華大學(xué)教授、集成電路學(xué)院副院長(zhǎng)尹首一以《高算力芯片發(fā)展路徑探討:從計(jì)算架構(gòu)到集成架構(gòu)》為題進(jìn)行主題報(bào)告,系統(tǒng)性復(fù)盤了高算力芯片存在的技術(shù)挑戰(zhàn),并全面分析五條創(chuàng)新技術(shù)路徑:數(shù)據(jù)流芯片、存算一體芯片、可重構(gòu)芯片、三維集成芯片、晶圓級(jí)芯片。

今日有21位來(lái)自頂尖高校及科研院所、AI芯片企業(yè)的專家、創(chuàng)業(yè)者及高管進(jìn)行分享。其中,高端對(duì)話環(huán)節(jié)邀請(qǐng)了三家AI芯片創(chuàng)企代表激情交辯,分別是國(guó)產(chǎn)大算力芯片獨(dú)角獸壁仞科技、端側(cè)與邊緣側(cè)AI芯片獨(dú)角獸愛(ài)芯元智,還有一家僅創(chuàng)立半年的年輕AI芯片創(chuàng)企凌川科技。他們集中探討了AI芯片產(chǎn)業(yè)現(xiàn)狀、最新實(shí)踐與進(jìn)階方向。

一、破解大模型算力供需挑戰(zhàn),架構(gòu)創(chuàng)新突圍性能瓶頸

清華大學(xué)教授、集成電路學(xué)院副院長(zhǎng)尹首一解讀了大模型時(shí)代算力供需間的困難:芯片工藝面臨Scaling-down極限,致使工藝紅利帶來(lái)的算力提升難以為繼;系統(tǒng)面臨Scaling-out瓶頸,通信帶寬不足導(dǎo)致系統(tǒng)性能損失。

破解這兩大難題的機(jī)會(huì)在于算力芯片計(jì)算架構(gòu)和集成架構(gòu)的聯(lián)合創(chuàng)新:計(jì)算架構(gòu)創(chuàng)新使每個(gè)晶體管都被充分利用、發(fā)揮更強(qiáng)算力;集成架構(gòu)創(chuàng)新使芯片規(guī)模能夠突破極限。

當(dāng)前高算力芯片發(fā)展有五條新技術(shù)路徑:數(shù)據(jù)流芯片、可重構(gòu)芯片、存算一體芯片、三維集成芯片、晶圓級(jí)芯片。這些路徑都不完全依賴于最先進(jìn)的制造工藝,有助于為國(guó)內(nèi)芯片產(chǎn)業(yè)開辟算力提升新空間。

▲清華大學(xué)教授、集成電路學(xué)院副院長(zhǎng)尹首一

AMD在端到端的AI基礎(chǔ)設(shè)施領(lǐng)域打造了全面的產(chǎn)品線,覆蓋從數(shù)據(jù)中心服務(wù)器、AI PC到智能嵌入式和邊緣設(shè)備,并提供領(lǐng)先的AI開源軟件及開放的生態(tài)系統(tǒng)。AMD基于先進(jìn)ZEN4架構(gòu)設(shè)計(jì)的CPU處理器平臺(tái)、基于CDNA3架構(gòu)面向AI推理&訓(xùn)練的MI系列加速器,已被微軟等巨頭采用。

據(jù)AMD人工智能事業(yè)部高級(jí)總監(jiān)王宏強(qiáng)分享,AMD還在推動(dòng)數(shù)據(jù)中心高性能網(wǎng)絡(luò)基礎(chǔ)設(shè)施(UALink,Ultra Ethernet),這對(duì)AI網(wǎng)絡(luò)結(jié)構(gòu)需要支持快速切換和極低延遲、擴(kuò)展AI數(shù)據(jù)中心性能至關(guān)重要。

AMD即將發(fā)布下一代高性能AI PC,其基于第二代XDNA架構(gòu)的Ryzen AI NPU,可提供50TOPS算力,將能效比提高至通用架構(gòu)的35倍。在AI PC對(duì)隱私、安全和數(shù)據(jù)自主性的推動(dòng)下,重要的AI工作負(fù)載開始部署在PC上。作為全球領(lǐng)先的AI基礎(chǔ)設(shè)施提供商之一,AMD愿意攜手廣大客戶與開發(fā)者共建變革性未來(lái)。

▲AMD人工智能事業(yè)部高級(jí)總監(jiān)王宏強(qiáng)

自2015年以來(lái),高通一直在根據(jù)AI應(yīng)用用例的變化,不斷革新NPU硬件設(shè)計(jì)。以第三代驍龍8為代表,高通AI引擎采用集成CPU、GPU、NPU等多種處理器的異構(gòu)計(jì)算架構(gòu)。其中,高通Hexagon NPU通過(guò)大片上內(nèi)存、加速器專用電源、微架構(gòu)升級(jí)等設(shè)計(jì)來(lái)優(yōu)化性能和能效。AI的用例豐富,算力要求不一,因此異構(gòu)計(jì)算和處理器集成的需求會(huì)長(zhǎng)期存在,這也將帶來(lái)峰值性能、能效、成本等方面的一系列提升。

高通的產(chǎn)品線覆蓋手機(jī)、PC、XR、汽車、IoT等豐富的邊緣側(cè)應(yīng)用場(chǎng)景,能夠支持開發(fā)者在不同產(chǎn)品形態(tài)中利用高通的AI軟硬件解決方案進(jìn)行算法加速,為消費(fèi)者帶來(lái)豐富的終端側(cè)AI體驗(yàn)和用例。最后,高通AI產(chǎn)品技術(shù)中國(guó)區(qū)負(fù)責(zé)人萬(wàn)衛(wèi)星還預(yù)告,搭載最新的高通Oryon CPU的下一代驍龍移動(dòng)平臺(tái),即將在今年10月21-23日舉行的驍龍峰會(huì)上發(fā)布。

▲高通AI產(chǎn)品技術(shù)中國(guó)區(qū)負(fù)責(zé)人萬(wàn)衛(wèi)星

蘋芯科技聯(lián)合創(chuàng)始人兼CEO楊越拆解了存算一體技術(shù)的進(jìn)階過(guò)程。產(chǎn)業(yè)界主流芯片的出現(xiàn)和成長(zhǎng)與當(dāng)下計(jì)算需求的特點(diǎn)緊密相關(guān),2015年前后,計(jì)算體系結(jié)構(gòu)中的計(jì)算瓶頸從處理器端向存儲(chǔ)端遷移,尤其是神經(jīng)網(wǎng)絡(luò)的出現(xiàn),加快了AI芯片計(jì)算效率的提升節(jié)奏,存算技術(shù)因此受到關(guān)注。

楊越認(rèn)為,在大模型時(shí)代,存算一體技術(shù)的機(jī)會(huì)是能夠在有數(shù)據(jù)存儲(chǔ)的地方都加入計(jì)算。隨著軟件不斷發(fā)展,基于存算的端側(cè)芯片今年已經(jīng)逐步成熟。未來(lái),在云端解決數(shù)據(jù)帶寬瓶頸,或?qū)⒊蔀榇嫠阈酒乱粋€(gè)殺手級(jí)應(yīng)用。

▲蘋芯科技聯(lián)合創(chuàng)始人兼CEO楊越

北極雄芯CTO譚展宏談道,在高性能計(jì)算領(lǐng)域,服務(wù)器設(shè)計(jì)有兩種不同的范式:標(biāo)準(zhǔn)服務(wù)器形態(tài)和定制服務(wù)器架構(gòu)。在標(biāo)準(zhǔn)服務(wù)器形態(tài)下,北極雄芯關(guān)注于在標(biāo)準(zhǔn)約束的面積下,通過(guò)合適的芯粒拆分與封裝方案,實(shí)現(xiàn)更高的性價(jià)比;在非標(biāo)準(zhǔn)服務(wù)器形態(tài)下,提供了晶圓級(jí)集成的機(jī)會(huì),關(guān)注于芯片與系統(tǒng)設(shè)計(jì)一體化,對(duì)服務(wù)器與芯片進(jìn)行協(xié)同設(shè)計(jì),旨在達(dá)到“服務(wù)器即芯片”的目標(biāo)。

特別地,譚展宏強(qiáng)調(diào)了不同芯片的設(shè)計(jì)有不同的帶寬需求,例如在7nm以上工藝下,結(jié)合部署通信優(yōu)化,往往不需要很高的互連帶寬密度,因此先進(jìn)封裝并不是必需的,基于2D的封裝即可滿足性能需求并實(shí)現(xiàn)高性價(jià)比方案。北極雄芯基于《芯粒互聯(lián)接口標(biāo)準(zhǔn)》的PB-Link IP,正式實(shí)現(xiàn)了低封裝成本的互連實(shí)現(xiàn),目前已開始對(duì)外授權(quán)。

▲北極雄芯CTO譚展宏

二、高端對(duì)話:國(guó)產(chǎn)AI芯片造血能力增強(qiáng),最年輕創(chuàng)企產(chǎn)品已落地快手

智一科技聯(lián)合創(chuàng)始人、總編輯張國(guó)仁,與壁仞科技副總裁兼AI軟件首席架構(gòu)師丁云帆,凌川科技聯(lián)合創(chuàng)始人、副總裁劉理,愛(ài)芯元智聯(lián)合創(chuàng)始人、副總裁劉建偉,展開了一場(chǎng)以“國(guó)產(chǎn)AI芯片落地的共識(shí)、共創(chuàng)與共贏”為主題的圓桌對(duì)話。

直擊國(guó)產(chǎn)AI芯片生存現(xiàn)狀:GPU造血,TPU突襲,Chiplet成大勢(shì),網(wǎng)絡(luò)卡脖子

張國(guó)仁在圓桌對(duì)話開始時(shí)稱,由智東西、芯東西、智猩猩發(fā)起舉辦六屆的AI芯片峰會(huì),是國(guó)內(nèi)該領(lǐng)域持續(xù)時(shí)間最長(zhǎng)的專業(yè)會(huì)議,這幾年見證了AI芯片和大模型的蓬勃發(fā)展,也見證了一批國(guó)內(nèi)造芯“新勢(shì)力”的崛起。

▲智一科技聯(lián)合創(chuàng)始人、總編輯張國(guó)仁

丁云帆談道,大算力芯片是技術(shù)密集、人才密集、資金密集的行業(yè)。作為市場(chǎng)中已公開融資規(guī)模最大的芯片獨(dú)角獸,壁仞科技擁有頂級(jí)人才,第一代產(chǎn)品已量產(chǎn)落地,多個(gè)國(guó)產(chǎn)GPU千卡集群已經(jīng)落地,能獨(dú)立造血。但國(guó)產(chǎn)芯片行業(yè)整體情況仍然不易,生態(tài)方面和國(guó)外仍有差距。

很多國(guó)產(chǎn)AI芯片已經(jīng)開始落地于數(shù)據(jù)中心、智算中心。在丁云帆看來(lái),英偉達(dá)面向國(guó)內(nèi)的產(chǎn)品性價(jià)比并不高,國(guó)產(chǎn)芯片只要能做出性能、做出性價(jià)比,就會(huì)有市場(chǎng)。目前國(guó)內(nèi)芯片產(chǎn)業(yè)落地消息越來(lái)越多、造血能力增強(qiáng),與英偉達(dá)之間的差距會(huì)逐漸縮小。

▲壁仞科技副總裁兼AI軟件首席架構(gòu)師丁云帆

劉建偉認(rèn)為,低成本是很重要的部分,企業(yè)最終還是要算賬,企業(yè)對(duì)基礎(chǔ)設(shè)施的投資一定要賺回來(lái)。劉理相信后期在具身智能、智能視頻等細(xì)分賽道,更多企業(yè)的進(jìn)入,將帶來(lái)比通用產(chǎn)品更高的價(jià)值,會(huì)壓縮英偉達(dá)的營(yíng)收和利潤(rùn)。

凌川科技是最年輕的國(guó)內(nèi)AI芯片創(chuàng)企之一,今年3月剛成立,已完成一輪融資,目前在售的智能視頻處理芯片已落地快手,占快手視頻處理領(lǐng)域用量的99%,大算力推理芯片預(yù)計(jì)明年初流片。

在劉理看來(lái),距離AI芯片市場(chǎng)窗口關(guān)閉還很遠(yuǎn),面對(duì)巨頭在資源、資金、生態(tài)上的優(yōu)勢(shì),創(chuàng)企需要在垂直、細(xì)分領(lǐng)域發(fā)力。凌川科技將智能視頻處理、AI推理算力結(jié)合,目標(biāo)是將其每Token推理成本降到英偉達(dá)H800的10%。

▲凌川科技聯(lián)合創(chuàng)始人、副總裁劉理

面向端側(cè)、邊緣側(cè)的愛(ài)芯元智,市占率均取得了矚目的成績(jī)。劉建偉認(rèn)為這兩個(gè)領(lǐng)域?qū)崿F(xiàn)商業(yè)閉環(huán)的速度會(huì)更快。他補(bǔ)充說(shuō),做AI芯片最終一定會(huì)賺錢,但實(shí)際盈利的時(shí)間表會(huì)受到AI部署成本等因素的影響,企業(yè)應(yīng)盡快實(shí)現(xiàn)自我造血和閉環(huán)。未來(lái),愛(ài)芯元智將在端側(cè)和邊緣側(cè)大模型落地場(chǎng)景進(jìn)行探索。

愛(ài)芯元智在汽車領(lǐng)域的產(chǎn)品出貨量十分可觀,劉建偉談道,這是因?yàn)橹腔鄢鞘泻推嚨牡讓有酒夹g(shù)類似,愛(ài)芯元智在智慧城市上積累了成熟技術(shù)再進(jìn)入智能駕駛可以較快實(shí)現(xiàn)量產(chǎn)。同時(shí),汽車領(lǐng)域價(jià)格戰(zhàn)將推動(dòng)產(chǎn)業(yè)分工是機(jī)遇期。

▲愛(ài)芯元智聯(lián)合創(chuàng)始人、副總裁劉建偉

對(duì)于國(guó)產(chǎn)AI芯片如何快速找到生態(tài)位,劉建偉以愛(ài)芯元智的深耕場(chǎng)景為例,智慧城市基本沒(méi)有國(guó)外公司,在智能駕駛領(lǐng)域英偉達(dá)開拓0到1階段,1到100更關(guān)注成本的階段就是國(guó)內(nèi)企業(yè)的機(jī)會(huì)。丁云帆提到四個(gè)要素:穩(wěn)定可靠的供應(yīng)保障、性價(jià)比、針對(duì)客戶需求提供高效支持服務(wù)、高效易用。劉理認(rèn)為應(yīng)該在垂直領(lǐng)域深耕,做出比通用芯片更高效、優(yōu)化的解決方案。

展望未來(lái),劉建偉預(yù)測(cè)未來(lái)4-5年,端側(cè)和云側(cè)都將出現(xiàn)很大的發(fā)展機(jī)遇,產(chǎn)業(yè)界落地成本降低后,數(shù)據(jù)可以實(shí)現(xiàn)更大的價(jià)值。劉理認(rèn)為隨著AI應(yīng)用迎來(lái)爆發(fā)期,云側(cè)將產(chǎn)生大量推理需求。丁云帆談到國(guó)內(nèi)的高端算力仍然稀缺,但產(chǎn)業(yè)鏈的協(xié)同可以實(shí)現(xiàn)穩(wěn)健的發(fā)展。

三、智算中心建設(shè)潮起:壁仞GPU新突破,國(guó)產(chǎn)TPU拼落地,Chiplet贏麻了

在下午舉行的數(shù)據(jù)中心AI芯片專場(chǎng),Habana中國(guó)區(qū)負(fù)責(zé)人于明揚(yáng)談道,近三年有大約50+政府主導(dǎo)的智算中心陸續(xù)建成、60+在規(guī)劃和建設(shè)中,智算中心建設(shè)逐漸從一線城市向二三線城市下沉,從政府主導(dǎo)逐漸轉(zhuǎn)向企業(yè)主導(dǎo),對(duì)成本壓縮、投資回報(bào)周期的要求也逐漸提升。

據(jù)他觀察,當(dāng)前大模型開發(fā)日趨成熟,推理需求持續(xù)增長(zhǎng),頭部CSP自研推理芯片的增速將提高,未來(lái)推理側(cè)可能培育出多家異構(gòu)芯片企業(yè)。

國(guó)外大模型訓(xùn)練需求仍將旺盛,國(guó)內(nèi)模型訓(xùn)練對(duì)算力的需求基本飽和,主要來(lái)自微調(diào)業(yè)務(wù)。要支撐未來(lái)AI發(fā)展,Chiplet、高速大容量?jī)?nèi)存、私有/通用高速互聯(lián)技術(shù)的融合將起關(guān)鍵作用。

▲Habana中國(guó)區(qū)負(fù)責(zé)人于明揚(yáng)

為了打破大模型異構(gòu)算力孤島難題,壁仞科技副總裁兼AI軟件首席架構(gòu)師丁云帆宣布推出壁仞自主原創(chuàng)的異構(gòu)GPU協(xié)同訓(xùn)練方案HGCT。這是業(yè)界首次實(shí)現(xiàn)支持3種及以上異構(gòu)GPU協(xié)同訓(xùn)練同一個(gè)大模型,即支持用「英偉達(dá)+壁仞+其他品牌GPU」混訓(xùn),通信效率大于98%,端到端訓(xùn)練效率達(dá)到90~95%。

壁仞正在聯(lián)合客戶、合作伙伴等共同推動(dòng)異構(gòu)GPU協(xié)同訓(xùn)練生態(tài),包括中國(guó)電信、中興通訊、商湯科技、國(guó)網(wǎng)智研院、上海智能算力科技有限公司、上海人工智能實(shí)驗(yàn)室、中國(guó)信通院等。

其產(chǎn)品已在多個(gè)千卡GPU集群開始商用落地。壁仞研發(fā)了軟硬一體、全棧優(yōu)化、異構(gòu)協(xié)同、開源開放的大模型整體解決方案。壁仞首次實(shí)現(xiàn)大模型3D并行任務(wù)自動(dòng)彈性擴(kuò)縮容,保持集群利用率近100%;已實(shí)現(xiàn)千卡集群千億參數(shù)模型10分鐘自動(dòng)恢復(fù)、4天無(wú)故障、15天不中斷的效果。

▲壁仞科技副總裁兼AI軟件首席架構(gòu)師丁云帆

中昊芯英聯(lián)合創(chuàng)始人、CTO鄭瀚尋談道,如今的AI大模型遠(yuǎn)超計(jì)算歷史任一時(shí)刻的計(jì)算復(fù)雜度和算力需求量,需要更擅長(zhǎng)AI計(jì)算的專用芯片。相較于GPU最初主要設(shè)計(jì)用于實(shí)時(shí)渲染和圖像處理,TPU的設(shè)計(jì)則主要用于機(jī)器學(xué)習(xí)、深度學(xué)習(xí)模型和神經(jīng)網(wǎng)絡(luò)計(jì)算,針對(duì)張量運(yùn)算進(jìn)行了高度優(yōu)化,單個(gè)的脈動(dòng)陣列架構(gòu)吞吐量和處理效率相較GPU有了更大提升。

中昊芯英自研的“剎那”芯片是中國(guó)首枚已量產(chǎn)的高性能TPU架構(gòu)AI芯片,綜合測(cè)算算力性能、成本、能耗后,單位算力成本僅為海外領(lǐng)先GPU的50%。鄭瀚尋認(rèn)為,大模型發(fā)展后期,千卡、萬(wàn)卡集群的最佳費(fèi)效比將至關(guān)重要,剎那芯片多達(dá)1024片芯片間的直接高速互聯(lián),在構(gòu)建大規(guī)模計(jì)算集群時(shí)的系統(tǒng)集群性性能可遠(yuǎn)超傳統(tǒng)GPU數(shù)倍。

▲中昊芯英聯(lián)合創(chuàng)始人、CTO鄭瀚尋

據(jù)浪潮信息開放加速計(jì)算產(chǎn)品負(fù)責(zé)人Stephen Feng分享,隨著大模型參數(shù)規(guī)模增加,生成式AI的發(fā)展面臨四大挑戰(zhàn):集群擴(kuò)展性不足、芯片功耗高、集群部署難、系統(tǒng)可靠性低四大挑戰(zhàn)。浪潮信息始終堅(jiān)持以應(yīng)用為導(dǎo)向,以系統(tǒng)為核心,通過(guò)開元開放的系統(tǒng)激發(fā)生成式 AI 創(chuàng)新活力。

在硬件開放方面,通過(guò)建立OAM(開放加速模塊)規(guī)范,加速先進(jìn)算力的上線部署,支撐大模型及AI應(yīng)用的迭代加速。在軟件開放方面,通過(guò)大模型開發(fā)平臺(tái)“元腦企智”EPAI ,為企業(yè)打造全流程應(yīng)用開發(fā)支撐平臺(tái),通過(guò)端到端的解決方案,解決基礎(chǔ)大模型落地到領(lǐng)域存在的幻覺(jué)問(wèn)題,解決應(yīng)用開發(fā)流程復(fù)雜、門檻高,多元多模適配難、成本高等落地難題,加速企業(yè)大模型應(yīng)用創(chuàng)新與落地。

▲浪潮信息開放加速計(jì)算產(chǎn)品負(fù)責(zé)人Stephen Feng

清程極智成立于2023年,聚焦AI Infra賽道,團(tuán)隊(duì)孵化于清華大學(xué)計(jì)算機(jī)系,在智能算力優(yōu)化方面,已經(jīng)積累了十幾年的經(jīng)驗(yàn)。

清程極智聯(lián)合創(chuàng)始人師天麾分享道,國(guó)產(chǎn)高性能算力系統(tǒng)正面臨著故障恢復(fù)難、性能亞健康等方面的挑戰(zhàn),需要10大核心基礎(chǔ)軟件系統(tǒng)配合,清程極智已在其中過(guò)半數(shù)領(lǐng)域擁有自研產(chǎn)品。

目前,清程極智已掌握了從底層編譯器到上層并行計(jì)算系統(tǒng)的全棧技術(shù)積累,實(shí)現(xiàn)大模型行業(yè)生態(tài)的全棧式覆蓋,完成多個(gè)在國(guó)產(chǎn)芯片的高吞吐量推理優(yōu)化和主流大模型的快速移植和優(yōu)化,計(jì)算效果提升明顯。其中,面向超大規(guī)模國(guó)產(chǎn)算力集群研制的大模型訓(xùn)練系統(tǒng)“八卦爐”,可擴(kuò)展到全機(jī)10萬(wàn)臺(tái)服務(wù)器規(guī)模,用于訓(xùn)練174萬(wàn)億參數(shù)量的模型。

▲清程極智聯(lián)合創(chuàng)始人師天麾

芯和半導(dǎo)體技術(shù)市場(chǎng)總監(jiān)黃曉波談道,算力需求過(guò)去20年增長(zhǎng)6萬(wàn)倍,未來(lái)10年可能達(dá)10萬(wàn)倍,存儲(chǔ)、互聯(lián)帶寬成為主要發(fā)展瓶頸。Chiplet集成系統(tǒng)成為后摩爾時(shí)代先進(jìn)工藝制程限制和高性能算力提升突破的重要方向,已經(jīng)廣泛應(yīng)用于AI大算力芯片和AI算力集群網(wǎng)絡(luò)交換芯片。

對(duì)此,芯和半導(dǎo)體為Chiplet集成系統(tǒng)的設(shè)計(jì)開發(fā)提供了一站式多物理場(chǎng)仿真EDA平臺(tái)。該平臺(tái)支持主流工藝設(shè)計(jì)互連結(jié)構(gòu)參數(shù)化建模,求解仿真能力比其他平臺(tái)快10倍,內(nèi)存僅占1/20,并內(nèi)置HBM/UCIe協(xié)議分析以提升仿真效率,獲國(guó)內(nèi)外多家頭部AI算力芯片設(shè)計(jì)廠商使用,幫助大算力Chiplet集成系統(tǒng)產(chǎn)品的加速落地。

▲芯和半導(dǎo)體技術(shù)市場(chǎng)總監(jiān)黃曉波

在大模型訓(xùn)練過(guò)程中,網(wǎng)絡(luò)基礎(chǔ)設(shè)施的開銷占比達(dá)到30%,凸顯了網(wǎng)絡(luò)性能的重要性。據(jù)奇異摩爾聯(lián)合創(chuàng)始人、產(chǎn)品及解決方案副總裁??|分享,網(wǎng)絡(luò)已成為智算性能瓶頸,構(gòu)建AI網(wǎng)絡(luò)需要三網(wǎng)融合,即集群網(wǎng)間互連、機(jī)柜內(nèi)互連,芯片內(nèi)的互聯(lián)。

大智算集群需要高性能互連,Modernize RDMA與Chiplet成為關(guān)鍵技術(shù)。為了優(yōu)化RDMA,奇異摩爾的NDSA網(wǎng)絡(luò)加速芯粒系列基于可編程眾核流式架構(gòu),通過(guò)高性能的數(shù)據(jù)引擎,實(shí)現(xiàn)高性能數(shù)據(jù)流及靈活數(shù)據(jù)加速。奇異摩爾首創(chuàng)的GPU Link Chiplet “NDSA-G2G”,基于以太基礎(chǔ)設(shè)施 ,通過(guò)高性能數(shù)據(jù)引擎和D2D接口技術(shù),可實(shí)現(xiàn)Scale-Up網(wǎng)絡(luò)TB級(jí)高帶寬,性能媲美全球互連技術(shù)的標(biāo)桿。

▲奇異摩爾聯(lián)合創(chuàng)始人、產(chǎn)品及解決方案副總裁??|

Alphawave是一家針對(duì)HPC、AI和高速網(wǎng)絡(luò)應(yīng)用提供IP、Chiplet和ASIC設(shè)計(jì)解決方案的企業(yè)。其亞太地區(qū)高級(jí)業(yè)務(wù)總監(jiān)郭大瑋分享說(shuō),針對(duì)數(shù)據(jù)在傳輸過(guò)程中面臨的問(wèn)題,Alphawave IP產(chǎn)品的誤碼率比競(jìng)品低2個(gè)數(shù)量級(jí),還可輔助進(jìn)行集成和驗(yàn)證,并與Arm生態(tài)深度融合。他們還能為客戶的SoC提供全生命周期的支持。

Chiplet方面,Alphawave幫助客戶縮短周期,降低成本,提升了良率和迭代速度,目前已做出行業(yè)內(nèi)第一款多協(xié)議IO連接Chiplet,今年已經(jīng)流片。定制芯片方面,Alphawave主要專注于7nm以下的工藝,可根據(jù)客戶需求完成從規(guī)格到流片的全流程,目前已實(shí)現(xiàn)超375次成功流片,DPPM小于25。

▲Alphawave亞太地區(qū)高級(jí)業(yè)務(wù)總監(jiān)郭大瑋

結(jié)語(yǔ):下游智能化風(fēng)起云涌,AI芯片迎歷史機(jī)遇

在邁向通用人工智能終極議題的道路上,AI算法的形態(tài)不斷變化,AI芯片也與之相隨。當(dāng)古老的沙礫邂逅未來(lái)的機(jī)器智能,技術(shù)與工程智慧交融碰撞,一顆顆凝集了精微設(shè)計(jì)的AI芯片走進(jìn)計(jì)算集群,步入千家萬(wàn)戶,托載起硅基生命的進(jìn)化。

從智算中心、智能駕駛到AI PC、AI手機(jī)、新型AI硬件,下游智能化風(fēng)潮為錨定不同場(chǎng)景的AI芯片都帶來(lái)了新一波歷史機(jī)遇??焖侔l(fā)展的生成式AI算法及應(yīng)用不斷解鎖新的算力挑戰(zhàn)。技術(shù)創(chuàng)新和市場(chǎng)需求正雙重推動(dòng)AI芯片市場(chǎng)規(guī)模擴(kuò)大,并推動(dòng)AI芯片的競(jìng)爭(zhēng)格局趨于多元。

9月7日,2024全球AI芯片峰會(huì)將繼續(xù)密集輸送干貨:主會(huì)場(chǎng)將舉行AI芯片架構(gòu)創(chuàng)新專場(chǎng)、邊緣/端側(cè)AI芯片專場(chǎng),公布「2024中國(guó)智算集群解決方案企業(yè)TOP 20」、「2024中國(guó)AI芯片新銳企業(yè)TOP 10」兩大榜單;分會(huì)場(chǎng)將舉行智算集群技術(shù)論壇、中國(guó)RISC-V計(jì)算芯片創(chuàng)新論壇。

分享到

崔歡歡

相關(guān)推薦