在AI大模型時代,僅靠芯片性能提升已無法滿足訓(xùn)練及推理的蓬勃算力需求,業(yè)界目光轉(zhuǎn)向系統(tǒng)架構(gòu)層面的創(chuàng)新。2023年7月,Linux基金會發(fā)起成立開源組織——超以太網(wǎng)聯(lián)盟UEC (Ultra Ethernet Consortium) ,致力于打造面向AI時代的超大規(guī)模新型網(wǎng)絡(luò)技術(shù)及系統(tǒng)。
與英偉達主導(dǎo)的InfiniBand網(wǎng)絡(luò)體系不同,UEC聯(lián)盟希望通過開源開放的技術(shù)合作促進創(chuàng)新,因此也被業(yè)界類比為網(wǎng)絡(luò)領(lǐng)域的蘋果系統(tǒng)與安卓生態(tài)。成立不到一年,UEC已成為當(dāng)下全球AI基礎(chǔ)設(shè)施領(lǐng)域最受人關(guān)注、發(fā)展最迅速的技術(shù)聯(lián)盟。當(dāng)前,UEC建立了物理層、鏈路層、傳輸層、軟件層等8個工作組,推進新興網(wǎng)絡(luò)技術(shù)研究;同時,聯(lián)盟特設(shè)技術(shù)咨詢委員會,負(fù)責(zé)制定技術(shù)路線圖,把控核心技術(shù)及方向,協(xié)同推進各小組工作,并統(tǒng)籌所有技術(shù)提案及標(biāo)準(zhǔn)制定。
UEC技術(shù)委員會是聯(lián)盟中最核心的技術(shù)決策中心,只有技術(shù)實力過硬、對開源社區(qū)貢獻大的會員機構(gòu)才能入選。微軟、Meta、AMD、Intel、博通、思科等10名UEC發(fā)起成員,與最新投票選出的阿里云、Enfabrica、Marvell等3名成員,共同組成了新一屆UEC技術(shù)委員會。
UEC聯(lián)盟主席梅茨歡迎阿里云等3位技術(shù)委員會新成員,他在郵件中表示,在技術(shù)委員會的推動和全體成員的努力下,UEC聯(lián)盟將很快迎來第一個里程碑。
在UEC聯(lián)盟中,阿里云正牽頭推進面向AI需求的網(wǎng)絡(luò)性能提升項目等技術(shù)草案,并持續(xù)向成員分享阿里云最新的技術(shù)積累和實踐。同時,阿里云也是開放網(wǎng)絡(luò)SONiC社區(qū)7個發(fā)起成員之一和技術(shù)委員會副主席單位。
阿里巴巴是AMiner全球十大網(wǎng)絡(luò)研究機構(gòu)中唯一的中國公司,在網(wǎng)絡(luò)領(lǐng)域的技術(shù)創(chuàng)新和實踐碩果累累,其中,阿里云在AI高性能網(wǎng)絡(luò)的新突破備受關(guān)注。阿里云自研的智算集群網(wǎng)絡(luò)架構(gòu)HPN 7.0,使得大模型訓(xùn)練性能和系統(tǒng)穩(wěn)定性大幅提升,成為國際頂會SIGCOMM歷史首篇AI智算網(wǎng)絡(luò)架構(gòu)的論文,被認(rèn)為是繼谷歌Jupiter經(jīng)典網(wǎng)絡(luò)之后的AI網(wǎng)絡(luò)架構(gòu)新范式。