數(shù)據(jù)來源:IDC中國,《中國AI開源框架市場研究報告(2024)》
昇思之所以能夠獲得如此出色的市場成績,得益于其迅速適應(yīng)AI趨勢,通過打造兼容主流生態(tài)的開發(fā)接口、原生支持大模型及AI4S能力,使能產(chǎn)業(yè)及科研創(chuàng)新。昇思通過升級八維混合分布式并行技術(shù),實現(xiàn)原生親和超節(jié)點,從而大幅提升模型訓(xùn)練效率。
實現(xiàn)低成本的模型腳本平滑遷移替換:昇思匹配開發(fā)者習(xí)慣,兼容業(yè)界主流開發(fā)接口,已兼容100+Transformers接口、100+Diffusers接口,兼容1300+算子表達,支持靈活對接各種加速庫。
滿足大模型并行優(yōu)化要求:昇思原生親和超節(jié)點,在八維分布式并行技術(shù)基礎(chǔ)上,持續(xù)升級超長序列、MoE、多模態(tài)模型等多維混合并行策略能力,例如通過RingAtt超長序列并行、3D超長序列并行和2D/3D高維張量并行,使得超長序列大模型訓(xùn)練性能提升20%,通過MoE通信計算并行、Router融合,使得萬億MoE模型訓(xùn)練性能提升40%,通過細粒度多副本、虛擬流水交織并行、序列流水線并行、負載均衡,使得千億稠密模型訓(xùn)練性能提升20%;提供并行策略自動搜索和仿真執(zhí)行能力,改變傳統(tǒng)技術(shù)路徑,從過去依賴專家經(jīng)驗制定并行策略、通過集群實測尋找最優(yōu)策略、周級完成大模型調(diào)優(yōu),到現(xiàn)在自動搜索最優(yōu)并行策略,通過Dryrun仿真分析獲得最佳測錄,實現(xiàn)天級大模型開箱性能。
昇思打造業(yè)界首個AI融合框架,實現(xiàn)大模型與AI4S兩大領(lǐng)域的原生:持續(xù)升級架構(gòu),通過支持MPMD多模型多任務(wù)調(diào)度,訓(xùn)推同構(gòu),可自由組合封裝RL模塊搭建高性能強化學(xué)習(xí)套件,在線重排訓(xùn)推權(quán)重任務(wù),端到端提升吞吐,并可以自動分配切分計算資源,實現(xiàn)多模型多任務(wù)并行;具備函數(shù)式編程親和架構(gòu),支持Numpy/Scipy原生、自動微分加速,提供高性能強化學(xué)習(xí)、AI4S使能套件。
堅持投入社區(qū)生態(tài),開發(fā)者關(guān)注度持續(xù)增強:自2020年3月昇思MindSpore正式開源以來,陸續(xù)創(chuàng)建學(xué)術(shù)獎勵基金、培養(yǎng)原生大語言模型、舉辦AI框架峰會、成立社區(qū)委員會、成為Gitee重要貢獻者、創(chuàng)立昇思生態(tài)創(chuàng)新中心,已經(jīng)積累了大量的B端企業(yè)合作伙伴和眾多企業(yè)、高校開發(fā)者,截至目前已經(jīng)有4萬+社區(qū)核心貢獻者、1100萬+全球用戶下載、10萬+代碼合入請求、1700+學(xué)術(shù)論文創(chuàng)新,全球范圍內(nèi)僅次于PyTorch(Papers With Code官網(wǎng)數(shù)據(jù))。值得一提的是,昇思MindSpore已經(jīng)孵化、適配了50+國內(nèi)外主流大模型,幫助1700+企業(yè)、研究院所落地2000+大模型解決方案,包括政府、交通、金融、醫(yī)療、駕駛等多個領(lǐng)域。