武漢人工智能研究院的王金橋院長(zhǎng)在發(fā)言中指出,人工智能技術(shù)正經(jīng)歷從感知世界到生成創(chuàng)造世界的深刻變革,無(wú)論是模型訓(xùn)練還是推理應(yīng)用,都對(duì)算力提出了更高的要求。他提到,繼去年11月發(fā)布支持圖、文、音、3D信號(hào)的3.0版本后,今年將發(fā)布4.0版本,其多模態(tài)理解與生成能力全面對(duì)標(biāo)業(yè)界頂尖水平。王院長(zhǎng)強(qiáng)調(diào),國(guó)產(chǎn)化適配至關(guān)重要。通過與華為等伙伴合作,基于生成式AI的高效分布式訓(xùn)練,已成功將一個(gè)千億模型的訓(xùn)練時(shí)間從4個(gè)月縮短至4周。同時(shí),也強(qiáng)調(diào)當(dāng)前業(yè)界關(guān)注的焦點(diǎn)正從單純追求參數(shù)量增長(zhǎng),轉(zhuǎn)向如何延長(zhǎng)有效訓(xùn)練時(shí)間、優(yōu)化思維鏈過程等多個(gè)方面。王金橋院長(zhǎng)進(jìn)一步預(yù)測(cè),全球數(shù)據(jù)資源將于2028年前后趨于飽和,這將驅(qū)動(dòng)計(jì)算范式從訓(xùn)練密集型向推理密集型轉(zhuǎn)變。
為應(yīng)對(duì)這?趨勢(shì),技術(shù)層?的創(chuàng)新也在同步加速。華為云昇騰AI云服務(wù)技術(shù)專家介紹了在推理框架方面的優(yōu)化實(shí)踐,他表示,推理引擎是決定大模型服務(wù)性能的關(guān)鍵組件,通過對(duì)開源vLLM框架進(jìn)行深度優(yōu)化和昇騰硬件適配,研發(fā)并應(yīng)用分布式專家并行、PD分離部署、投機(jī)推理、MoE模型負(fù)載均衡、序列調(diào)度優(yōu)化等加速技術(shù)可顯著降低推理延遲、提升系統(tǒng)吞吐量。例如研發(fā)的業(yè)務(wù)動(dòng)態(tài)感知算法,能將MoE模型延遲降低10%,同時(shí)提升10%的吞吐量。這些精細(xì)化的技術(shù)創(chuàng)新,正是實(shí)現(xiàn)模型從“大”到“優(yōu)”轉(zhuǎn)變,滿足未來(lái)深度思考和內(nèi)容生成需求的關(guān)鍵所在。
創(chuàng)新突破算力瓶頸,構(gòu)筑高效穩(wěn)定AI底座
面對(duì)日益增長(zhǎng)的算力需求,特別是推理需求可能帶來(lái)的性能和體驗(yàn)的“剪刀差“難題。
華為云昇騰AI云服務(wù)產(chǎn)品總監(jiān)在演講中坦言,推出CloudMatrix超節(jié)點(diǎn)算力解決方案目的,是為了應(yīng)對(duì)國(guó)內(nèi)在算力領(lǐng)域的嚴(yán)峻挑戰(zhàn)。他分享到,“我們通過光通信技術(shù)有效解決計(jì)算芯片的高效連接問題,打破傳統(tǒng)AI服務(wù)器邊界,首創(chuàng)將384顆昇騰NPU,通過全新高速網(wǎng)絡(luò)對(duì)等互聯(lián),形成一臺(tái)超級(jí)‘AI服務(wù)器’,從根本上解決傳統(tǒng)架構(gòu)的瓶頸。目前基于CloudMatrix 384超節(jié)點(diǎn)的新一代昇騰AI云服務(wù)已經(jīng)在蕪湖、貴安、烏蘭察布、和林格爾全面上線”。
這一強(qiáng)大的基礎(chǔ)設(shè)施也得到客戶的驗(yàn)證。佳都科技首席人工智能科學(xué)家王凱博士提到,作為昇騰AI云服務(wù)的原生開發(fā)伙伴,佳都科技第一時(shí)間采用最新的CloudMatrix 384超節(jié)點(diǎn)集群進(jìn)行模型訓(xùn)練,背后是對(duì)華為AI基礎(chǔ)設(shè)施的充分信任?;劭朴崢I(yè)AI負(fù)責(zé)人王淳也表示,在處理社交媒體輿情監(jiān)測(cè)業(yè)務(wù)時(shí),業(yè)務(wù)流量常有從百萬(wàn)級(jí)到千萬(wàn)級(jí)的劇烈波動(dòng),而昇騰AI云服務(wù)的大模型推理服務(wù)提供高彈性、高可靠的推理服務(wù),有效確保業(yè)務(wù)的持續(xù)穩(wěn)定運(yùn)行。
深入垂直行業(yè),大模型從輔助工具進(jìn)化為“智能體”
如果說澎湃的算力是土壤,那么與千行萬(wàn)業(yè)的深度融合,才是AI技術(shù)落地的關(guān)鍵。
佳都科技首席人工智能科學(xué)家王凱博士認(rèn)為,AI垂直模型能力將成為未來(lái)行業(yè)操作系統(tǒng)的核心,他以佳都科技在交通行業(yè)的實(shí)踐為例,生動(dòng)詮釋AI如何從輔助工具進(jìn)化為解決核心業(yè)務(wù)問題的“智能體”。王凱博士介紹到,佳都科技通過大模型實(shí)現(xiàn)城市核心CBD區(qū)域十幾個(gè)路口信號(hào)燈的協(xié)同優(yōu)化,試點(diǎn)期間區(qū)域擁堵率下降16.22%。在軌道交通領(lǐng)域,則通過“運(yùn)維智能體”對(duì)設(shè)備進(jìn)行預(yù)測(cè)性維護(hù),實(shí)現(xiàn)了從故障發(fā)現(xiàn)到維修指導(dǎo)的全流程智能化。
同樣,慧科訊業(yè)AI負(fù)責(zé)人王淳分享,如何利用AI大模型從海量的社交媒體數(shù)據(jù)中發(fā)掘商業(yè)新機(jī)遇。為此,慧科研發(fā)垂直領(lǐng)域大模型,通過自研行業(yè)大模型與動(dòng)態(tài)本體庫(kù)構(gòu)建方法,能夠精準(zhǔn)、高效地處理每日上千萬(wàn)條的用戶聲音,為企業(yè)提供關(guān)于產(chǎn)品、競(jìng)品和營(yíng)銷活動(dòng)的深度洞察,其成本僅為傳統(tǒng)方案的1/67,并已成功服務(wù)于多個(gè)行業(yè)頭部客戶。
為讓AI開發(fā)更簡(jiǎn)單、高效,華為云MaaS大模型服務(wù)平臺(tái)產(chǎn)品總監(jiān)介紹ModelArts Studio(MaaS)平臺(tái),該平臺(tái)提供“模型、工具、應(yīng)用”三位一體的服務(wù)。模型廣場(chǎng)已上架近170個(gè)開箱即用的優(yōu)質(zhì)模型,工具廣場(chǎng)則集成了近1500個(gè)MCP服務(wù),開發(fā)者可“零代碼”式地將原生大模型與各類工具結(jié)合,快速構(gòu)建能力強(qiáng)大的多模態(tài)應(yīng)用,正如美圖秀秀將其影像處理能力轉(zhuǎn)化為API服務(wù),賦能更多開發(fā)者。
提供最優(yōu)算力基礎(chǔ)設(shè)施,以全棧AI創(chuàng)新賦能千行萬(wàn)業(yè)
本次專題論壇從AI基礎(chǔ)設(shè)施、模型服務(wù)框架到平臺(tái)服務(wù)和行業(yè)應(yīng)用的全棧AI創(chuàng)新。昇騰AI云服務(wù)正通過持續(xù)的技術(shù)和生態(tài)共建,將復(fù)雜的底層技術(shù)轉(zhuǎn)化為便捷、高效的云服務(wù),賦能千行萬(wàn)業(yè),共同迎接智能時(shí)代的到來(lái)。