阿里云智能集團資深副總裁、公共云事業(yè)部總裁劉偉光

劉偉光指出,大模型未來發(fā)展需聚焦兩大方向:一是強化推理能力,二是推動全模態(tài)融合。2025年3月,阿里云開源的通義千問QwQ-32B推理模型在數(shù)字代碼與通用能力上實現(xiàn)重大突破,尤其在小參數(shù)模型中展現(xiàn)了大參數(shù)模型的Sora級性能,并顯著提升了對Agent智能體的兼容性。

未來,大模型將向更強推理能力演進。隨著任務(wù)規(guī)劃與工具使用能力的增強,模型將具備更高智慧水平,能夠解決更復(fù)雜的問題。這一方向與阿里云的戰(zhàn)略布局高度契合。

02

推理服務(wù)基礎(chǔ)設(shè)施不斷優(yōu)化

在AI推理訓(xùn)練應(yīng)用爆發(fā)的背景下,AI基礎(chǔ)設(shè)施不斷優(yōu)化。針對模型參數(shù)量擴大導(dǎo)致的冷啟動和規(guī)?;瘮U容瓶頸,阿里云推出全新模型權(quán)重服務(wù),使大模型0 – 100節(jié)點冷啟動速度提升21倍,50 – 100節(jié)點擴容速度提升12倍;

針對MOE架構(gòu)調(diào)度復(fù)雜問題,阿里云推出分布式推理調(diào)度引擎Llumnix,讓首Token延遲下降92%,每個Token生成時間降低15%;

今年阿里云實現(xiàn)流量感知的PD分離,提升端到端服務(wù)吞吐近91%,千萬級活躍用戶場景KV Cache命中率提升10倍。這些底層技術(shù)優(yōu)化最終為企業(yè)級客戶提供更穩(wěn)定高效的API服務(wù),滿足多元化服務(wù)等級目標。

03

開發(fā)工具:降低AI門檻

在開發(fā)工具領(lǐng)域,阿里云百煉平臺通過持續(xù)迭代升級,現(xiàn)已構(gòu)建起一套覆蓋全鏈路的應(yīng)用開發(fā)工具體系,為企業(yè)級AI應(yīng)用開發(fā)者提供從開發(fā)到落地的全流程保障。具體功能包括:

記憶增強型工具:通過智能上下文管理機制,顯著提升模型推理效率,實現(xiàn)高效記憶與快速響應(yīng);

跨模態(tài)檢索增強生成(RAG)工具:支持文本、圖像、音頻等多模態(tài)數(shù)據(jù)融合搜索,大幅提高檢索結(jié)果的精準度與相關(guān)性;

動態(tài)模型路由工具:根據(jù)復(fù)雜業(yè)務(wù)場景下的任務(wù)需求,智能調(diào)度最優(yōu)模型資源,確保系統(tǒng)高效運行;

可視化工作流編排工具:通過拖拽式界面實現(xiàn)多智能體協(xié)同調(diào)度,支持企業(yè)級SLA(服務(wù)等級協(xié)議)保障,簡化復(fù)雜流程開發(fā);

低代碼智能體構(gòu)建工具:提供業(yè)務(wù)邏輯快速注入能力,企業(yè)可在5-10分鐘內(nèi)完成智能體搭建,并集成豐富的插件生態(tài);

全鏈路監(jiān)控分析工具:支持AI Agent及應(yīng)用全生命周期的實時觀測,涵蓋性能、使用效果等多維度數(shù)據(jù)分析,助力企業(yè)持續(xù)優(yōu)化。

3

行業(yè)落地

從“技術(shù)演示”到“價值創(chuàng)造”的臨界點

阿里云智能集團資深副總裁、公共云事業(yè)部總裁劉偉光在主題演講中強調(diào),大模型的社會價值正加速滲透至企業(yè)市場。阿里云將持續(xù)深化技術(shù)投入,構(gòu)建覆蓋AI全生命周期的技術(shù)體系,通過開源開放策略推動AI應(yīng)用創(chuàng)新,助力企業(yè)實現(xiàn)智能化升級。

技術(shù)突破驅(qū)動場景革新

近一年多來,通義大模型技術(shù)實現(xiàn)跨越式發(fā)展:

截至2025年1月底,阿里云百煉平臺累計吸引超29萬家企業(yè)及開發(fā)者接入通義API,AI技術(shù)正從實驗性應(yīng)用邁向標準化生產(chǎn)。

標桿案例詮釋技術(shù)價值

地平線:智駕模型訓(xùn)練效率提升40%

依托阿里云萬卡智算集群,地平線實現(xiàn)端到端智駕模型訓(xùn)練效率突破。通過智能調(diào)度與故障自愈技術(shù),集群整體故障恢復(fù)時間縮短40%以上,為自動駕駛技術(shù)規(guī)?;逃玫於ㄋ懔A(chǔ)。

中華財險:保險業(yè)效率標桿重塑

基于云原生架構(gòu)與通義大模型,中華財險實現(xiàn)從“數(shù)字化”到“數(shù)智化”的跨越。通義靈碼賦能60%研發(fā)人員AI編程,代碼采納率達37.5%(累計53萬行)。條款解讀助手與智能理賠助手覆蓋保險全流程,推動行業(yè)效率標準升級。

總臺春晚:全球直播覆蓋創(chuàng)新高  

2025年春晚新媒體端直播收視次數(shù)突破21.3億次,創(chuàng)歷史新高。作為獨家云計算AI合作伙伴,阿里云依托全球分布式云節(jié)點與通義大模型,保障春晚直播“零卡頓、零故障”,展現(xiàn)中國云技術(shù)的全球領(lǐng)先實力。

叮咚買菜:生鮮電商成本降低70% 

叮咚買菜通過百煉平臺接入Qwen-plus、Qwen2.5-VL等模型,結(jié)合ASR/TTS技術(shù)重構(gòu)售前咨詢、供應(yīng)鏈管理、售后客服全鏈路。相比傳統(tǒng)本地化部署模式,模型推理成本降低超70%,實現(xiàn)降本增效雙突破。

美高域:醫(yī)療硬件AI化重構(gòu)服務(wù)體驗  

美高域?qū)⑼x大模型深度融入簡易體征采集設(shè)備,通過Qwen實現(xiàn)血壓、血氧等數(shù)據(jù)的實時分析,并生成個性化健康報告。醫(yī)患對話語音實時轉(zhuǎn)錄與多模態(tài)分析,提升診斷精準度與溝通效率。依托阿里云算力,美高域打造從問診到隨訪的全流程數(shù)字化醫(yī)療體系,重塑患者服務(wù)體驗。

4

百煉上線業(yè)界首個

全生命周期MCP服務(wù)

推動AI普惠和規(guī)?;瘧?yīng)用

為了讓AI Agent有“更聰明的大腦”、“更豐富的交互”,4月9日,阿里云百煉上線業(yè)界首個全生命周期MCP服務(wù),無需用戶管理資源、開發(fā)部署、工程運維等工作,5分鐘即可快速搭建一個專屬MCP Agent,大幅降低Agent的開發(fā)門檻。百煉平臺首批上線了高德、無影、Fetch、Notion等50多款阿里巴巴集團和三方MCP服務(wù),覆蓋生活信息、瀏覽器、信息處理、內(nèi)容生成等領(lǐng)域,可滿足不同場景的Agent應(yīng)用開發(fā)需求。

同日,阿里云還預(yù)告了AI Agent Store的愿景,通過Agent Store這種創(chuàng)新模式,把阿里巴巴集團和生態(tài)伙伴的Agent向外開放,讓各行各業(yè)的人都可以擁有自己專屬的助理。

未來展望

在AI勢能峰會上,阿里云發(fā)布AI生態(tài)伙伴計劃——“繁花計劃”,并推出AI應(yīng)用與服務(wù)市場。未來三年,阿里云將在基礎(chǔ)設(shè)施、模型、數(shù)據(jù)、工具、應(yīng)用、交付六大領(lǐng)域與生態(tài)伙伴一起服務(wù)百萬云上客戶,拓展百億商機,共同打造中國繁榮的AI生態(tài)。

據(jù)介紹,“繁花計劃”將根據(jù)生態(tài)合作伙伴產(chǎn)品成熟度,提供從技術(shù)到商業(yè)化所需的云上資源及算力支持,幫助伙伴在AI領(lǐng)域探索創(chuàng)新,實現(xiàn)從首客拓展到規(guī)模化、商業(yè)化的目標,為各行業(yè)客戶提供AI技術(shù)支持和服務(wù),包括產(chǎn)品云上打包、商業(yè)化路徑規(guī)劃、AI伙伴全生命周期支撐等。

“長遠看,AI最大的價值是推動各行各業(yè)的生產(chǎn)力變革?!贝竽P偷纳鐣r值正在向企業(yè)市場釋放,阿里云將堅定投入,打造全棧領(lǐng)先的技術(shù),持續(xù)開源開放,為AI應(yīng)用提速。

分享到

lixiangjing

算力豹主編

相關(guān)推薦