相比上一代模型,Qwen-Max在訓(xùn)練中使用了更多的訓(xùn)練數(shù)據(jù)、更大的模型規(guī)模、更強(qiáng)的人類對(duì)齊,最終達(dá)到了更高的智能水平。在MMLU-Pro、MATH、GSM8K、MBPP、MultiPL-E、LiveCodeBench等十多個(gè)權(quán)威基準(zhǔn)上,Qwen-Max表現(xiàn)接近GPT-4o,數(shù)學(xué)能力、代碼能力則超越了GPT-4o。數(shù)學(xué)和代碼所代表的推理能力是大模型智能水平的最重要體現(xiàn)。

語言模型方面,Qwen2.5開源了7個(gè)尺寸,0.5B、1.5B、3B、7B、14B、32B、72B,它們?cè)谕葏?shù)賽道都創(chuàng)造了業(yè)界最佳成績,型號(hào)設(shè)定充分考慮下游場景的不同需求,3B是適配手機(jī)等端側(cè)設(shè)備的黃金尺寸;32B是最受開發(fā)者期待的“性價(jià)比之王”,可在性能和功耗之間獲得最佳平衡,Qwen2.5-32B的整體表現(xiàn)超越了Qwen2-72B。

重磅開源Qwen2.5,性能超越Llama座

通義千問新一代開源模型Qwen2.5中的旗艦?zāi)P蚎wen2.5-72B性能超越Llama 405B,再登全球開源大模型王座。Qwen2.5全系列涵蓋多個(gè)尺寸的大語言模型、多模態(tài)模型、數(shù)學(xué)模型和代碼模型,每個(gè)尺寸都有基礎(chǔ)版本、指令跟隨版本、量化版本,總計(jì)上架100多個(gè)模型,刷新業(yè)界紀(jì)錄。

Qwen2.5全系列模型都在18T tokens數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練,相比Qwen2,整體性能提升18%以上,擁有更多的知識(shí)、更強(qiáng)的編程和數(shù)學(xué)能力。Qwen2.5-72B模型在MMLU-rudex基準(zhǔn)(考察通用知識(shí))、MBPP 基準(zhǔn)(考察代碼能力)和MATH基準(zhǔn)(考察數(shù)學(xué)能力)的得分高達(dá)86.8、88.2、83.1。

Qwen2.5支持高達(dá)128K的上下文長度,可生成最多8K內(nèi)容。模型擁有強(qiáng)大的多語言能力,支持中文、英文、法文、西班牙文、俄文、日文、越南文、阿拉伯文等 29 種以上語言。模型能夠絲滑響應(yīng)多樣化的系統(tǒng)提示,實(shí)現(xiàn)角色扮演和聊天機(jī)器人等任務(wù)。在指令跟隨、理解結(jié)構(gòu)化數(shù)據(jù)(如表格)、生成結(jié)構(gòu)化輸出(尤其是JSON)等方面Qwen2.5都進(jìn)步明顯。

通義萬相全面升級(jí),全新視頻生成模型發(fā)布

同日,可生成影視級(jí)高清視頻的通義萬相全面升級(jí),在影視創(chuàng)作、動(dòng)畫設(shè)計(jì)、廣告設(shè)計(jì)等領(lǐng)域大顯身手。即日起,所有用戶可通過通義APP及通義萬相官網(wǎng)免費(fèi)體驗(yàn)。

據(jù)介紹,通義萬相首批上線文生視頻、圖生視頻功能,在文生視頻功能中,用戶輸入任意文字提示詞,即可生成一段高清視頻,支持中英文多語言輸入,并可以通過靈感擴(kuò)寫功能智能豐富視頻內(nèi)容表現(xiàn)力,支持16:9、9:16等多種比例生成;在圖生視頻功能中,支持用戶將任意圖片轉(zhuǎn)化為動(dòng)態(tài)視頻,按照上傳的圖像比例或預(yù)設(shè)比例進(jìn)行生成,同時(shí)可以通過提示詞來控制視頻運(yùn)動(dòng)。

現(xiàn)場,阿里云演示了該模型強(qiáng)大的運(yùn)動(dòng)生成和概念組合能力,輸入「穿著滑冰鞋的小兔子在冰面上靈活移動(dòng)的可愛場景」,通義萬相僅用數(shù)分鐘就能生成一段高清、逼真的視頻。

通義萬相視頻生成大模型集成了多項(xiàng)創(chuàng)新技術(shù),有效解決畫面表現(xiàn)力和大幅度運(yùn)動(dòng)等視頻生成技術(shù)難題。針對(duì)運(yùn)動(dòng)生成和物理模擬等難點(diǎn)優(yōu)化算法,實(shí)現(xiàn)了大幅度主體運(yùn)動(dòng)和運(yùn)鏡控制,并有效模擬真實(shí)世界物理特性;設(shè)計(jì)了高壓縮比、高質(zhì)量視頻VAE框架,有效降低視頻信息冗余,并保持高質(zhì)量視頻重構(gòu)能力;同時(shí),基于輕量微調(diào)框架和精選數(shù)據(jù)集優(yōu)化訓(xùn)練,在中式傳統(tǒng)元素、風(fēng)格化視頻生成上表現(xiàn)更好。

去年7月,通義萬相圖像生成大模型首次亮相,目前已累計(jì)生成7500萬張圖片。云棲大會(huì)現(xiàn)場,通義萬相宣布視覺生成大模型全面升級(jí)為Diffusion Transformer框架,同時(shí)結(jié)合通義千問復(fù)雜提示詞解釋能力,有效提升畫面表現(xiàn)力、語義理解能力、可控生成能力。隨著通義萬相視頻生成模型的發(fā)布,通義大模型已覆蓋文本生成、圖像理解、視頻理解、音頻理解、圖像生成、視頻生成等全模態(tài)場景。

通義靈碼AI編程能力再進(jìn)化,說幾句話就能開發(fā)網(wǎng)頁

隨著通義大模型能力的全面提升,阿里云通義靈碼迎來重磅升級(jí),從一年前只能完成基礎(chǔ)的輔助編程任務(wù),進(jìn)化到幾句話就能完成需求理解、任務(wù)拆解、代碼編寫、修改BUG、測試等開發(fā)任務(wù),最快幾分鐘可從0到1完成應(yīng)用開發(fā),提升數(shù)十倍開發(fā)效率。

自去年首次亮相以來,通義靈碼已入職中華財(cái)險(xiǎn)、哈啰集團(tuán)、長安汽車等公司,累計(jì)生成代碼超10億行,是國內(nèi)最受歡迎的輔助編程工具。全新升級(jí)的通義靈碼模擬了人類程序員的能力,可完成更復(fù)雜、更全面的任務(wù);通義靈碼還可以脫離專業(yè)IDE軟件,在web端直接執(zhí)行缺陷修改、需求分析、代碼實(shí)現(xiàn)、問題排查等任務(wù)工作流,兼具架構(gòu)師、開發(fā)工程師、測試工程師等多種崗位技能,大幅縮短了應(yīng)用的開發(fā)周期。

例如,真人程序員手動(dòng)開發(fā)一個(gè)網(wǎng)頁,通常需要1天的時(shí)間完成需求分解、寫代碼、測試等任務(wù);現(xiàn)在,人類只需要輸入需求,通義靈碼5分鐘就能完成整個(gè)過程。阿里云表示,未來只要有創(chuàng)意,不懂代碼也能開發(fā)應(yīng)用和軟件。

大會(huì)現(xiàn)場,一位13歲的中學(xué)生在通義靈碼上輸入幾句話,2分鐘就生成了一個(gè)python語言編寫的倒計(jì)時(shí)網(wǎng)頁;現(xiàn)場還有參會(huì)者,用通義靈碼修改開源魂斗羅游戲代碼,在9個(gè)代碼文件2000多行代碼里,幾分鐘就精準(zhǔn)修改了游戲角色的生命值、跳躍高度等參數(shù)。

目前,通義靈碼已廣泛應(yīng)用于金融、制造、互聯(lián)網(wǎng)、交通、汽車、能源等行業(yè)。在 Gartner 首個(gè)AI代碼助手魔力象限報(bào)告中,阿里云成為唯一進(jìn)入挑戰(zhàn)者象限的中國科技公司。

三款主力模型再次降價(jià)

繼5月首次大幅降價(jià)后,阿里云百煉平臺(tái)上的三款通義千問主力模型再次降價(jià)。Qwen-Turbo價(jià)格直降85%,低至百萬tokens 0.3元,Qwen-Plus和Qwen-Max分別再降價(jià)80%和50%。其中,Qwen-Plus推理能力追平GPT4,可應(yīng)用于復(fù)雜任務(wù),是效果、速度及成本均衡的最優(yōu)選擇,降價(jià)后,Qwen-Plus性價(jià)比達(dá)到業(yè)界最高,同等規(guī)模較行業(yè)價(jià)格低84%。同時(shí),阿里云百煉平臺(tái)還為所有新用戶免費(fèi)贈(zèng)送超5000萬tokens及4500張圖片生成額度。

自首次宣布降價(jià)后,阿里云百煉付費(fèi)客戶數(shù)較上一個(gè)季度增長超過200%,大批企業(yè)和開發(fā)者放棄私有化部署,選擇直接在百煉上調(diào)用各類AI大模型。目前,阿里云百煉已服務(wù)超30萬客戶,包括一汽、金山、獵聘、哈啰集團(tuán)、國家天文臺(tái)等眾多知名企業(yè)和機(jī)構(gòu)。本次通義第二輪降價(jià),將繼續(xù)提升AI在各行各業(yè)的滲透率。

分享到

xiesc

相關(guān)推薦