亚洲国产亚综合在线区,成人国产精品一区二区视频

年初，混元TurboS正式發(fā)布，作為業(yè)界首款大規(guī)模混合Mamba-MoE模型，其在效果與性能上已展現(xiàn)出顯著優(yōu)勢。而這一最新突破，則得益于預訓練階段的tokens增訓，以及后訓練階段引入長短思維鏈融合技術，使得TurboS理科推理提升超10%，代碼能力提升24%，競賽數(shù)學成績大幅提升了39%。

早在去年下半年，騰訊就大力投入了深度思考模型的路線攻關。深度思考模型混元T1自年初上線元寶App后，持續(xù)快速迭代。近期，混元T1也迎來新升級，在多項核心能力上均實現(xiàn)了提升：其中，在競賽數(shù)學上效果提升8%；在常識問答上提升8%；在復雜任務的Agent能力提升了13%。

多模態(tài)模型快速迭代，首秀3D場景生成

基于TurboS的基座模型，混元進一步拓展了圖片和音頻的多模態(tài)理解能力。新發(fā)布的混元視覺深度推理模型T1-Vision，支持多圖輸入，具備原生長思維鏈，輕松實現(xiàn)“邊看圖邊思考”，整體效果相比此前級聯(lián)方案提升 5.3%，整體理解速度提升50%。

端到端語音通話模型混元Voice，實現(xiàn)低延遲語音通話，相比級聯(lián)方案，響應速度提升超過30%，降至1.6秒，擬人性和情緒應用能力也有明顯提升，目前已在騰訊元寶App灰度上線。實時視頻通話AI體驗，近期將推出。

今年以來，混元的迭代速度明顯加快。在多模態(tài)生成領域，混元圖像2.0率先實現(xiàn)“毫秒級”生圖，GenEval基準測試準確率超95%。這背后得益于超高壓縮倍率的圖像編解碼器以及全新擴散架構，模型參數(shù)量提升了一個數(shù)量級，帶來交互體驗的革新。在主觀畫面質(zhì)量和美學層面的人工測評中，混元圖像2.0也被認為是“AI味”最少的模型之一。

混元3D v2.5憑借業(yè)界首創(chuàng)的稀疏3D原生架構，實現(xiàn)了可控性與超高清生成能力的代際飛躍，幾何模型精度提升10倍，紋理貼圖達4K。在端到端評測中，混元文生3D在17個生成類目中占據(jù)15個第一，圖生3D在17個類目中全部取得第一。

在游戲領域，混元推出精通游戲美術與術語的混元游戲視覺生成模型，涵蓋游戲技能特效生成、角色動態(tài)立繪、實時交互游戲世界模型、角色多視圖等五大子模型。混元游戲視覺生成平臺也正式上線，面向工業(yè)級游戲資產(chǎn)生成，讓游戲美術設計效率提升數(shù)十倍。

近期，混元還將推出首個大規(guī)模、可漫游3D場景生成模型，支持沉浸式交互、多樣風格場景生成及360°全景漫游體驗，助力游戲、具身智能等行業(yè)創(chuàng)新。

混元3D模型下載量超160萬，多尺寸模型全面開源

騰訊云副總裁、騰訊混元大模型技術負責人王迪表示，混元正加速向智能化的深度與廣度邁進，為AI普惠與產(chǎn)業(yè)升級提供堅實支撐。混元堅定擁抱開源，持續(xù)推進多尺寸、多場景的全系模型開源。

目前，混元已實現(xiàn)圖像、視頻、3D、文本等在內(nèi)的全模態(tài)開源，其中，混元3D模型Hugging Face下載量超過160萬。未來，混元計劃推出多尺寸混合推理模型，從0.5B到32B的dense模型，以及激活13B的MoE模型，適配企業(yè)與端側(cè)不同需求?；煸獔D像、視頻、3D等多模態(tài)基礎模型及配套插件模型也將持續(xù)開源。