
騰訊混元與騰訊音樂共同研發(fā),發(fā)布并開源語音數(shù)字人模型HunyuanVideo-Avatar
5月28日,騰訊混元發(fā)布并開源語音數(shù)字人模型HunyuanVideo-Avatar,基于騰訊混元視頻大模型(HunyuanVideo)及騰訊音樂天琴實驗室MuseV技術(shù)聯(lián)合研發(fā),支持頭肩、半身與全身景別,以及多風格、多物種與雙人場景,面向視...
5月28日,騰訊混元發(fā)布并開源語音數(shù)字人模型HunyuanVideo-Avatar,基于騰訊混元視頻大模型(HunyuanVideo)及騰訊音樂天琴實驗室MuseV技術(shù)聯(lián)合研發(fā),支持頭肩、半身與全身景別,以及多風格、多物種與雙人場景,面向視...
導(dǎo)讀 繼微軟之后,谷歌也緊跟步伐,全方位擁抱人工智能(AI)智能體(Agent)技術(shù)。在其開發(fā)者大會上,谷歌鄭重宣布,將推動智能體全面融入其核心業(yè)務(wù)——搜索領(lǐng)域,以及旗下的AI助手Gemini。通過將Gemini與搜索功能深度融合,谷歌還創(chuàng)...
截至2025年,生成式AI大模型的能力仍在迅速提升。如果關(guān)注這個領(lǐng)域,會發(fā)現(xiàn)有不少創(chuàng)業(yè)者花大量精力打造的AI應(yīng)用,但往往很快就被新一代大模型“原生功能”所取代。 這一類應(yīng)用被歸類是Prompt(提示詞)包裝層應(yīng)用,這些應(yīng)用通過設(shè)計提示詞調(diào)用...
騰訊在大模型上的技術(shù)迭代正不斷提速。 5 月 21 日,騰訊宣布,混元模型矩陣全面升級,旗艦快思考模型混元TurboS、深度思考模型混元T1雙雙迭代。基于TurboS基座,騰訊新推出視覺深度推理模型T1-Vision和端到端語音通話模型混元...
導(dǎo)讀 在AI技術(shù)競爭白熱化的當下,字節(jié)跳動Seed團隊于5月13日正式發(fā)布視覺-語言多模態(tài)大模型Seed1.5-VL,憑借僅20B激活參數(shù)的輕量級架構(gòu),在60項公開評測基準中狂攬38項SOTA(最新最優(yōu)性能),并在多項任務(wù)中與谷歌Gemin...
導(dǎo)讀 在人工智能技術(shù)持續(xù)突破的背景下,深度思考模型作為實現(xiàn)復(fù)雜推理能力的核心載體,正成為業(yè)界技術(shù)競爭的關(guān)鍵賽道。據(jù)Gartner發(fā)布的《2024年AI技術(shù)成熟度曲線》顯示,推理能力的提升已被列為未來三年AI領(lǐng)域的核心突破方向。這種轉(zhuǎn)變源于人...
5月9日,騰訊混元團隊發(fā)布并開源全新的多模態(tài)定制化視頻生成工具HunyuanCustom。該模型基于混元視頻生成大模型(HunyuanVideo)打造,在主體一致性效果超過現(xiàn)有的開源方案,并可媲美頂尖閉源模型。HunyuanCustom融合...
5月7日,記者獲悉,騰訊技術(shù)團隊針對DeepSeek開源的DeepEP通信框架進行深度優(yōu)化,使其在多種網(wǎng)絡(luò)環(huán)境下均實現(xiàn)顯著性能提升。經(jīng)測試,優(yōu)化后的通信框架性能在RoCE網(wǎng)絡(luò)環(huán)境提升100%,IB網(wǎng)絡(luò)環(huán)境提升30%,為企業(yè)開展AI大模型訓(xùn)練...
在當今科技高速發(fā)展的時代,人工智能與大模型的崛起成為了推動社會變革的核心力量。回顧人類歷史上的歷次工業(yè)革命,每一次都伴隨著生產(chǎn)工具的重大革新,從而引發(fā)生產(chǎn)力的飛躍和社會的深刻變革。如今,我們正站在智能革命的浪潮之巔,而大模型推理技術(shù),正悄然...
想看中醫(yī)得排隊?想找食療養(yǎng)生沒渠道?這屆年輕人正在開啟最硬核的方式養(yǎng)生:用AI開中藥方。 沒錯,中醫(yī)大模型正在成為一種“新風潮”。隨著越來越多的年輕人開始用AI解決脫發(fā)失眠、頸椎疼痛等,中醫(yī)數(shù)字化已悄然進入3.0時代,即中醫(yī)大模型動態(tài)辨證(...