本月刊是精心策劃的專欄,為您緩緩展開2025年3月份以來算力世界以及人工智能領(lǐng)域的精彩篇章,涵蓋公司新聞、產(chǎn)品動(dòng)態(tài)、政策發(fā)布與會(huì)議活動(dòng)四大板塊。

文字編輯|李祥敬

1

公司新聞

2025超云產(chǎn)品技術(shù)大會(huì)“讓AI更簡單”

2月28日,2025超云產(chǎn)品技術(shù)大會(huì)在北京舉辦,主題為“讓AI更簡單”。大會(huì)聚焦AI技術(shù)落地的“最后一公里”挑戰(zhàn),匯聚行業(yè)專家和最終用戶,探索簡化AI部署、使用、運(yùn)維與安全的新路徑,助力智能化轉(zhuǎn)型。

會(huì)上,超云聯(lián)合生態(tài)伙伴發(fā)布SuperCube系列AI大模型一體機(jī),實(shí)現(xiàn)算力、算法、數(shù)據(jù)、工具、方案及部署方式軟硬件一體化集成,開箱即用,解決企業(yè)AI應(yīng)用難題。浪潮、上海零假設(shè)、西云算力等分享智能化轉(zhuǎn)型實(shí)踐和創(chuàng)新應(yīng)用。同時(shí),《私域大模型部署白皮書》發(fā)布,系統(tǒng)解決AI部署難題,提供實(shí)踐指導(dǎo)和理論基礎(chǔ),指出未來私域大模型部署將摒棄“硬件堆砌”模式,實(shí)現(xiàn)質(zhì)變。展區(qū)展示超云三款A(yù)I大模型一體機(jī)及明星GPU服務(wù)器等創(chuàng)新成果,彰顯超云在AI領(lǐng)域的領(lǐng)先地位和簡化AI各環(huán)節(jié)的決心。大會(huì)成功舉辦標(biāo)志超云在AI算力、算法優(yōu)化及生態(tài)構(gòu)建上的領(lǐng)先,展望未來,超云將持續(xù)深化AI戰(zhàn)略,共啟人工智能黃金時(shí)代。

單月業(yè)績破億,10億熱錢再狂砸智譜AI!

3月3日,智譜獲杭州城投產(chǎn)業(yè)基金、上城資本等地方資本超10億元戰(zhàn)略融資,將用于GLM大模型技術(shù)創(chuàng)新和生態(tài)發(fā)展,助力浙江省及長三角地區(qū)數(shù)字產(chǎn)業(yè)轉(zhuǎn)型升級(jí)。智譜已在杭州成立浙江智譜新篇科技有限公司,助力AI技術(shù)發(fā)展。春節(jié)后不到一個(gè)月,智譜收入破億,API平臺(tái)付費(fèi)用戶增長超30%。

AI Agent的「DS 時(shí)刻」,Manus掀起AI圈又一層海浪

2025年稱AI Agent元年,3月6日凌晨,Monica.im發(fā)布全球首款A(yù)I Agent產(chǎn)品“Manus”。Manus是真正自主的AI代理,能解決復(fù)雜多變?nèi)蝿?wù),不僅提供建議或答案,還能交付完整任務(wù)成果。其介紹視頻僅4分鐘,威力驚人。Manus在拉丁文里意為“手”,寓意知識(shí)不僅要在腦子里,還要能用手執(zhí)行,是Agent和AI Bot產(chǎn)品的本質(zhì)進(jìn)階。Manus官網(wǎng)和用戶展示的使用案例包括:旅行規(guī)劃、股票分析、教育內(nèi)容創(chuàng)建、保險(xiǎn)政策比較、供應(yīng)商采購、財(cái)務(wù)報(bào)告分析、創(chuàng)業(yè)公司列表整理、在線商店運(yùn)營分析。Manus通過思維鏈和工具調(diào)用,輸出完整、專業(yè)結(jié)果,用戶感嘆其真能幫人類做事。在GAIA基準(zhǔn)測試中,Manus在所有難度級(jí)別上都取得新SOTA表現(xiàn)。

英特爾宣布新CEO陳立武,技術(shù)領(lǐng)袖回歸能否扭轉(zhuǎn)芯片霸主頹勢(shì)?

英特爾正式任命65歲的華裔技術(shù)領(lǐng)袖陳立武(Lip-Bu Tan)為新任首席執(zhí)行官,任期自3月18日生效。這場臨危受命的任命,不僅標(biāo)志著英特爾開啟“工程師文化”復(fù)興,更折射出半導(dǎo)體行業(yè)格局重塑的深層博弈。

陳立武是半導(dǎo)體行業(yè)的資深人士,擁有豐富的領(lǐng)導(dǎo)經(jīng)驗(yàn)和深厚的技術(shù)背景。陳立武現(xiàn)年65歲,出生于馬來西亞,在新加坡長大,后移民美國。陳立武擁有新加坡南洋理工大學(xué)物理學(xué)學(xué)士學(xué)位、麻省理工學(xué)院核工程理學(xué)碩士學(xué)位和舊金山大學(xué)工商管理碩士學(xué)位,2022年獲得了半導(dǎo)體行業(yè)協(xié)會(huì)的最高榮譽(yù)羅伯特·諾伊斯獎(jiǎng)。

他曾于2009年至2021年擔(dān)任芯片設(shè)計(jì)軟件公司Cadence Design Systems的首席執(zhí)行官,在此期間推動(dòng)公司營收翻倍、股價(jià)飆升超3200%,并主導(dǎo)收購48家芯片設(shè)計(jì)企業(yè),構(gòu)建起覆蓋EDA工具、IP核和代工服務(wù)的完整生態(tài)鏈57立武的這些成就不僅贏得了業(yè)界的廣泛認(rèn)可,也為他此次擔(dān)任英特爾CEO奠定了堅(jiān)實(shí)的基礎(chǔ)。

浪潮信息:推出CPU推理服務(wù)器支持DeepSeek和QwQ,元腦加速AI普及

浪潮信息宣布推出元腦CPU推理服務(wù)器,可高效運(yùn)行DeepSeek和千問QwQ等新一代大推理模型。元腦CPU推理服務(wù)器NF8260G7和NF8480G7設(shè)計(jì)采用4顆高性能通用CPU和多通道內(nèi)存系統(tǒng),通過先進(jìn)的張量并行策略和AMX加速技術(shù),單機(jī)即可高效運(yùn)行DeepSeek-R1 32B和QwQ-32B推理模型,單用戶性能超20 tokens/s,可同時(shí)處理20個(gè)并發(fā)用戶請(qǐng)求,是企業(yè)快速、易獲得、低投入部署上線大模型平臺(tái)的理想算力選擇,將加速DeepSeek帶動(dòng)下AI落地普及速度。大模型行業(yè)應(yīng)用落地加速,DeepSeek-R1 32B、QwQ-32B等模型中文能力見長,并在理解能力和知識(shí)儲(chǔ)備上有顯著優(yōu)勢(shì),是企業(yè)平衡性能和部署成本的最佳模型選擇。元腦CPU推理服務(wù)器僅基于通用處理器進(jìn)行軟硬協(xié)同優(yōu)化,可為企業(yè)32B模型推理與云計(jì)算、數(shù)據(jù)庫等通用關(guān)鍵業(yè)務(wù)場景融合提供更高效、更靈活、更穩(wěn)定的AI通用算力支撐。

國產(chǎn)AI卷瘋了,QwQ-32B登頂全球最強(qiáng)開源模型!

2025年3月17日,由圖靈獎(jiǎng)得主、Meta首席AI科學(xué)家楊立昆(Yann LeCun)領(lǐng)銜發(fā)起的國際權(quán)威大模型評(píng)測榜單LiveBench公布了最新一期結(jié)果,全球大模型格局再次迎來洗牌。

阿里巴巴最新開源的推理模型通義千問QwQ-32B以綜合評(píng)分92.3分位列全球第五,超越OpenAI-GPT-4.5preview(91.8分)、Google-Gemini2.0(90.1分)等頂尖閉源模型,成為榜單前十中僅有的兩款開源模型之一。

Meta Llama模型下載量突破十億,增長速度驚人!

Meta Llama模型下載量突破十億,增長速度驚人!Meta公司的開源人工智能模型家族Llama近日迎來重要里程碑,下載量已超十億次。此消息由公司首席執(zhí)行官馬克?扎克伯格在社交媒體Threads上宣布。與2024年12月的6.5億次下載相比,Llama下載量在短短三個(gè)月內(nèi)激增153%。Llama最初為研究人員推出,逐漸吸引了全球開發(fā)者和人工智能愛好者的關(guān)注。Meta生成性人工智能部門副總裁阿哈邁德?阿爾-達(dá)赫勒在LinkedIn上分享此成就,表示過去兩年里,Llama從研究項(xiàng)目發(fā)展成最廣泛使用的開源人工智能模型。阿爾-達(dá)赫勒對(duì)團(tuán)隊(duì)努力表示自豪,提到Meta生成性人工智能組織2月27日迎來兩周年慶。他表示,看到團(tuán)隊(duì)為全球開發(fā)者、初創(chuàng)公司和企業(yè)付出的努力,感到無比振奮和謙卑。他認(rèn)為,Llama下載量代表了對(duì)開源人工智能的信任,體現(xiàn)了大家共同構(gòu)建未來的信念。為進(jìn)一步推動(dòng)Llama發(fā)展,Meta計(jì)劃未來幾個(gè)月內(nèi)發(fā)布多個(gè)Llama模型,包括類似于OpenAI的o3-mini的“推理”模型,以及具備多模態(tài)能力的版本。扎克伯格還暗示可能推出具有“代理”功能的模型,意味著某些模型可能具備自主操作能力。

AI界的“春晚”英偉達(dá)GTC大會(huì):四代旗艦GPU全揭露!

2025年3月19日黃仁勛身著經(jīng)典黑色皮衣登臺(tái),未經(jīng)彩排的2小時(shí)演講激情四溢。他發(fā)布了全新GB300芯片、兩款個(gè)人AI計(jì)算機(jī)、機(jī)器人平臺(tái)Newton,并宣布與通用汽車攜手,將AI技術(shù)應(yīng)用于自動(dòng)駕駛領(lǐng)域。此外,他還預(yù)告了下一代超級(jí)芯片架構(gòu)Vera Rubin及下下一代芯片F(xiàn)eynman架構(gòu)。還多次提到中國大模型DeepSeek。

美國將浪潮等54家中國科技企業(yè)加入實(shí)體清單!

當(dāng)?shù)貢r(shí)間周二(3月25日),美國商務(wù)部工業(yè)與安全局(BIS)在聯(lián)邦公報(bào)上發(fā)布兩份文件,將54個(gè)中國科技企業(yè)和機(jī)構(gòu)納入“實(shí)體清單”,預(yù)期將于3月28日生效。在其中的一份文件中,美國商務(wù)部將12家公司列入“實(shí)體清單”,這些公司涉及一系列與中國AI大模型開發(fā)、服務(wù)器以及超級(jí)計(jì)算機(jī)產(chǎn)業(yè),包括北京智源人工智能研究院、寧暢信息產(chǎn)業(yè)、中科可控旗下服務(wù)器品牌Suma,以及浪潮信息在中國大陸、中國香港和中國臺(tái)灣地區(qū)的多家子公司。此前在2023年3月,浪潮信息的控股股東浪潮集團(tuán)(Inspur Group)已經(jīng)被納入美國“實(shí)體清單”。

寶馬官宣與阿里達(dá)成AI合作 通義大模型將上車

寶馬集團(tuán)與阿里巴巴集團(tuán)正式宣布在中國市場達(dá)成一項(xiàng)重要的戰(zhàn)略合作,雙方將共同聚焦于人工智能(AI)大語言模型以及智能語音交互等前沿技術(shù)領(lǐng)域,致力于開發(fā)更符合中國用戶需求的前沿解決方案。此次合作中,阿里巴巴集團(tuán)的通義大模型將被引入到寶馬即將投放中國市場的新世代系列車型中,為寶馬汽車的智能化升級(jí)提供強(qiáng)大的技術(shù)支持,注入“智慧內(nèi)核”。這一創(chuàng)新舉措將極大提升寶馬車型的智能交互體驗(yàn)和整體性能。值得一提的是,寶馬集團(tuán)于3月25日在中國市場啟動(dòng)了360度全鏈AI戰(zhàn)略。該戰(zhàn)略以數(shù)字化生產(chǎn)運(yùn)營為基礎(chǔ),通過優(yōu)化生產(chǎn)流程、提升管理效率,為智能汽車的制造提供了堅(jiān)實(shí)的保障。這一戰(zhàn)略的實(shí)施,標(biāo)志著寶馬在智能化轉(zhuǎn)型方面邁出了重要一步。展望未來,寶馬集團(tuán)計(jì)劃在2026年實(shí)現(xiàn)國產(chǎn)新世代車型的量產(chǎn)。這款車型將迎來重大的智能化變革,首次引入AI大語言模型,賦能全新BMW智能個(gè)人助理,并將AI智能體融入座艙之中。該車型將具備擬人化溝通、多智能體協(xié)同及開放生態(tài)整合等核心能力,能夠?qū)崿F(xiàn)精準(zhǔn)意圖捕捉、復(fù)雜指令解析、模糊語義理解及嚴(yán)謹(jǐn)邏輯推演,為用戶帶來前所未有的自然流暢互動(dòng)體驗(yàn)。

2

產(chǎn)品動(dòng)態(tài)

英特爾2025年世界移動(dòng)通信大會(huì)發(fā)布創(chuàng)新技術(shù)

2025年3月3日,巴塞羅那——在2025年世界移動(dòng)通信大會(huì)(MWC)上,英特爾宣布了一系列以人工智能(AI)和5G為核心的創(chuàng)新解決方案,旨在幫助電信運(yùn)營商應(yīng)對(duì)高昂資本支出、安全挑戰(zhàn)及傳統(tǒng)系統(tǒng)集成難題,推動(dòng)網(wǎng)絡(luò)基礎(chǔ)設(shè)施向高效、智能和可持續(xù)方向演進(jìn)。

英特爾展示了基于其最新至強(qiáng)6系統(tǒng)級(jí)芯片的突破性技術(shù),該芯片專為網(wǎng)絡(luò)與邊緣計(jì)算設(shè)計(jì),集成了AI加速功能、英特爾高級(jí)矢量擴(kuò)展(AVX)和高級(jí)矩陣擴(kuò)展(AMX),將AI RAN性能較前代提升3.2倍,且無需依賴獨(dú)立加速器。其高能效架構(gòu)支持單服務(wù)器整合多站點(diǎn)vRAN部署,顯著減少服務(wù)器占用空間與總擁有成本(TCO)。

此外,芯片內(nèi)嵌的媒體轉(zhuǎn)碼加速器可將視頻轉(zhuǎn)碼性能功耗比提升14.25倍,為體育直播、游戲等實(shí)時(shí)場景提供更低功耗的高質(zhì)量體驗(yàn)。安全性方面,至強(qiáng)6芯片通過零信任安全架構(gòu),為從邊緣到云的端到端連接提供全面防護(hù),應(yīng)對(duì)網(wǎng)絡(luò)邊緣數(shù)據(jù)激增帶來的安全挑戰(zhàn)。

智譜發(fā)布首個(gè)能生成漢字的開源文生圖模型CogView4

2025年3月4日,北京智譜華章科技有限公司宣布推出首個(gè)支持生成漢字的開源文生圖模型——CogView4。該模型在DPG-Bench基準(zhǔn)測試中綜合評(píng)分排名第一,成為開源文生圖模型中的SOTA(State of the Art),并遵循Apache2.0協(xié)議,是首個(gè)支持該協(xié)議的圖像生成模型。CogView4具備強(qiáng)大的復(fù)雜語義對(duì)齊和指令跟隨能力,支持任意長度的中英雙語輸入,并能生成任意分辨率的圖像。它不僅能夠生成高質(zhì)量的圖像,還能在畫面中自然地融入漢字,滿足廣告、短視頻等領(lǐng)域的創(chuàng)意需求。技術(shù)上,CogView4采用了具備雙語能力的GLM-4encoder,通過中英雙語圖文訓(xùn)練,實(shí)現(xiàn)了雙語提示詞輸入能力。

騰訊發(fā)布Hunyuan-TurboS:首款超大型混合Transformer-Mamba MoE模型震撼登場

騰訊在X平臺(tái)上正式宣布推出其最新AI模型Hunyuan-TurboS,這款被譽(yù)為“首款超大型Hybrid-Transformer-Mamba MoE模型”的產(chǎn)品迅速引發(fā)全球科技圈的熱議。根據(jù)X用戶披露的信息,Hunyuan-TurboS通過融合Mamba的高效長序列處理能力和Transformer的強(qiáng)大上下文理解能力,成功克服了傳統(tǒng)純Transformer模型在長文本訓(xùn)練和推理上的瓶頸,展現(xiàn)出令人矚目的性能突破。

智元發(fā)布首個(gè)通用具身基座大模型GO-1

智元機(jī)器人于2025年3月10日正式發(fā)布首個(gè)通用具身基座大模型GO-1(Genie Operator-1),該模型由智元機(jī)器人聯(lián)合上海AI Lab共同開發(fā),由聯(lián)合創(chuàng)始人兼CTO稚暉君(彭志輝)領(lǐng)銜。

GO-1開創(chuàng)性地提出Vision-Language-Latent-Action(ViLLA)架構(gòu),通過預(yù)測隱式動(dòng)作標(biāo)記(Latent Action Tokens),彌合了圖像-文本輸入與機(jī)器人執(zhí)行動(dòng)作之間的鴻溝。其架構(gòu)由多模態(tài)大模型(VLM)和混合專家系統(tǒng)(MoE)組成:VLM采用InternVL-2B,接收多視角視覺、力覺信號(hào)和語言輸入,實(shí)現(xiàn)通用場景感知;MoE中的Latent Planner預(yù)測隱式動(dòng)作規(guī)劃鏈,Action Expert則生成精細(xì)動(dòng)作序列。

谷歌推出Gemma 3:單GPU上運(yùn)行的最強(qiáng)AI模型

谷歌近日發(fā)布了最新版本的GemmaAI模型——Gemma3,宣稱其為“全球最強(qiáng)的單加速器模型”。相較于此前發(fā)布的GemmaAI系列,Gemma3在性能上實(shí)現(xiàn)顯著提升,特別適用于僅配備一張NvidiaH100顯卡的開發(fā)者。該模型旨在助力開發(fā)者創(chuàng)建可兼容從智能手機(jī)到工作站等各種設(shè)備的AI應(yīng)用Gemma3支持超35種語言,能分析文本、圖像及短視頻,在多媒體處理方面表現(xiàn)卓越。

谷歌特別強(qiáng)調(diào),Gemma3在單GPU主機(jī)上的性能超越了Facebook的Llama、DeepSeek及OpenAI的模型,成為該領(lǐng)域的領(lǐng)先者。新版本的視覺編碼器得到升級(jí),支持高分辨率和非方形圖像,并引入新的ShieldGemma2圖像安全分類器,以過濾輸入和輸出中的性暗示、危險(xiǎn)或暴力內(nèi)容。這體現(xiàn)了谷歌在開發(fā)AI技術(shù)時(shí)對(duì)內(nèi)容安全的重視。此外,谷歌表示,盡管Gemma3的高級(jí)功能引發(fā)了潛在誤用的擔(dān)憂,但經(jīng)評(píng)估,其創(chuàng)造有害物質(zhì)的風(fēng)險(xiǎn)較低,這在當(dāng)前AI技術(shù)發(fā)展背景下尤為重要。

清華團(tuán)隊(duì)開源 “赤兔Chitu”推理引擎,助力國產(chǎn)AI生態(tài)發(fā)展

近日,清華大學(xué)高性能計(jì)算研究所的翟季冬教授團(tuán)隊(duì)與清華系科創(chuàng)企業(yè)清程極智聯(lián)合發(fā)布了一個(gè)激動(dòng)人心的消息 —— 開源大模型推理引擎“赤兔Chitu”。這一創(chuàng)新性技術(shù)的推出,標(biāo)志著國內(nèi)在AI領(lǐng)域的又一重要突破,尤其是在推理引擎的開發(fā)上?!俺嗤肅hitu”引擎的核心亮點(diǎn)在于其能夠在非英偉達(dá)Hopper架構(gòu)的GPU和各類國產(chǎn)芯片上,原生運(yùn)行FP8精度模型。這意味著,無論是依賴于進(jìn)口芯片還是國產(chǎn)芯片,開發(fā)者都能利用這一推理引擎實(shí)現(xiàn)高效的AI模型推理。這一進(jìn)展不僅推動(dòng)了國產(chǎn)AI芯片的廣泛應(yīng)用,也為國內(nèi)的AI生態(tài)建設(shè)提供了強(qiáng)有力的技術(shù)支持。

清程極智的CEO湯雄超在發(fā)布會(huì)上表示,當(dāng)前國內(nèi)在推理引擎這一核心環(huán)節(jié)仍然缺乏生產(chǎn)級(jí)的開源產(chǎn)品。而“赤兔Chitu”的開源,正是為了解決這一痛點(diǎn),助力國內(nèi)AI生態(tài)的建設(shè)。通過開放源代碼,開發(fā)者和研究人員可以自由地使用、修改和優(yōu)化這一推理引擎,加速國內(nèi)AI技術(shù)的迭代和創(chuàng)新。在全球AI技術(shù)競爭日益激烈的背景下,清華團(tuán)隊(duì)的這一舉措將為國內(nèi)企業(yè)在AI領(lǐng)域的發(fā)展提供新的機(jī)會(huì)。借助 “赤兔Chitu”推理引擎,企業(yè)能夠更快速地研發(fā)出符合市場需求的AI產(chǎn)品,提升整體競爭力。此外,開源的方式也將吸引更多的開發(fā)者參與到AI的研發(fā)中,共同推動(dòng)技術(shù)的進(jìn)步。

“赤兔Chitu”的發(fā)布不僅是技術(shù)上的一次創(chuàng)新,更是推動(dòng)國產(chǎn)AI產(chǎn)業(yè)鏈完善的一步。未來,期待有更多的企業(yè)和開發(fā)者能夠借助這一工具,在AI的海洋中乘風(fēng)破浪,開創(chuàng)屬于中國的AI新時(shí)代。

百度宣布正式發(fā)布文心大模型4.5及文心大模型X1

3月16日,百度宣布正式發(fā)布文心大模型4.5及文心大模型X1,在文心一言官網(wǎng)即可免費(fèi)使用這兩款大模型。

此前,百度曾宣布文心一言將于4月1日免費(fèi)。在最新發(fā)布兩款大模型的同時(shí),為全面提升用戶體驗(yàn),百度將免費(fèi)時(shí)間提前。

文心4.5是多模態(tài)模型,能綜合解讀文字、圖片、視頻、音頻等。比如,給它一個(gè)視頻,它就能識(shí)別內(nèi)容并寫出深度分析,英文解讀也很出色,能力遠(yuǎn)超OpenAI的GPT-4。

X1和DeepSeek-R1一樣,有深度思考能力,能理解、規(guī)劃、反思、進(jìn)化,也支持多模態(tài)。此外,X1是首個(gè)能自動(dòng)用高級(jí)搜索、文檔問答、AI繪圖、代碼解釋器、網(wǎng)頁鏈接讀取、TreeMind樹圖、百度學(xué)術(shù)檢索、商業(yè)信息查詢等特色工具的智能體,推理能力超強(qiáng)。

摩爾線程重磅開源兩大AI框架,國產(chǎn)GPU訓(xùn)練效率突破90%

摩爾線程重磅宣布,正式開源MT-MegatronLM與MT-TransformerEngine兩大AI框架,這一舉措將為國產(chǎn)計(jì)算基礎(chǔ)設(shè)施注入強(qiáng)勁動(dòng)力。這兩大框架通過深度融合FP8混合訓(xùn)練策略和高性能算子庫,成功在國產(chǎn)全功能GPU上實(shí)現(xiàn)混合并行訓(xùn)練和推理,大幅提升了大模型訓(xùn)練的效率與穩(wěn)定性。摩爾線程此次開源的MT-MegatronLM框架專為全功能GPU打造,支持dense模型、多模態(tài)模型及MoE(混合專家)模型的高效訓(xùn)練,滿足了當(dāng)前AI領(lǐng)域多樣化的訓(xùn)練需求。而MT-TransformerEngine則主攻Transformer模型的訓(xùn)練與推理優(yōu)化,通過算子融合、并行加速策略等技術(shù),有效釋放了摩爾線程全功能GPU高密度計(jì)算的潛力,顯著提升了memory bound算子的效率。

騰訊混元T1與英偉達(dá)Nemotron-H雙星閃耀:混合架構(gòu)模型開啟AI推理新紀(jì)元

3月21日,中國科技巨頭騰訊與全球芯片霸主英偉達(dá)幾乎同步發(fā)布基于Mamba-Transformer混合架構(gòu)的新一代大模型,分別推出混元T1與Nemotron-H系列。兩大科技巨頭的動(dòng)作不僅標(biāo)志著混合架構(gòu)技術(shù)從實(shí)驗(yàn)室走向工業(yè)級(jí)應(yīng)用,更揭示了AI大模型在長文本處理、超低延遲推理、硬件適配性等領(lǐng)域的核心競爭焦點(diǎn)。

該模型的前身是,今年2月中旬混元團(tuán)隊(duì)在騰訊元寶APP上線的基于混元中等規(guī)模底座的混元T1-Preview(Hunyuan-Thinker-1-Preview)推理模型。

相比于T1-Preview,T1正式版基于騰訊混元3月初發(fā)布的業(yè)界首個(gè)超大規(guī)模Hybrid-Transformer-Mamba MoE大模型TurboS快思考基座,通過大規(guī)模后訓(xùn)練擴(kuò)展了推理能力,并進(jìn)一步對(duì)齊人類偏好,這也是工業(yè)界首次將混合Mamba架構(gòu)無損應(yīng)用于超大型推理模型。

偷摸內(nèi)卷,DeepSeek-V3深夜驚爆上新,將開源貫徹到底

2025年3月25日,當(dāng)全球AI巨頭還在為發(fā)布會(huì)排期時(shí),中國團(tuán)隊(duì)DeepSeek已悄然在Hugging Face上線了DeepSeek-V3-0324版本。這個(gè)沒有預(yù)熱、沒有宣傳的“深夜更新”,不僅以6850億參數(shù)刷新國產(chǎn)模型紀(jì)錄,更在代碼生成、數(shù)學(xué)推理等領(lǐng)域?qū)崿F(xiàn)“降維打擊”,被開發(fā)者稱為“Claude 3.7 Sonnet的隱形殺手”。

OpenAI與谷歌地震級(jí)更新!

北京時(shí)間今日凌晨,全球AI領(lǐng)域迎來“雙響炮”——OpenAI與谷歌幾乎同步發(fā)布重磅模型更新,前者推出GPT-4o圖像生成功能,后者則祭出號(hào)稱“最強(qiáng)推理模型”的Gemini Pro 2.5。

這場技術(shù)對(duì)決不僅展現(xiàn)了巨頭對(duì)多模態(tài)AI的競速布局,更映射出兩條截然不同的技術(shù)路線:OpenAI以“平民化創(chuàng)造力”破局,谷歌則深耕“智能體推理”。

阿里通義千問開源發(fā)布新一代端到端多模態(tài)模型Qwen2.5-Omni

3月27日,阿里云通義千問Qwen團(tuán)隊(duì)宣布推出Qwen模型家族中的新一代端到端多模態(tài)旗艦?zāi)P汀猀wen2.5-Omni。這一全新模型專為全方位多模態(tài)感知而設(shè)計(jì),能夠無縫處理文本、圖像、音頻和視頻等多種輸入形式,并通過實(shí)時(shí)流式響應(yīng)同時(shí)生成文本與自然語音合成輸出。

豆包全新“邊想邊搜” 功能上線,提升思考與搜索的結(jié)合體驗(yàn)

最近,字節(jié)跳動(dòng)旗下的AI助手豆包進(jìn)行了功能升級(jí),推出了全新的“深度思考”模式,現(xiàn)已開始小范圍測試。這一模式的創(chuàng)新之處在于將思維推理與信息搜索相結(jié)合,用戶在使用時(shí)可以邊想邊搜”,從而更全面地獲取信息。傳統(tǒng)的 AI 搜索往往是先進(jìn)行全面的信息搜索,再根據(jù)結(jié)果進(jìn)行思考。然而,面對(duì)復(fù)雜問題,單一的搜索方式難以全面涵蓋所有相關(guān)因素。例如,在購買決策、行業(yè)分析或?qū)W術(shù)研究等場景中,用戶通常需要整合多維度的信息,單次搜索往往無法給出滿意的答案。而豆包的新模式則打破了這一局限。

國家智慧教育平臺(tái)2.0智能版上線,增加AI搜索、AI視頻總結(jié)等功能

教育部召開了國家教育數(shù)字化戰(zhàn)略行動(dòng)2025年的部署會(huì),正式發(fā)布了國家智慧教育平臺(tái)2.0智能版的上線。這一新平臺(tái)的推出,標(biāo)志著我國在教育數(shù)字化和智能化方面又邁出了重要一步。國家智慧教育平臺(tái)2.0引入了多項(xiàng)智能化功能,旨在提升學(xué)習(xí)效率與質(zhì)量。首先,平臺(tái)推出了 “白澤智慧學(xué)伴” 功能,能夠針對(duì)性地解決學(xué)習(xí)者在學(xué)習(xí)過程中遇到的問題,并根據(jù)個(gè)人的學(xué)習(xí)進(jìn)度與興趣,推薦適合的課程,從而幫助用戶更好地掌握知識(shí)。其次,平臺(tái)增加了 AI 智能搜索功能,用戶可以在全平臺(tái)范圍內(nèi)進(jìn)行高效的信息檢索。這一功能不僅節(jié)省了學(xué)習(xí)者尋找資料的時(shí)間,還提高了信息檢索的準(zhǔn)確性,方便用戶快速找到所需的學(xué)習(xí)資料。此外,AI 視頻總結(jié)和 AI 視頻導(dǎo)航功能的上線,也為學(xué)習(xí)者提供了更多便捷。AI 視頻總結(jié)通過智能語音識(shí)別和自然語言處理技術(shù),自動(dòng)生成課程視頻的核心內(nèi)容摘要,并添加時(shí)間戳,幫助用戶快速定位重點(diǎn)章節(jié)。而 AI 視頻導(dǎo)航則將課程內(nèi)容按知識(shí)點(diǎn)進(jìn)行分段,并提供視頻切片,學(xué)習(xí)者可以根據(jù)自己的學(xué)習(xí)需求和時(shí)間安排,靈活跳轉(zhuǎn)到感興趣的知識(shí)點(diǎn)。

谷歌發(fā)布全新AI模型Gemini 2.5 Pro免費(fèi)開放使用

谷歌宣布其最新的人工智能旗艦?zāi)P汀狦emini 2.5 Pro將免費(fèi)向所有Gemini應(yīng)用用戶開放。這一消息意味著,早前僅限于付費(fèi)9.99美元每月的GeminiAdvanced用戶才能體驗(yàn)的高端功能,現(xiàn)在也能夠讓更多用戶共享。Gemini 2.5 Pro被谷歌稱為迄今“最智能的AI模型”,在推理能力上有了顯著提升。新模型不僅支持多種功能,包括應(yīng)用和瀏覽器擴(kuò)展,還允許文件上傳,并能夠與谷歌的協(xié)作工具Canvas無縫集成。這些更新旨在為用戶提供更加流暢的體驗(yàn),并讓他們能夠更輕松地選擇和記住當(dāng)前使用的Gemini模型。目前,Gemini 2.5 Pro已經(jīng)在Gemini官網(wǎng)上線,并將在接下來的幾天內(nèi)推向Android和iOS平臺(tái)的Gemini應(yīng)用。盡管新模型已經(jīng)向公眾開放,但谷歌提醒用戶,Gemini 2.5 Pro仍處于實(shí)驗(yàn)階段。它的功能包括應(yīng)用與擴(kuò)展的集成、文件上傳和Canvas功能,這些都在進(jìn)一步優(yōu)化中。此外,該模型在LMArena排行榜上表現(xiàn)優(yōu)異,顯示出其在AI領(lǐng)域的競爭力。

智譜AI在2025中關(guān)村論壇上發(fā)布其最新Agent產(chǎn)品——AutoGLM沉思

智譜AI在2025中關(guān)村論壇上發(fā)布了其最新Agent產(chǎn)品——AutoGLM沉思。這是業(yè)內(nèi)首個(gè)集深度研究能力和操作能力于一體的Agent產(chǎn)品,其最大特點(diǎn)是能夠”邊想邊干”。AutoGLM沉思突破了傳統(tǒng)AI模型的局限,能夠同時(shí)進(jìn)行復(fù)雜思考與執(zhí)行操作。它可以像人類一樣打開并瀏覽網(wǎng)頁,完成從數(shù)據(jù)檢索、分析到生成報(bào)告的全流程任務(wù),實(shí)現(xiàn)了思考與行動(dòng)的緊密結(jié)合。智譜表示,AutoGLM沉思背后的技術(shù)支撐是智譜GLM全棧自研大模型,主要包括:推理模型GLM-Z1-Air:性能可與DeepSeek-R1相媲美,但速度最高提升8倍,價(jià)格僅為DeepSeek-R1的1/30基座模型GLM-4-Air0414:為智能體提供基礎(chǔ)能力支持智譜進(jìn)一步宣布,上述模型將于4月14日開源,并在近期陸續(xù)上線到bigmodel.cn平臺(tái)。這一產(chǎn)品的發(fā)布標(biāo)志著智能體技術(shù)向更加實(shí)用化、人性化的方向邁進(jìn),有望在研究分析、信息處理等領(lǐng)域帶來應(yīng)用突破。

3

政策發(fā)布

北京中小學(xué)將全面啟動(dòng)AI教育課程,從秋季學(xué)期開始實(shí)施

北京市教育委員會(huì)在其官方公眾號(hào)上發(fā)布消息,宣布全市中小學(xué)校將在2025年秋季學(xué)期正式開展人工智能(AI)通識(shí)教育。這一舉措標(biāo)志著北京教育系統(tǒng)在科技教育方面的又一重要進(jìn)展。根據(jù)規(guī)劃,從2025年開始,所有中小學(xué)生每學(xué)年將接受不少于8課時(shí)的人工智能課程,旨在實(shí)現(xiàn)對(duì)人工智能知識(shí)的全面普及。

學(xué)??筛鶕?jù)實(shí)際情況獨(dú)立設(shè)置人工智能課程,也可以將其與信息科技、通用技術(shù)、科學(xué)、綜合實(shí)踐活動(dòng)及勞動(dòng)等課程融合,進(jìn)行綜合性教學(xué)。此外,北京市還計(jì)劃分批培養(yǎng)100位專業(yè)名師和1000位骨干教師,以推動(dòng)人工智能教育的實(shí)施。對(duì)于在這一領(lǐng)域有突出貢獻(xiàn)的教師,教育部門將提供更多的支持和傾斜政策,確保優(yōu)秀教師的教學(xué)成果能夠得到認(rèn)可。

值得一提的是,在北京之前,廣州已經(jīng)于2023年秋季學(xué)期率先在11個(gè)區(qū)的所有義務(wù)教育學(xué)校中實(shí)施了類似的課程計(jì)劃,將人工智能納入地方課程安排。這一系列的教育改革旨在為學(xué)生提供更多的學(xué)習(xí)機(jī)會(huì),幫助他們?cè)谖磥砟軌蚋玫剡m應(yīng)人工智能時(shí)代的生活與工作需求。隨著人工智能技術(shù)的快速發(fā)展,掌握相關(guān)知識(shí)和技能,將為學(xué)生的未來發(fā)展奠定重要基礎(chǔ)。

東莞推出中國首個(gè)面向制造業(yè)的城市級(jí)人工智能大模型中心

在中國制造業(yè)重鎮(zhèn)東莞,2025年3月19日,首個(gè)專注于制造領(lǐng)域的城市級(jí)人工智能大模型中心正式上線。這一中心旨在推動(dòng)人工智能與制造業(yè)的深度融合,提升工業(yè)制造的效率與智能化水平。
東莞市人民政府副秘書長曾鳴在活動(dòng)中表示,此次中心的建立,將為制造企業(yè)提供更強(qiáng)的支持,增強(qiáng)東莞的核心競爭力與全球影響力。東莞數(shù)字集團(tuán)依托華為的軟硬件基礎(chǔ),創(chuàng)建了這一大模型中心,主要提供算力資源、開放模型以及AI工程化能力三類服務(wù)。這些服務(wù)幫助制造企業(yè)用更少的數(shù)據(jù)和更低的成本,快速提升模型的準(zhǔn)確度,加快智能化轉(zhuǎn)型的步伐。

在算力資源方面,中心利用東莞市華為云數(shù)據(jù)中心的基礎(chǔ)設(shè)施,為產(chǎn)業(yè)升級(jí)及公共服務(wù)提供安全、普惠的AI算力,支持行業(yè)內(nèi)主流開源大模型的部署。

而在開放模型方面,中心上線了自然語言處理、計(jì)算機(jī)視覺和預(yù)測分析等基礎(chǔ)模型,并特別針對(duì)制造行業(yè)推出了制造知識(shí)和制造視覺等專業(yè)模型,旨在幫助企業(yè)解決實(shí)際問題。此外,中心還提供AI工程化能力,通過AI開發(fā)生產(chǎn)線,為企業(yè)提供模型訓(xùn)練與推理服務(wù),顯著提升資源使用效率。通過這些措施,企業(yè)不僅能夠縮短應(yīng)用開發(fā)周期,還能有效打通AI技術(shù)與生產(chǎn)線之間的距離。

未來,大模型中心計(jì)劃到2025年打造超過50個(gè)AI與先進(jìn)制造的示范應(yīng)用場景,并力爭到2027年實(shí)現(xiàn)135個(gè)以上的目標(biāo)。東莞在推動(dòng)制造業(yè)智能化和高質(zhì)量發(fā)展的道路上邁出了重要一步。

深圳發(fā)布打造人工智能先鋒城市項(xiàng)目扶持計(jì)劃操作規(guī)程

深圳市工業(yè)和信息化局正式印發(fā)了《打造人工智能先鋒城市項(xiàng)目扶持計(jì)劃操作規(guī)程》,該規(guī)程旨在推動(dòng)深圳市人工智能產(chǎn)業(yè)的高質(zhì)量發(fā)展。

此計(jì)劃將重點(diǎn)關(guān)注算力支撐、基礎(chǔ)數(shù)據(jù)、人工智能軟件及服務(wù)等領(lǐng)域,涵蓋了多項(xiàng)扶持項(xiàng)目,助力人工智能生態(tài)的發(fā)展。其中,最引人關(guān)注的是“模型券”項(xiàng)目。該項(xiàng)目支持企業(yè)基于國家網(wǎng)信辦備案的生成式人工智能模型,進(jìn)行模型服務(wù)和智能體開發(fā)應(yīng)用。企業(yè)可以申請(qǐng)“模型券”進(jìn)行補(bǔ)貼,單家企業(yè)每年申領(lǐng)額度不超過100萬元,最高不超過200萬元,模型服務(wù)費(fèi)用的30%?可通過“模型券”抵扣。

除了?“模型券”?項(xiàng)目,深圳市還將對(duì)具有推廣價(jià)值的示范應(yīng)用項(xiàng)目和引領(lǐng)作用的標(biāo)桿應(yīng)用項(xiàng)目給予資助。符合條件的示范應(yīng)用項(xiàng)目可獲得最高200萬元的支持,而標(biāo)桿項(xiàng)目則可獲得最高1000萬元的資助。同時(shí),深圳市還將對(duì)承擔(dān)國家人工智能?“揭榜掛帥”?項(xiàng)目的單位提供配套支持,資助標(biāo)準(zhǔn)與國家資金的匹配比例為1:1,最高可達(dá)1000萬元。在扶持國產(chǎn)人工智能生態(tài)源頭創(chuàng)新中心方面,符合條件的項(xiàng)目也將獲得資金支持,企業(yè)承擔(dān)的模型應(yīng)用遷移和適配服務(wù)費(fèi)用將得到不超過30%?的補(bǔ)助,單家企業(yè)最高150萬元的資助。
此外,人工智能軟件的開源項(xiàng)目也將受到獎(jiǎng)勵(lì),分等級(jí)給予資助。針對(duì)高端展會(huì)、論壇及大賽的項(xiàng)目,深圳市將按照不超過項(xiàng)目審定總投入的50%?進(jìn)行資助,最高可達(dá)300萬元。此外,支持具身智能機(jī)器人研發(fā)推廣的措施也將實(shí)施,對(duì)銷售量達(dá)到一定規(guī)模的年度爆款產(chǎn)品,企業(yè)可獲得不超過300萬元的獎(jiǎng)勵(lì)。該操作規(guī)程自2025年3月18日起施行,有效期至2027年6月30日,深圳市希望通過這一系列措施進(jìn)一步推動(dòng)人工智能產(chǎn)業(yè)的發(fā)展,提升城市的科技競爭力。

4

會(huì)議活動(dòng)

2025浪潮云戰(zhàn)略發(fā)布會(huì)

在近日舉行的主題為“有云處皆智能”的2025浪潮云戰(zhàn)略發(fā)布會(huì)上,浪潮云率先發(fā)布分布式智能云戰(zhàn)略,計(jì)劃半年內(nèi)完成現(xiàn)有分布式云節(jié)點(diǎn)的升級(jí),今年內(nèi)落地分布式智能云節(jié)點(diǎn)超過1000個(gè),成為“智慧系統(tǒng)的全場景運(yùn)營商”,實(shí)現(xiàn)“有云處皆智能”的戰(zhàn)略愿景。

共筑AI產(chǎn)業(yè)新未來 2025人工智能基礎(chǔ)設(shè)施峰會(huì)成功召開

2025年3月27日,“2025人工智能基礎(chǔ)設(shè)施峰會(huì)”在上海龍之夢(mèng)萬麗酒店盛大召開。

本次峰會(huì)以“智能基石 創(chuàng)新賦能”為主題,由上海市計(jì)算機(jī)學(xué)會(huì)指導(dǎo),DOIT傳媒主辦,算力豹、百易存儲(chǔ)研究院、CXL技術(shù)應(yīng)用俱樂部、上海市計(jì)算機(jī)學(xué)會(huì)存儲(chǔ)技術(shù)專委會(huì)、上海交通大學(xué)計(jì)算機(jī)系支持,匯聚產(chǎn)業(yè)鏈上下游企業(yè)、機(jī)構(gòu)及專家學(xué)者,共同探討AI基礎(chǔ)設(shè)施的前沿趨勢(shì)、技術(shù)創(chuàng)新與應(yīng)用,推動(dòng)中國AI產(chǎn)業(yè)邁向新高度,會(huì)議同期還發(fā)布了算力全景圖(2025版)分析報(bào)告。會(huì)場吸引近千名觀眾參加。

分享到

lixiangjing

算力豹主編

相關(guān)推薦