2025年6月17日,中國AI領(lǐng)域迎來一場技術(shù)地震。國內(nèi)AI六小虎之一的MiniMax正式開源其新一代推理大模型MiniMax-M1,以100萬token上下文窗口和僅53萬美元的訓(xùn)練成本,在AI基礎(chǔ)模型領(lǐng)域樹立全新標桿。

這款模型不僅將長文本處理能力提升至Google Gemini 2.5 Pro級別,更以驚人的算力效率,在同等推理任務(wù)中僅需DeepSeek R1約30%的計算資源,真正實現(xiàn)了“性能躍升、成本腰斬”的雙重突破。

文字編輯|宋雨涵

1

技術(shù)核爆:

百萬上下文背后的架構(gòu)革命

此次開源的MiniMax-M1并非傳統(tǒng)Transformer架構(gòu)的延續(xù),而是全球首個大規(guī)模混合架構(gòu)推理模型。其核心創(chuàng)新在于將線性注意力(Linear Attention)與標準Softmax注意力有機融合,形成獨特的“閃電注意力”機制。

這一設(shè)計讓M1在保持長序列處理效率的同時,解決了純線性注意力在信息檢索上的固有缺陷。

技術(shù)參數(shù)彰顯野心:

在處理400頁技術(shù)文檔或十萬行代碼庫時,傳統(tǒng)模型需反復(fù)切分上下文,而M1可整體消化、連貫推理,為Agent智能體發(fā)展鋪平道路。

在強化學(xué)習(xí)領(lǐng)域,MiniMax同樣取得了突破,提出了全新的CISPO算法。該算法通過優(yōu)化重要性采樣權(quán)重,極大地提升了強化學(xué)習(xí)的訓(xùn)練效率。在AIME實驗中,CISPO算法的收斂速度較其他算法,包括字節(jié)最新提出的DAPO,快了一倍,甚至超越了DeepSeek早期采用的GRPO算法。這些技術(shù)創(chuàng)新使得MiniMax-M1的強化訓(xùn)練過程異常高效,訓(xùn)練成本大幅降低,僅用了512塊H800三周的時間,租賃成本遠低于預(yù)期。

2

性能屠榜:

17項測試碾壓開源界

在評測成績方面,MiniMax – M1的表現(xiàn)堪稱亮眼,在業(yè)內(nèi)主流的17個評測集中均斬獲佳績,不負大眾期待。尤其是在軟件工程、長上下文理解以及工具使用這類復(fù)雜且對生產(chǎn)力要求較高的場景中,MiniMax – M1展現(xiàn)出了令人矚目的壓倒性優(yōu)勢。

在SWE – bench基準測試里,MiniMax – M1 – 40k和MiniMax – M1 – 80k分別取得了55.6%和56.0%的高分。盡管這一成績比DeepSeek – R1 – 0528的57.6%稍低,但相較于其他開源模型,MiniMax – M1的表現(xiàn)可謂遙遙領(lǐng)先。憑借其百萬級的上下文窗口,MiniMax – M1在長上下文理解任務(wù)中表現(xiàn)卓越,不僅超越了所有開源模型,還在部分指標上接近OpenAI o3和Claude4Opus,在全球范圍內(nèi)位居第二。

在代理工具使用場景(TAU – bench)的評測中,MiniMax – M1同樣成績斐然。它不僅在所有開源模型中脫穎而出,還成功戰(zhàn)勝了Gemini – 2.5Pro。此外,MiniMax – M1 – 80k在多數(shù)基準測試中的表現(xiàn)都優(yōu)于MiniMax – M1 – 40k,這有力地證明了增加計算資源對于提升模型性能有著顯著作用。

成本革命:

53萬美元訓(xùn)練出頂級模型

當OpenAI花費上億美元訓(xùn)練GPT-4、DeepSeek R1耗費500-600萬美元時,MiniMax-M1僅用53.47萬美元即完成訓(xùn)練。這相當于用經(jīng)濟型轎車的價格造出了超級跑車。

成本優(yōu)勢源于兩大技術(shù)創(chuàng)新:

CISPO強化學(xué)習(xí)算法:優(yōu)化重要性采樣權(quán)重,訓(xùn)練效率較字節(jié)DAPO提升2倍,超越DeepSeek的GRPO算法。

閃電注意力機制為主的混合架構(gòu),從而在計算長的上下文輸入以及深度推理的時候顯著高效。例如,在用8萬Token深度推理的時候,只需要使用DeepSeek R1約30%的算力。這個特性使得我們在訓(xùn)練和推理的時候都有很大的算力效率優(yōu)勢。

編者觀察

此次發(fā)布恰逢MiniMax的“關(guān)鍵證明時刻”。2025年以來,隨著“AI六小虎”概念淡化、“基模五強”(阿里、字節(jié)、DeepSeek、階躍星辰、智譜AI)興起,MiniMax一度被排除在頭部陣營之外。

行業(yè)觀察人士指出:“M1的成敗決定MiniMax能否繼續(xù)坐在牌桌旁”。而此次開源的激進策略,可視為其對市場地位的全力捍衛(wèi)。

更深遠的影響在于技術(shù)路線競爭。當全球聚焦于Transformer架構(gòu)優(yōu)化時,MiniMax用規(guī)?;炞C了混合架構(gòu)的可行性。

結(jié)語:

此刻開源的MiniMax-M1,不僅是技術(shù)里程碑,更是AI民主化進程的加速器。當百萬token上下文不再是天價服務(wù),當53萬美元能訓(xùn)練頂尖模型,創(chuàng)新的大門已向全球開發(fā)者敞開。

DeepSeek在1月用R1定義了推理模型的標準,而5個月后的今天,MiniMax用M1重新書寫了規(guī)則——這場中國AI雙雄的架構(gòu)之爭,贏家將是整個產(chǎn)業(yè)。

分享到

lixiangjing

算力豹主編

相關(guān)推薦