文字編輯|宋雨涵
1
重磅更新
輕量模型的“重型武器”
Gemini 2.5 Pro(穩(wěn)定版)
定位旗艦級(jí)復(fù)雜任務(wù)處理,支持多模態(tài)輸入(文本/圖像/音頻/視頻/代碼)和百萬(wàn)級(jí)上下文窗口(可解析整本《三體》或3小時(shí)視頻),專注高精度編程、科學(xué)推理與長(zhǎng)文檔分析。新增“深度思考”(Deep Think)模式,通過(guò)遞歸分析提升復(fù)雜問(wèn)題解決能力,在USAMO數(shù)學(xué)競(jìng)賽、LiveCodeBench編程測(cè)試中超越GPT-4.5等競(jìng)品。
Gemini 2.5 Flash(穩(wěn)定版)
主打效率與成本平衡,輸入/輸出定價(jià)調(diào)整為 $0.3/$2.5/百萬(wàn)Token(原預(yù)覽版為$0.15/$3.5),取消“思考/非思考”雙軌計(jì)費(fèi),統(tǒng)一為單一定價(jià)簡(jiǎn)化成本控制。支持動(dòng)態(tài)思考預(yù)算控制(0-24K Token),根據(jù)任務(wù)復(fù)雜度自動(dòng)調(diào)整推理資源,在保證精度的同時(shí)降低70%計(jì)算負(fù)載。
Gemini 2.5 Flash-Lite(預(yù)覽版)
支持百萬(wàn)Token上下文與多模態(tài)輸入,默認(rèn)關(guān)閉“思考”功能以優(yōu)化速度,但可按需啟用。演示實(shí)時(shí)生成操作系統(tǒng)內(nèi)核能力,用戶點(diǎn)擊圖標(biāo)后動(dòng)態(tài)生成非確定性UI界面(如文件夾內(nèi)容實(shí)時(shí)變化),顛覆傳統(tǒng)軟件開(kāi)發(fā)流程。
性價(jià)比核彈:輸入/輸出成本僅?$0.1/$0.4/百萬(wàn)Token(約¥0.7/¥2.9),較前代Flash輸出成本降低62%,創(chuàng)行業(yè)新低。
首個(gè)在TPU v5p架構(gòu)上訓(xùn)練的模型系列
Gemini2.5系列模型運(yùn)用了稀疏混合專家(MoE)架構(gòu),具備原生支持文本、視覺(jué)以及音頻輸入的能力。稀疏MoE模型的工作原理是,通過(guò)學(xué)習(xí)將不同的token動(dòng)態(tài)分配到參數(shù)子集(即專家)中,為每個(gè)輸入token激活特定的模型參數(shù)子集。這種機(jī)制讓模型總?cè)萘颗c每個(gè)token的計(jì)算及服務(wù)成本實(shí)現(xiàn)了分離。
在應(yīng)對(duì)訓(xùn)練不穩(wěn)定性的挑戰(zhàn)時(shí),Gemini2.5模型系列著重在增強(qiáng)大規(guī)模訓(xùn)練穩(wěn)定性、優(yōu)化信號(hào)傳播以及改進(jìn)動(dòng)態(tài)方面取得了突出成果。該系列模型是在Gemini1.5處理長(zhǎng)上下文查詢?nèi)〉贸晒Φ幕A(chǔ)上構(gòu)建的,并融入了新的建模技術(shù),使得Gemini2.5Pro在處理長(zhǎng)達(dá)1Mtokens的長(zhǎng)上下文輸入序列時(shí),性能超越了Gemini1.5Pro。無(wú)論是Gemini2.5Pro還是Gemini2.5Flash,都能夠處理長(zhǎng)格式文本、完整的代碼庫(kù),以及長(zhǎng)格式的音頻和視頻數(shù)據(jù)。
Gemini2.5模型系列是谷歌首個(gè)在TPUv5p架構(gòu)上進(jìn)行訓(xùn)練的模型系列。谷歌采用同步數(shù)據(jù)并行訓(xùn)練方式,在分布于多個(gè)數(shù)據(jù)中心的谷歌TPUv5p加速器的多個(gè)8960芯片pod上進(jìn)行并行化訓(xùn)練。其預(yù)訓(xùn)練數(shù)據(jù)集規(guī)模龐大且類型多樣,廣泛覆蓋多個(gè)領(lǐng)域和模態(tài),包含公開(kāi)可用的Web文檔、各種編程語(yǔ)言的代碼、圖像、音頻(涵蓋語(yǔ)音及其他音頻類型)以及視頻。這里需要說(shuō)明的是,Gemini2.0的數(shù)據(jù)收集截止日期為2024年6月,而Gemini2.5的截止日期為2025年1月。
谷歌還采用了新方法來(lái)提升數(shù)據(jù)過(guò)濾和去重的質(zhì)量,其訓(xùn)練后數(shù)據(jù)集由精心收集和審核的指令調(diào)優(yōu)數(shù)據(jù)構(gòu)成,是多模態(tài)數(shù)據(jù)的集合,除包含人類偏好和工具使用數(shù)據(jù)外,還有成對(duì)的指令和響應(yīng)。谷歌研究報(bào)道指出,在后訓(xùn)練階段,他們借助模型來(lái)輔助監(jiān)督微調(diào)(SFT)、獎(jiǎng)勵(lì)建模(RM)和強(qiáng)化學(xué)習(xí)(RL)階段,以此實(shí)現(xiàn)更高效、更精細(xì)的數(shù)據(jù)質(zhì)量控制。此外,谷歌增加了分配給RL的訓(xùn)練計(jì)算資源,并結(jié)合對(duì)可驗(yàn)證獎(jiǎng)勵(lì)和基于模型的生成獎(jiǎng)勵(lì)的關(guān)注,以提供更復(fù)雜、更具可擴(kuò)展性的反饋信號(hào)。RL過(guò)程的算法改進(jìn)提升了長(zhǎng)時(shí)間訓(xùn)練期間的穩(wěn)定性。
Gemini推理模型通過(guò)強(qiáng)化學(xué)習(xí)進(jìn)行訓(xùn)練,能夠在推理時(shí)利用額外的計(jì)算資源來(lái)得出更精確的答案。生成的模型具備“思考”能力,在回答問(wèn)題或查詢之前,會(huì)進(jìn)行數(shù)萬(wàn)次正向傳遞。
2
價(jià)格屠刀:
0.7元如何重構(gòu)行業(yè)生態(tài)?
此次更新在價(jià)格方面,Gemini-2.5-Flash-Lite比Gemini-2.5-Flash便宜30%-60%,輸入價(jià)格為0.1美元(折合人民幣約0.7元)/百萬(wàn)tokens,輸出價(jià)格為0.4美元(折合人民幣約2.9元)/百萬(wàn)tokens。
谷歌還宣布了Gemini 2.5 Flash的最新定價(jià),模型的思考和非思考價(jià)格相同,輸入價(jià)格為0.3美元(折合人民幣約2.2元)/百萬(wàn)tokens,輸出價(jià)格為2.5美元(折合人民幣約17.9元)/百萬(wàn)tokens。
我們?cè)賮?lái)看看主流模型定價(jià)格局(2025年6月)
模型 | 輸入成本/百萬(wàn)token | 輸出成本/百萬(wàn)token | 性價(jià)比定位 |
Gemini 2.5 Flash-Lite | $0.1 (≈¥0.7) | $0.4 (≈¥2.9) | 極致性價(jià)比 |
Gemini 2.5 Flash | $0.3 | $2.5 | 均衡型 |
OpenAI GPT-4 Turbo | $10 | $30 | 高性能高成本 |
OpenAI GPT-4o-mini | $1.1 | $4.4 | 輕量競(jìng)品 |
DeepSeek-R1 | $1.0 | $16.0 (≈¥22) | 開(kāi)源性價(jià)比代表 |
Claude 3.7 Sonnet | $3.0 | $15.0 | 中高端 |
定價(jià)背后的“三重革命”
①?技術(shù)民主化加速:頂尖AI從“實(shí)驗(yàn)室奢侈品”變?yōu)椤伴_(kāi)發(fā)者日用品”,一瓶礦泉水錢處理千萬(wàn)字時(shí)代正式開(kāi)啟;
②?競(jìng)爭(zhēng)維度升維:模型戰(zhàn)場(chǎng)從“純性能PK”轉(zhuǎn)向“效能+成本+生態(tài)”綜合較量,谷歌借云基建優(yōu)勢(shì)碾壓純軟件廠商;
③?行業(yè)標(biāo)準(zhǔn)重置:$0.1/百萬(wàn)token成為新心理錨點(diǎn),倒逼全行業(yè)優(yōu)化架構(gòu)——沒(méi)有MoE與超算集群的玩家,或許將或?qū)⒂谰贸鼍?/strong>。
未來(lái)展望:
價(jià)格戰(zhàn)只是開(kāi)始,生態(tài)戰(zhàn)才是終局
谷歌此次”放核彈”絕非孤立事件。結(jié)合近期動(dòng)作:
1、硬件協(xié)同:搭配Tensor?G5芯片的Pixel?10系列將在Q3發(fā)布,GFL將作為默認(rèn)AI助手
2、開(kāi)發(fā)者激勵(lì):推出”AI?Startup?Fund”計(jì)劃,承諾前100萬(wàn)次調(diào)用免費(fèi)
3、開(kāi)源布局:GFL的蒸餾技術(shù)論文將在CVPR2025發(fā)表
這標(biāo)志著AI競(jìng)爭(zhēng)從單點(diǎn)技術(shù)突破,升級(jí)為”硬件-模型-生態(tài)”的立體戰(zhàn)爭(zhēng)。對(duì)于企業(yè)用戶而言,真正的價(jià)值不在于API價(jià)格,而是能否構(gòu)建端到端解決方案。
結(jié)語(yǔ):
谷歌此次”價(jià)格核爆”式的發(fā)布,不僅是一款新產(chǎn)品的亮相,更標(biāo)志著AI行業(yè)進(jìn)入了一個(gè)全新的發(fā)展階段。當(dāng)千億參數(shù)模型以0.7元/百萬(wàn)token的價(jià)格提供時(shí),我們不禁要問(wèn):AI民主化的拐點(diǎn)是否已經(jīng)到來(lái)?
這一輪”價(jià)格戰(zhàn)”背后,是AI基礎(chǔ)設(shè)施成熟度的重要里程碑。如同云計(jì)算在2010年代初期的發(fā)展軌跡,當(dāng)計(jì)算資源價(jià)格突破某個(gè)臨界點(diǎn)后,會(huì)催生大量新型應(yīng)用和創(chuàng)新模式??梢灶A(yù)見(jiàn),GFL的低成本高性能將加速各行業(yè)AI應(yīng)用滲透,特別是在傳統(tǒng)企業(yè)數(shù)字化、醫(yī)療健康、教育普惠等領(lǐng)域。