z該柱狀圖展示了不同基準測試在ERNIE-4.5和GPT-40上的表現(xiàn)情況。圖中橫軸列出了各個基準測試的名稱,包括平均值、CCCBench、OCRBench、ChartQA、MMMU、MathVista、DocVQA和MVBench??v軸表示測試得分。每個基準測試都有兩根柱子,分別代表ERNIE-4.5(紅色)和GPT-40(藍綠色)的得分。從圖中可以看出,ERNIE-4.5在DocVQA基準測試上得分最高,而在MMMU上得分最低;GPT-40在DocVQA上同樣取得較高得分,而在MathVista上得分相對較低。整體來看,ERNIE-4.5和GPT-40在不同基準測試上的表現(xiàn)各有優(yōu)劣,ERNIE-4.5在多數(shù)基準測試上的得分要高于GPT-40。
再來看看價格方面
這張圖片展示了文心大模型X1與DeepSeek R1在輸入和輸出價格上的對比。在輸入價格方面,文心X1的價格為0.002元/千Tokens,而DeepSeek R1的價格為0.004元/千Tokens,文心X1的輸入價格更具優(yōu)勢。在輸出價格方面,文心X1的價格為0.008元/千Tokens,DeepSeek R1的價格為0.016元/千Tokens,文心X1的輸出價格同樣更為經(jīng)濟??傮w來看,文心大模型X1在輸入和輸出價格上均低于DeepSeek R1,顯示出更高的性價比。
2
構(gòu)建開發(fā)者生態(tài)
開源時間與技術(shù)普惠
百度宣布將于2025年6月30日開源文心4.5,涵蓋輕量化模型、多模態(tài)模塊及訓(xùn)練工具鏈,吸引開發(fā)者共建生態(tài)。李彥宏強調(diào),開源源于對技術(shù)領(lǐng)先地位的信心,旨在通過“用戶基數(shù)→數(shù)據(jù)反饋→模型迭代”循環(huán)擴大應(yīng)用場景。
開源模型支持與第三方云平臺混合部署,降低企業(yè)使用門檻。百度智能云通過托管服務(wù)、算力租賃等實現(xiàn)“開源引流-云服務(wù)創(chuàng)收”閉環(huán),已幫助33,000個模型精調(diào),開發(fā)77萬個企業(yè)應(yīng)用。
行業(yè)巨頭紛紛提速
今年以來,在DeepSeek的推動下,行業(yè)巨頭加速了AI大模型領(lǐng)域的業(yè)務(wù)布局。3月12日,谷歌CEO宣布開源多模態(tài)大模型Gemma 3,包含10億至270億四種參數(shù)規(guī)模,即便最小規(guī)模也具備強大處理能力。在LMArena測試中,270億參數(shù)的Gemma 3表現(xiàn)卓越,擊敗多款模型,成為僅次于DeepSeek-R1的最優(yōu)開源模型。
同時,谷歌推出基于Gemini 2.0的Gemini Robotics及Gemini Robotics-ER兩款模型,旨在開發(fā)更靈活的互動機器人,拓展應(yīng)用場景。
同日,OpenAI發(fā)布AI Agent應(yīng)用開發(fā)新工具包,包括Responses API、首款開源Agents SDK等,SDK支持多Agent動態(tài)任務(wù)協(xié)作,可開發(fā)復(fù)雜智能自動化流程。
此外,Meta正與臺積電合作測試其自研AI訓(xùn)練芯片,繼去年成功部署推理任務(wù)處理器后,計劃2025年投入650億美元于AI基礎(chǔ)設(shè)施建設(shè)。