(來源:OpenAI)
OpenAI在今年5月發(fā)布公司迄今為止速度最快、綜合能力最強(qiáng),同樣也是最貴的GPT-4o模型。最新上架的GPT-4o mini則是一個(gè)規(guī)格更小、更便宜的變體,通過兼具“能力和性價(jià)比”,拓展低價(jià)位市場(chǎng)的競(jìng)爭(zhēng)。
根據(jù)OpenAI披露,GPT-4o mini的API價(jià)格將會(huì)是15美分/100萬Tokens輸入,以及60美分/100萬Tokens輸出。上下文窗口依然是12.8萬個(gè)Tokens,知識(shí)截止日期為2023年10月。公司拒絕透露新模型的參數(shù)量大小,僅表示與市面上類似的AI小模型(Claude Haiku、 Gemini 1.5 Flash等)處于同一個(gè)級(jí)別。
作為對(duì)比,GPT-4o的百萬Tokens輸入/輸出價(jià)格是5美元/15美元,之前的入門款模型GPT-3.5 Turbo定價(jià)是0.5美元/1.5美元。所以最新的“迷你模型”要比GPT-4o便宜了96%-97%,比起GPT-3.5 Turbo也要便宜60%-70%。正因如此,隨著GPT-4o上架,GPT-3.5 Turbo的歷史使命到此結(jié)束。
(OpenAI模型定價(jià),來源:官網(wǎng))
根據(jù)Artificial Analysis的統(tǒng)計(jì),GPT-4o mini已經(jīng)達(dá)到美國AI公司主流“小模型”里面價(jià)格最低的位置,比起Anthropic、谷歌的同類型競(jìng)品都要便宜一截。當(dāng)然,即便是OpenAI,也無法與“來自東方的力量”比拼價(jià)格。例如知名私募幻方旗下DeepSeek-V2模型的Token輸出價(jià)格,還能比GPT-4o mini便宜一半。
(價(jià)格比較,來源:Artificial Analysis)
在比較價(jià)格的同時(shí),GPT-4o mini的能力也能拿得上臺(tái)面。OpenAI介紹稱,在MMLU(大模型多任務(wù)語言理解)測(cè)試中,GPT-4o mini的評(píng)分能夠達(dá)到82%。目前在這項(xiàng)測(cè)試中,“刷分”最高的是谷歌的超大模型Gemini Ultra-1760B(90%),GPT-4o得分是88.7%。
而在“小模型”對(duì)照組中,Gemini 1.5 Flash得分是79%,而Claude 3 Haiku的分?jǐn)?shù)是75%。雖然對(duì)于大模型測(cè)試基準(zhǔn)的認(rèn)可程度因人而異,但這個(gè)比較大概能體現(xiàn)出GPT-4o mini處于一個(gè)什么樣的位置。
(來源:OpenAI)
OpenAI表示,GPT-4o mini在上線初期只能處理文字和圖像生成任務(wù),最終的目標(biāo)是支持所有其他類型內(nèi)容的處理。從周四開始,OpenAI將逐步向ChatGPT的免費(fèi)/付費(fèi)用戶推送這個(gè)新模型,取代GPT-3.5 Turbo的位置,企業(yè)用戶將在下周用上新產(chǎn)品。
有關(guān)這個(gè)新模型還有一個(gè)安全層面的變化。OpenAI披露,GPT-4o mini是公司首個(gè)使用全新安全策略—— “指令層次結(jié)構(gòu)”的AI 模型。這種策略要求AI系統(tǒng)優(yōu)先考慮一些指令——例如來自O(shè)penAI公司的預(yù)設(shè)命令,從而使得惡意用戶更難讓這種工具執(zhí)行“本不應(yīng)該執(zhí)行的操作”。
競(jìng)爭(zhēng)壓力巨大
雖然OpenAI嘴上喊著“讓盡可能多的人訪問AI”,但這個(gè)定價(jià)足以反映出AI云服務(wù)供應(yīng)商之間的激烈競(jìng)爭(zhēng)。
OpenAI 產(chǎn)品經(jīng)理Olivier Godement介紹稱,之所以價(jià)格便宜,是因?yàn)楣靖倪M(jìn)了模型結(jié)構(gòu)、優(yōu)化訓(xùn)練數(shù)據(jù)和訓(xùn)練計(jì)劃,但他也強(qiáng)調(diào)GPT-4o mini在市面上常見的基準(zhǔn)測(cè)試中優(yōu)于競(jìng)品的同類“小”模型。
對(duì)于OpenAI來說,壓力最大的挑戰(zhàn)將來自于下周——根據(jù)多個(gè)消息源報(bào)道,Meta公司將在7月23日發(fā)布Llama 3開源大模型的最大參數(shù)量版本,據(jù)稱擁有4000億個(gè)參數(shù)。目前并不清楚這個(gè)模型的能力到底有多強(qiáng)。