2024年9月13日凌晨前后,OpenAI正式發(fā)布了全新的AI模型系列——OpenAI o1,該系列專為解決復(fù)雜問(wèn)題而設(shè)計(jì),具備更強(qiáng)的推理能力,尤其在科學(xué)、編程和數(shù)學(xué)領(lǐng)域表現(xiàn)出色。

此次發(fā)布的首個(gè)版本已經(jīng)通過(guò)ChatGPT和API開(kāi)放預(yù)覽,未來(lái)還會(huì)定期更新和優(yōu)化。此外,OpenAI還發(fā)布了該系列的輕量版本“o1-mini”,為開(kāi)發(fā)者提供更高效、更具性價(jià)比的解決方案。

模型主要特點(diǎn)

OpenAI o1系列模型的獨(dú)特之處在于,它們會(huì)在回答問(wèn)題之前花費(fèi)更多時(shí)間進(jìn)行推理和思考,類似于人類的解決問(wèn)題方式。通過(guò)訓(xùn)練,這些模型能夠優(yōu)化自己的思考過(guò)程,嘗試不同的解決策略,并識(shí)別和糾正錯(cuò)誤。

在多項(xiàng)測(cè)試中,o1系列的下一個(gè)版本在物理、化學(xué)和生物學(xué)等學(xué)科的高難度任務(wù)中表現(xiàn)出接近博士生的水準(zhǔn),特別是在數(shù)學(xué)和編程方面表現(xiàn)突出。

在國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽(IMO)的資格考試中,GPT-4o僅解決了13%的問(wèn)題,而o1模型的正確率高達(dá)83%。在Codeforces編程競(jìng)賽中,o1的表現(xiàn)達(dá)到了89%的優(yōu)秀水平。

此外,OpenAI推出的輕量版本“o1-mini”同樣專注于復(fù)雜代碼的生成和調(diào)試。與o1-preview相比,o1-mini的成本降低了80%,因此對(duì)于那些需要推理但不依賴廣泛世界知識(shí)的應(yīng)用場(chǎng)景,它是一款高效、經(jīng)濟(jì)的解決方案。

使用方式?現(xiàn)在就可以用上了

ChatGPT Plus和Team用戶從今日起可以在ChatGPT中訪問(wèn)o1系列模型。用戶可以在模型選擇器中手動(dòng)選擇o1-preview或o1-mini模型。

初期的使用限制為,o1-preview每周30條消息,o1-mini每周50條消息。未來(lái)會(huì)計(jì)劃增加使用限制,并讓ChatGPT能夠自動(dòng)選擇最適合用戶問(wèn)題的模型。

從下周開(kāi)始,ChatGPT Enterprise和Edu用戶也可以使用這兩個(gè)模型。同時(shí),開(kāi)發(fā)者若達(dá)到API使用的第5級(jí)別門檻,也可從今天起在API中原型設(shè)計(jì)并測(cè)試這兩個(gè)模型,初期的API調(diào)用限制為每分鐘20次請(qǐng)求。

隨著進(jìn)一步的測(cè)試,OpenAI將逐步提高這一限額。目前API尚不支持函數(shù)調(diào)用、流式處理和系統(tǒng)消息等功能,開(kāi)發(fā)者可以通過(guò)API文檔了解更多。

未來(lái),OpenAI還計(jì)劃將o1-mini的使用權(quán)向所有ChatGPT免費(fèi)用戶開(kāi)放。

安全保障方面

為了確保新模型的安全性,OpenAI引入了一種新的安全訓(xùn)練方法。

在測(cè)試中,o1-preview在應(yīng)對(duì)“越獄”時(shí)表現(xiàn)優(yōu)異,得分為84分(滿分100分),遠(yuǎn)高于GPT-4o的22分。

未來(lái)計(jì)劃

此次發(fā)布的o1系列仍處于預(yù)覽階段,未來(lái)OpenAI計(jì)劃為這些推理模型添加更多功能,如瀏覽網(wǎng)頁(yè)、上傳文件和圖片等,以提高其通用性。

通過(guò)此次推出的o1和o1-mini模型,OpenAI為科學(xué)、編程和數(shù)學(xué)等復(fù)雜領(lǐng)域的專業(yè)人士提供了更強(qiáng)大的工具,推動(dòng)了AI在解決復(fù)雜問(wèn)題方面的進(jìn)步。

分享到

zhupb

相關(guān)推薦