就在昨日,其首席執(zhí)行官山姆·奧爾特曼(Sam Altman)以一種極具震撼力的方式,揭開了一項特別計劃的神秘面紗:OpenAI將傾情呈現(xiàn)一場為期12天的直播馬拉松,內(nèi)容精彩紛呈,既有新品發(fā)布的激動人心,也有功能更新的耳目一新,更有一系列被譽為“圣誕禮物”的神秘環(huán)節(jié),令人充滿期待。
OpenAI的這一活動預(yù)告,猶如一顆石子投入平靜的湖面,瞬間激起了層層漣漪,引發(fā)了全球的轟動。
全球的科技媒體為之沸騰,即便時差成為一道難以逾越的鴻溝,也阻擋不了他們渴望參與這場“科技盛宴”的滿腔熱情。
在北京時間12月6日凌晨兩點,萬眾矚目的“12 Days of OpenAI, Day 1”直播終于拉開序幕。
重磅直播內(nèi)容
1.推出o1正式版,這是首次將多模態(tài)能力與新型推理范式相結(jié)合的版本。相比于 o1 preview,它更加智能,響應(yīng)速度顯著提升。目前o1模型已全面上線,API 功能也將在不久后推出。
2.發(fā)布了全新專業(yè)版套餐——ChatGPT Pro,訂閱費用為每月200美元,用戶可無限訪問OpenAI的模型,包括語音功能。此外,Pro套餐還引入了o1 Pro模式,在數(shù)學(xué)、科學(xué)和編碼等挑戰(zhàn)性機器學(xué)習(xí)基準測試中表現(xiàn)更好。
推出o1正式版
讓我們先聚焦于廣大用戶能夠親身體驗的o1大模型。直播活動結(jié)束后,ChatGPT Plus的用戶群體已逐步迎來了o1模型的完整版本。回溯至9月,該模型首次以預(yù)覽版的形式與大家見面。o1模型的一大特色在于,它并非簡單地“脫口而出”答案,而是構(gòu)建了一個類似人類思考的內(nèi)部邏輯鏈條,顯著提升了回答專業(yè)問題時的精確度。簡而言之,新推出的完整版o1模型相較于預(yù)覽版,速度更快、性能更強、準確度更高,并新增了多模態(tài)輸入功能,即用戶現(xiàn)在可以上傳圖片進行詢問。
OpenAI透露,與預(yù)覽版相比,當前的o1模型“思維過程已變得更加精簡高效”(提速約50%),并且在應(yīng)對復(fù)雜現(xiàn)實問題時,發(fā)生重大錯誤的概率降低了34%。在一次演示中,當被要求“列出2世紀羅馬皇帝的名字、任期和主要成就”時,o1模型僅“思考”了14秒便給出了答案,而預(yù)覽版則耗時34秒。值得一提的是,能力稍弱的GPT-4o在回答這個問題時還會出現(xiàn)錯誤。
o1模型的另一項重大更新是支持圖片輸入功能,這意味著用戶可以在向模型詢問如“太空數(shù)據(jù)中心散熱問題”時,附上一張手繪示意圖以輔助說明。OpenAI還表示,他們計劃在未來數(shù)月內(nèi)進一步增加功能,如網(wǎng)頁瀏覽和文件上傳等。
此外,OpenAI還展示了o1模型(以中間淺紅色柱子表示)在回答數(shù)學(xué)、編程以及博士級別科學(xué)問題時的卓越表現(xiàn),其準確率明顯高于o1預(yù)覽版(左邊橘色柱子)。而右邊的綠色柱子則代表了進一步的提升,那是專為ChatGPT Pro用戶打造的o1 Pro模式。
一個月200美元的ChatGPT Pro
ChatGPT Pro是OpenAI推出的最新訂閱檔次,比ChatGPT Plus貴上10倍。
花費1個月200美元后,用戶可以無限量地使用o1模型(Plus用戶目前的限制是每周50條信息),以及無限量使用o1 mini和高級語音模式,同時也能用上o1 pro模式。
官方的定義稱,o1 pro會使用更多的計算資源進入深入思考,并為“最難的問題提供最好的答案”。OpenAI未來也會給這個訂閱檔次,添加更多更強大、計算密集型的功能。
簡而言之,如果您是一名科學(xué)研究人員或程序員,且o1模型的推理能力不足以滿足需求,那么可以考慮嘗試一下“氪金”進階模式。
在演示中,OpenAI演示了通過設(shè)定一系列苛刻的條件,讓o1 pro篩選出符合條件的蛋白質(zhì)。
在OpenAI的公告中,也提到向10名醫(yī)學(xué)研究人員贈送了免費ChatGPT Pro,研究領(lǐng)域涵蓋孤兒病、癌癥、癡呆等。這大概也是使用這個訂閱服務(wù)的人群畫像。
ChatGPT Pro的特色之一是引入了o1 pro模式,增加了計算資源投入,讓模型在解答困難問題時進行更深入的思考和分析。這項服務(wù)主要面向需要進行高級數(shù)據(jù)分析和處理的科研人員、工程師以及其他專業(yè)人士,幫助他們提高工作效率并保持在人工智能技術(shù)最前沿。
根據(jù)外部專家的評測,o1 pro模式在處理復(fù)雜的數(shù)據(jù)科學(xué)、編程和案例分析問題時,能夠提供比以往模型更為精確和全面的響應(yīng)。在進行數(shù)學(xué)、科學(xué)和編程等領(lǐng)域的機器學(xué)習(xí)基準測試時,o1 pro模式的表現(xiàn)優(yōu)于o1和o1-preview模型。
為了突出o1 pro模式的主要優(yōu)勢(提高可靠性),OpenAI使用更嚴格的評估設(shè)置:只有當模型在四次嘗試中有四次能夠正確回答問題(“4/4 可靠性”),才被認為解決了問題。
思維鏈CoT的推理方法
不論是預(yù)覽版,還是完整版o1,都是通過大規(guī)模強化學(xué)習(xí)進行了訓(xùn)練,掌握了一種前沿的思維鏈CoT的推理方法。這種方法,不僅僅是簡單地給出答案,而是像人類思考一樣,逐步分析和推理。而且,o1系列模型的一個重大突破在于——安全性推理能力。
當面對潛在的不安全提示詞時,它能精準理解上下文,根據(jù)預(yù)設(shè)安全策略進行深度推理。
這使得o1在多個安全基準測試中,展現(xiàn)出卓越的性能,比如有效地址非法建議的生成、拒絕刻板印象的響應(yīng)、低于已知的模型越獄攻擊。結(jié)合CoT的智能增強的同時,也帶了潛在的風險。
為了確保模型安全,OpenAI研發(fā)團隊采取了多層次的風險管理策略。比如,他們建立了穩(wěn)健的對齊方法,進行了廣泛的壓力測試,并維護細致的風險管理協(xié)議。
數(shù)據(jù)和訓(xùn)練
在此之前,先來了解下o1的數(shù)據(jù)和訓(xùn)練過程。完整版o1是該系列旗艦?zāi)P?,o1-mini是專注編碼的輕量級版本。通過強化學(xué)習(xí)RL進行訓(xùn)練的目的,就是讓o1系列能夠進行復(fù)雜的推理。o1在回答之前進行思考——它可以在響應(yīng)用戶之前產(chǎn)生長的思維鏈條。
通過訓(xùn)練,模型學(xué)會了優(yōu)化思維過程,去嘗試不同的策略,并自主識別錯誤。推理使o1模型能夠遵循OpenAI設(shè)定的特定指南和模型政策,幫助其符合安全期望。不僅如此,o1模型的訓(xùn)練數(shù)據(jù)源豐富多樣,包括公開可用數(shù)據(jù)、通過合作伙伴關(guān)系訪問的專有數(shù)據(jù),以及內(nèi)部開發(fā)的自定義數(shù)據(jù)集。
– 公共數(shù)據(jù):
兩個模型都在各種公開可用的數(shù)據(jù)集上進行了訓(xùn)練,包括網(wǎng)絡(luò)數(shù)據(jù)和開源數(shù)據(jù)集。
關(guān)鍵組成部分包括推理數(shù)據(jù)和科學(xué)文獻。這確保了模型在一般知識和技術(shù)主題上都很精通,增強了它們執(zhí)行復(fù)雜推理任務(wù)的能力。
– 來自數(shù)據(jù)合作伙伴的專有數(shù)據(jù):
為了進一步增強o1和o1-mini的能力,OpenAI通過戰(zhàn)略合作,獲取高價值的非公開數(shù)據(jù)集。
這些專有數(shù)據(jù)源包括收費內(nèi)容、專業(yè)檔案和其他特定領(lǐng)域的數(shù)據(jù)集,提供了對行業(yè)特定知識和用例的更深入見解。
– 數(shù)據(jù)過濾和優(yōu)化:
OpenAI數(shù)據(jù)處理管道包括嚴格的過濾,以保持數(shù)據(jù)質(zhì)量和減輕潛在風險。研究團隊使用先進的數(shù)據(jù)過濾流程來減少訓(xùn)練數(shù)據(jù)中的個人信息。他們還結(jié)合使用自家的審核API和安全分類器,防止使用有害或敏感內(nèi)容,包括諸如CSAM等材料。
結(jié)語
OpenAI的這一系列動作,無疑將推動AI技術(shù)的進一步發(fā)展和應(yīng)用。隨著滿血版o1模型和ChatGPT Pro的推出,AI技術(shù)在各個領(lǐng)域的應(yīng)用將更加廣泛和深入。同時,這也為相關(guān)企業(yè)和個人提供了新的商業(yè)機會和發(fā)展空間。
此外,據(jù)外媒報道,OpenAI還將在之后的直播中發(fā)布文生視頻工具Sora等新產(chǎn)品。這些新產(chǎn)品的推出,將進一步豐富OpenAI的產(chǎn)品線,為用戶提供更加多樣化和個性化的服務(wù)。
綜上所述,OpenAI的為期12天的直播活動已經(jīng)拉開了帷幕,滿血版o1模型和ChatGPT Pro的推出引發(fā)了廣泛關(guān)注和期待。未來,隨著AI技術(shù)的不斷發(fā)展和應(yīng)用,我們有理由相信OpenAI將為用戶帶來更多驚喜和突破。(文/宋雨涵)