文字編輯| 宋雨涵

1

Gork3架構(gòu)簡單介紹

十萬H100芯片的“核彈級算力”

與其他眾多模型相較,Gork3無疑是含著金鑰匙誕生的佼佼者,它直接動用了10萬塊H100芯片進(jìn)行大規(guī)模訓(xùn)練,僅僅耗時122天便圓滿完成了第一階段的預(yù)訓(xùn)練任務(wù)。

隨后,在僅僅92天后,其訓(xùn)練集群規(guī)模再次得到顯著擴(kuò)大,實力不容小覷。Gork3巧妙融合了深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)兩種技術(shù)路徑。借助深度學(xué)習(xí),模型能高效地從海量數(shù)據(jù)中提煉出關(guān)鍵特征和模式。而強(qiáng)化學(xué)習(xí)的運用,則讓Gork3在訓(xùn)練進(jìn)程中能夠持續(xù)調(diào)整自身策略,以追求更高的獎勵信號。在面對推理任務(wù)時,Gork3通過反復(fù)嘗試與驗證,不斷優(yōu)化推理路徑,直至找到最優(yōu)解決方案。

此外,Gork3的架構(gòu)中還有一個亮點模塊——深度搜索功能。

這一模塊能夠快速檢索并驗證信息,為用戶提供精準(zhǔn)答案。其設(shè)計靈感汲取自當(dāng)前頂尖的搜索引擎技術(shù),但Gork3在此基礎(chǔ)上進(jìn)行了大幅改進(jìn)和優(yōu)化。

深度搜索模塊不僅能模擬人類的搜索行為,快速檢索大量信息,還能通過推理和驗證確保信息的可信度。

在搜索過程中,Gork3會呈現(xiàn)一個高級進(jìn)度條,實時展示其思考與搜索的進(jìn)展。搜索結(jié)束后,界面右側(cè)將展示查詢模型的啟動摘要,包括瀏覽的網(wǎng)站、驗證的來源等信息,并且通常會交叉驗證不同來源,以確保答案的準(zhǔn)確性無誤。這一功能極大提升了用戶效率,原本需要長時間在互聯(lián)網(wǎng)上搜索和篩選信息的繁瑣任務(wù),Gork3都能在短時間內(nèi)輕松完成,其效率遠(yuǎn)超傳統(tǒng)搜索引擎。

Gork3測試數(shù)據(jù)

為了全方位評測Grok3的性能表現(xiàn),xAI團(tuán)隊在多個維度上開展了基準(zhǔn)測試,測試范圍廣泛,包括一般數(shù)學(xué)推理能力、STEM及科學(xué)領(lǐng)域的一般知識掌握情況,還有計算機(jī)科學(xué)編程技能等。

測試結(jié)果表明,Grok3在所有這些領(lǐng)域均展現(xiàn)出了卓越的表現(xiàn)。在針對高中競賽數(shù)學(xué)的測試中,Grok3顯示出了強(qiáng)大的問題解決能力;面對博士級別的科學(xué)難題,它也能提供高質(zhì)量的解答;而在編程測試環(huán)節(jié),無論是競爭性編碼挑戰(zhàn)還是面試中的編程問題,Grok3都表現(xiàn)得非常優(yōu)異。

除了基準(zhǔn)測試外,xAI團(tuán)隊還對Grok3進(jìn)行了盲測評估。在這一測試中,平臺剝離了所有產(chǎn)品服務(wù)層,僅對語言模型的核心引擎進(jìn)行了直接對比。用戶在平臺上提交單一查詢后,會收到來自兩個不同模型的回應(yīng),但用戶并不知道這些回應(yīng)具體來自哪個模型。

在這次盲測中,Grok3的早期版本就取得了令人驚艷的成績,綜合得分高達(dá)1400分,在所有測試類別中均位居榜首,并且其得分還在持續(xù)攀升。這充分證明了Grok3在實際應(yīng)用中的強(qiáng)大實力,它能夠在復(fù)雜的測試環(huán)境中脫穎而出,為用戶提供精準(zhǔn)、高質(zhì)量的答案。

2

中美AI競速再升級

狙擊DeepSeek,挑戰(zhàn)OpenAI霸權(quán)

Grok 3的性能與優(yōu)勢

在當(dāng)天的直播中,馬斯克與xAI的三位工程師一起進(jìn)行了現(xiàn)場演示,Grok 3在數(shù)學(xué)、科學(xué)和編程基準(zhǔn)測試中,擊敗了谷歌Gemini、DeepSeek的V3模型、Anthropic的Claude和OpenAI的GPT-4o。馬斯克表示,Grok 3的計算能力是Grok 2的10倍以上,經(jīng)過合成數(shù)據(jù)的訓(xùn)練,能夠通過重新分析信息來反思自己的錯誤,從而獲得更好的邏輯一致性。

除了強(qiáng)大的計算能力外,Grok 3還引入了先進(jìn)的訓(xùn)練方法和策略。馬斯克介紹道:“Grok 3經(jīng)過合成數(shù)據(jù)的訓(xùn)練,能夠通過重新分析信息來反思自己的錯誤,從而獲得更好的邏輯一致性?!边@種自我糾錯機(jī)制使得Grok 3在處理復(fù)雜問題時更加準(zhǔn)確和可靠。

Grok3應(yīng)用案例

為了更直觀地展示Grok 3的能力,馬斯克團(tuán)隊在直播中提出了一個挑戰(zhàn)性問題:“生成3D動畫代碼,演示從地球發(fā)射、著陸火星,然后在下一個發(fā)射窗口返回地球的過程?!边@是一個涉及復(fù)雜物理知識和編程技巧的難題。然而,Grok 3僅用了近兩分鐘的思考時間,就生成了可以直接運行的Python代碼。當(dāng)這段代碼被執(zhí)行時,屏幕上顯示出了飛船在地球和火星間往返的動畫,效果令人驚嘆。

此外,馬斯克還透露了Grok 3在多個領(lǐng)域的應(yīng)用潛力。他表示:“Grok 3不僅在數(shù)學(xué)、科學(xué)和編程方面表現(xiàn)出色,它還將被嵌入特斯拉的生態(tài)系統(tǒng),成為新款Model Q的車載智能助手,并與Optimus人形機(jī)器人無縫連接。同時,它在醫(yī)療診斷、法律咨詢、金融服務(wù)、智能客戶服務(wù)等多個領(lǐng)域也有著巨大的應(yīng)用前景?!?/p>

此次Grok 3的發(fā)布正值馬斯克與OpenAI之間的競爭不斷升級。馬斯克曾公開表示對OpenAI違背初衷、轉(zhuǎn)向營利性企業(yè)的不滿,并試圖通過收購來重新掌控這家曾經(jīng)的合作伙伴。然而,OpenAI的首席執(zhí)行官薩姆·奧爾特曼拒絕了馬斯克的收購要約,并反諷道:“如果你愿意的話,我們可以花97.4億美元收購?fù)铺??!?/p>

3

xAI的那些事兒

馬斯克的人工智能新布局

馬斯克成立xAI公司,目標(biāo)直指OpenAI

埃隆?馬斯克(Elon Musk)作為科技界的杰出人物,其在人工智能領(lǐng)域的動作一直備受關(guān)注。2023年,馬斯克成立了人工智能創(chuàng)業(yè)公司xAI,旨在與OpenAI一決高下。馬斯克曾在2015年與山姆?奧爾特曼(Sam Altman)共同創(chuàng)立了OpenAI,但因經(jīng)營理念分歧,于2018年離開OpenAI。此后,馬斯克對OpenAI從非營利模式向營利模式的轉(zhuǎn)變持批評態(tài)度。

Grok系列模型的快速發(fā)展

xAI公司在成立后不久,便發(fā)布了Grok和Grok 1.5模型。2024年8月,公司發(fā)布了Grok 2語言模型。2024年12月,xAI宣布開始向X平臺上的所有用戶免費推出新版Grok-2模型,而此前該模型只向訂閱了Premium Plus的用戶開放。據(jù)報道,xAI還在為Grok開發(fā)一款專門的應(yīng)用程序,用戶將不再需要使用X來訪問人工智能模型。

xAI的融資情況

據(jù)報道,xAI正在接洽潛在的投資者,計劃籌集約100億美元資金,此輪融資可能使該公司估值達(dá)到約750億美元。據(jù)悉,包括紅杉資本、Andreessen Horowitz和Valor Equity Partners等現(xiàn)有投資者正在商討參與此次融資。

收購OpenAI的提議

2025年2月10日,由馬斯克牽頭的投資者財團(tuán)提出以974億美元的價格收購OpenAI。馬斯克的律師馬克?托貝羅夫確認(rèn)了這一消息,并稱已向OpenAI董事會提交了該收購要約。這一收購提議不僅將馬斯克與OpenAI首席執(zhí)行官奧爾特曼之間的長期矛盾推向高潮,同時也為全球人工智能行業(yè)的未來格局增添了巨大的不確定性。

寫在最后

此次直播演示不僅展示了Grok 3的強(qiáng)大實力,也再次證明了馬斯克在AI領(lǐng)域的領(lǐng)導(dǎo)力和創(chuàng)新精神。隨著Grok 3的正式發(fā)布,一場新的AI競賽已經(jīng)拉開序幕。

“這是最后一個需要人類監(jiān)督的AI版本?!瘪R斯克在發(fā)布會上宣稱,Grok-3不僅是技術(shù)里程碑,更是AI發(fā)展路線的分水嶺——開源模式能否抗衡OpenAI與谷歌的資本聯(lián)盟?算力堆砌是否仍是通向AGI(通用人工智能)的唯一路徑?答案或許將決定未來十年全球科技權(quán)力的歸屬。

分享到

lixiangjing

算力豹主編

相關(guān)推薦