通過對2024年報道內(nèi)容的梳理,并基于閱讀數(shù)、評論數(shù)、轉(zhuǎn)發(fā)量、點贊數(shù)等數(shù)據(jù),我們匯總了2024年算力豹最受關(guān)注的報道內(nèi)容。

此前算力豹盤點過關(guān)于【算力豹2024年度十大頭條文章盤點】——公司篇的相關(guān)文章,了解相關(guān)內(nèi)容請點擊下方鏈接

2024年末重頭戲!【算力豹2024年度十大頭條文章盤點】——公司篇

文字編輯| 宋雨涵

年度總結(jié)報告—產(chǎn)品篇

2024.1.7

1

Meta的Llama 3

1

Llama 3來襲!Meta最強開源大模型

多模態(tài)版本很快上線

2024年4月18日,Meta官網(wǎng)宣布Llama 3,已開放80億和700億參數(shù)版本,提供8k上下文窗口及新信任和安全工具。

Llama 3使用超15T tokens數(shù)據(jù)訓(xùn)練,數(shù)據(jù)集比Llama 2大7倍,代碼多4倍,通過高質(zhì)量訓(xùn)練數(shù)據(jù)和指令微調(diào)實現(xiàn)顯著提升,在多項基準測試中展現(xiàn)先進性能。Meta開發(fā)的高質(zhì)量人類評估集顯示,Llama 3 70B表現(xiàn)優(yōu)于Claude Sonnet、Mistral Medium、GPT-3.5、Llama 2。Llama 3采用僅解碼式Transformer架構(gòu),預(yù)告將推出超4000億參數(shù)版本。

Meta延續(xù)開源路線,與谷歌、Mistral AI等競爭。Llama 3在多項基準上得分超過競品,Meta計劃整合至Facebook、Instagram、WhatsApp等應(yīng)用,提升AI體驗。未來幾月,Meta將推出新功能、更長上下文窗口、多模態(tài)和增強性能,并分享研究論文。LLaMA 3具有強大自然語言處理能力,有望在智能客服、內(nèi)容推薦等領(lǐng)域帶來商業(yè)價值,推動AI技術(shù)普及和應(yīng)用。

2

OpenAI o1

2

OpenAI o1模型問世,AI或?qū)⑾袢祟愐粯铀伎紗栴}

2024年9月13日,OpenAI發(fā)布全新模型o1-preview,引發(fā)業(yè)內(nèi)關(guān)注。o1命名象征AI能力新水平,代表OpenAI最強水平,標志著AI行業(yè)新紀元,是通往AGI的重要一步。

o1采用新優(yōu)化算法和訓(xùn)練數(shù)據(jù)集,通過強化學(xué)習和“思維鏈”技術(shù),實現(xiàn)復(fù)雜推理性能大幅提升,擁有通用推理能力。在基準測試中,o1超越GPT-4o和人類博士水平,尤其在物理、生物、化學(xué)問題上表現(xiàn)突出。其背后原理在于強化學(xué)習算法,通過思維鏈完善策略,提高推理能力。

o1模型在回答問題前會花時間“思考問題”,類似人類。通過訓(xùn)練,學(xué)會完善思維過程,嘗試不同策略,自主識別錯誤。OpenAI發(fā)現(xiàn)新Scaling Law定律,o1性能隨強化學(xué)習和思考時間投入而提高。

案例分析顯示,o1在解決問題時會展開思維鏈,與自己對話,判斷最佳答案。在化學(xué)問題中,o1選擇多種方案對比,多次糾正后得出正確答案。訓(xùn)練方法源自斯坦福大學(xué)的“自學(xué)推理”(STaR)技術(shù)。

與GPT-4o相比,o1在競賽編程、數(shù)學(xué)奧林匹克競賽和科學(xué)問題基準測試中表現(xiàn)優(yōu)異。內(nèi)部評估顯示,o1在編碼、數(shù)學(xué)和科學(xué)領(lǐng)域超越GPT-4o,甚至可能超越人類?!睹咳战?jīng)濟新聞》測試顯示,o1-preview編程和數(shù)學(xué)推理能力超越OpenAI之前的大模型,且人性化提升。但OpenAI承認,o1在設(shè)計、寫作等方面不如GPT-4o,無瀏覽網(wǎng)頁或處理文件、圖像能力。

由于推理成本增加,o1使用次數(shù)受限,每周30條消息。同時推出o1-mini版,每周50條消息限額,且API僅開放給高級用戶。o1-preview定價較高,是GPT-4o的3-4倍,面向特定科研用戶,速度、成本和應(yīng)用范圍有限。

o1-mini為更高效解決方案,比o1-preview便宜80%,適合需要推理但無需通用世界知識的應(yīng)用。

總之,OpenAI o1模型在復(fù)雜推理任務(wù)上超越之前模型,展示AI領(lǐng)域新進展。但高成本和對特定任務(wù)優(yōu)化限制其廣泛應(yīng)用,隨技術(shù)發(fā)展和成本降低,o1模型有望在更多領(lǐng)域發(fā)揮重要作用。

3

英特爾至強6性能核處理器

3

不斷演進與重構(gòu)后的新品!英特爾發(fā)布至強6性能核處理器

將帶領(lǐng)數(shù)據(jù)中心邁向未來

2024年9月26日,英特爾發(fā)布至強6性能核處理器(代號Granite Rapids),專為AI、數(shù)據(jù)分析等計算密集型業(yè)務(wù)設(shè)計。發(fā)布會上,英特爾與生態(tài)伙伴分享了該處理器在云計算、數(shù)據(jù)中心架構(gòu)創(chuàng)新、綠色可持續(xù)發(fā)展等領(lǐng)域的應(yīng)用,并進行了聯(lián)合發(fā)布。

至強6處理器采用模塊化SoC架構(gòu)設(shè)計,按功能塊劃分,采用Intel 3制程工藝(計算die)和Intel 7工藝(I/O die)。至強6900P系列包含3個計算die,核心數(shù)最多達128個,內(nèi)存帶寬大幅提升,支持DDR5 6400或MRDIMM 8800,每個核心擁有更充裕的內(nèi)存帶寬,有利于核心性能釋放。此外,還支持6條UPI 2.0鏈路、96條PCIe 5.0或64條CXL 2.0通道及504MB L3緩存,AMX加速器引入FP16數(shù)據(jù)精度,為AI推理和訓(xùn)練提供更多精度選擇。

異構(gòu)計算方面,至強6處理器支持CXL 2.0規(guī)范,提高內(nèi)存利用率,為未來內(nèi)存擴展和內(nèi)存池化奠定基礎(chǔ)。熱功耗方面,至強6900P系列TDP最高達500W,但能耗比和核心密度提升對數(shù)據(jù)中心更重要。

性能上,至強6處理器性能翻倍,滿足從邊緣到數(shù)據(jù)中心再到云環(huán)境中的嚴苛AI挑戰(zhàn)。模塊化設(shè)計提供高度靈活性和可擴展性,為云服務(wù)提供商等提供豐富產(chǎn)品系列。

浪潮信息、阿里云、超聚變、火山引擎、新華三等分別展示了基于至強6的新品,推動數(shù)據(jù)中心算力升級。英特爾還介紹了中國數(shù)據(jù)中心液冷創(chuàng)新加速計劃,旨在降低液冷使用成本、增強可靠性,推動規(guī)?;瘧?yīng)用。

未來,英特爾將持續(xù)推出基于更先進工藝和架構(gòu)的至強系列處理器,提升性能和能效。計劃推出支持DDR5內(nèi)存和PCIe 5.0或CXL 2.0通道的至強6處理器,進一步提升性能和可擴展性。

4

豆包視頻大模型

4

視頻AI市場風流涌動,字節(jié)版 Sora 發(fā)布!

實現(xiàn)10秒長度、多主體交互、一致性多鏡頭

2024年9月25日,豆包視頻大模型亮相,展現(xiàn)AI視頻生成潛力,備受關(guān)注。其突出特點包括:精準語義理解,支持多主體動作交互;強大動態(tài)與炫酷運鏡,實現(xiàn)多鏡頭切換;高保真高美感,支持多種風格和比例。

豆包視頻大模型應(yīng)用廣泛,如電商營銷、動畫教育、城市文旅等場景,實現(xiàn)降本提效和創(chuàng)意合規(guī)?;鹕揭娉兄Z繼續(xù)推進模型升級迭代,探索更多應(yīng)用。

數(shù)據(jù)顯示,截至9月,豆包大模型日均tokens使用量超1.3萬億,增長超10倍。未來展望包括語義理解精細化、多模態(tài)融合、個性化定制服務(wù)以及加強數(shù)據(jù)安全與隱私保護。

豆包視頻大模型作為AI視頻生成領(lǐng)域佼佼者,憑借先進技術(shù)特點和廣泛應(yīng)用前景,將繼續(xù)引領(lǐng)行業(yè)發(fā)展,為人類帶來更豐富便捷的視頻生成體驗。

5

浪潮信息元腦服務(wù)器與

新華三H3C UniServer G7

5

當智算遇到1024程序員節(jié)!

浪潮信息元腦服務(wù)器與

新華三H3C UniServer G7新品齊登場

2024年10月24日,元腦?服務(wù)器第八代新品與新華三十余款智算新品齊發(fā)。浪潮信息發(fā)布元腦?第八代算力平臺,實現(xiàn)“一機多芯”,支持英特爾?至強?6及AMD EPYC? 9005系列處理器,性能較上代提升3倍。新華三發(fā)布H3C UniServer G7系列、H3C UniStor Polaris X20000系列等智算新品,助力行業(yè)智能化轉(zhuǎn)型。

元腦?第八代算力平臺,通過開放架構(gòu)設(shè)計,促進多元算力生態(tài)進化。在通用算力領(lǐng)域,參與開放計算模組規(guī)范(OCM),發(fā)布首款基于OCM的NF3290G8。在AI算力領(lǐng)域,推動OAM規(guī)范生態(tài)繁榮,發(fā)布基于UBB2.0的NF5898G8。平臺還實現(xiàn)智能增強,提供全面的平臺軟件與工具軟件支持,提升預(yù)警、散熱、管理能力。

元腦服務(wù)器性能與能效大幅提升,搭載最新英特爾?至強?6處理器,性能提升200%,能效比提升230%以上,適用于多種應(yīng)用場景。

新華三集團總裁于英濤強調(diào),新華三聚焦“算力×聯(lián)接”,深化“AI in ALL”,打造開放協(xié)同的智算生態(tài),滿足不同行業(yè)算力需求。H3C UniServer G7系列采用模塊化設(shè)計,支持高效散熱與液冷技術(shù),兼容OAI 2.0標準,打造開放生態(tài)。同時,發(fā)布內(nèi)生AI的操作系統(tǒng)磐寧OS與智能管理中樞。

H3C UniServer系列新品包括R4900 G7支持6張雙寬GPU,R5500 G7支持萬億參數(shù)大模型訓(xùn)練,R5300 G7擁有廣泛模型兼容性。H3C UniStor Polaris X20000系列實現(xiàn)性能加速、架構(gòu)簡化與極致穩(wěn)定。傲飛算力平臺融合云原生技術(shù),提升算力資源利用率。

6

訊飛星火4.0 Turbo

6

超越GPT-4,聯(lián)手華為,

科大訊飛全球1024開發(fā)者節(jié)爆震撼大招

2024年10月24日,科大訊飛全球1024開發(fā)者節(jié)上,訊飛星火4.0 Turbo發(fā)布,多模態(tài)視覺交互搶先GPT-4o,超擬人數(shù)字人交互引發(fā)熱烈反響,破國內(nèi)紀錄。本屆開發(fā)者節(jié)以“萬物智聯(lián) 生生不息”為主題,科大訊飛展示了在汽車、醫(yī)療、教育等領(lǐng)域的領(lǐng)先成果。

訊飛星火4.0 Turbo七大能力超GPT-4 Turbo,數(shù)學(xué)、代碼能力超越GPT-4o,效率提升50%。在技術(shù)層面,科大訊飛解決了大模型可信可解釋、推廣性及個性化問題,實現(xiàn)底層技術(shù)突破。星火超擬人數(shù)字人實現(xiàn)語義貫穿的“口唇-表情-動作”生成,支持個性創(chuàng)建,已開通內(nèi)測。

科大訊飛與華為聯(lián)合研發(fā)小藝聲音修復(fù),助力特殊人群交流。多語種AI翻譯透明屏實現(xiàn)無障礙交流。在教育行業(yè),發(fā)布高中數(shù)學(xué)智能教師系統(tǒng),推動黑板成為教學(xué)AI助手。訊飛AI學(xué)習機首發(fā)AI作業(yè)過濾器,提供習題優(yōu)先級選項。

訊飛星火醫(yī)療大模型2.0升級六大核心場景能力,發(fā)布智能醫(yī)學(xué)影像助手,助力影像質(zhì)控、診斷和讀片。同時,發(fā)布全譜系全模態(tài)醫(yī)學(xué)影像大模型開放合作計劃。在司法場景,法律大模型提升庭審筆錄、裁判文書編寫等效率。政務(wù)服務(wù)場景,政務(wù)大模型覆蓋4500多種事項,縮短審核時間,提升登記效率,首發(fā)“星火智辦一體機”。

科大訊飛作為全球領(lǐng)先的智能語音和人工智能公司,影響力遍及多行業(yè)。未來,更多大模型廠商將為全球用戶帶來創(chuàng)新和價值。

7

大規(guī)模地理空間模型(LGM)

7

寶可夢GO團隊打造全球最強3D地圖

150萬億參數(shù)開啟空間智能新篇章

2024年11月22日,寶可夢GO團隊宣布構(gòu)建出參數(shù)規(guī)模超150萬億的大規(guī)模地理空間模型LGM,標志著空間計算和AR眼鏡領(lǐng)域的新時代。LGM作為Niantic視覺定位系統(tǒng)VPS的一部分,通過訓(xùn)練超過5000萬個神經(jīng)網(wǎng)絡(luò)實現(xiàn),能夠像人類一樣理解空間,為AR、機器人、內(nèi)容創(chuàng)建等領(lǐng)域帶來突破。

LGM可視為超級智能地圖,具備強大的3D理解能力,能填補地球上尚未全面掃描領(lǐng)域的空白。它使計算機不僅能感知和理解空間,還能與之互動,預(yù)示著空間智能將成為未來世界的操作系統(tǒng)。

李飛飛在2024年TED演講中首提“空間智能”概念,強調(diào)AI需具備類似人類的空間推理能力。她團隊的多模態(tài)感知與推理、動態(tài)三維環(huán)境的強化學(xué)習、大規(guī)模物理場景建模等技術(shù),為空間智能打下堅實基礎(chǔ)。

LGM利用大規(guī)模機器學(xué)習理解場景,與全球數(shù)百萬個場景相連,實現(xiàn)空間理解的飛躍。它能在超過100萬個地點操作,每個本地網(wǎng)絡(luò)為全球大模型貢獻理解,包括未掃描地方?;跀?shù)十億張全球圖像構(gòu)建,LGM使計算機能基于位置理解空間、結(jié)構(gòu)和物理交互,實現(xiàn)地理空間智能。

Niantic團隊五年構(gòu)建的VPS,利用單張圖像構(gòu)建3D地圖,確定位置和方向。LGM不僅定位,還編碼幾何、外觀和文化信息,啟用新方式表示、操控和創(chuàng)造場景。未來智能體系統(tǒng)將相互補充,共同工作理解世界。

LGM作為AI進化里程碑,將在AR技術(shù)、游戲、城市規(guī)劃、物流管理等領(lǐng)域帶來變革。同時,需關(guān)注其隱私和數(shù)據(jù)安全問題,采取有效措施保護。

8

谷歌Gemini

8

雄心人盡皆知!谷歌Gemini勢與GPT-4o“掰手腕,

谷歌Gemini 2.020241212日正式發(fā)布!

2024年11月19日,谷歌的Gemini-Exp-1114模型短暫超越GPT-4o,登上Arena榜單榜首,但隨后被GPT-4o更新版本奪回。接著,Gemini-Exp-1121再次奪得第一,顯示大模型更新迭代迅速。

Gemini-Exp系列的改進主要集中在質(zhì)量和編碼、推理、視覺能力上。這場競爭引出了人工智能基準測試方法可能簡化模型評估的問題。傳統(tǒng)指標可能夸大感知能力,導(dǎo)致廠商針對特定測試優(yōu)化模型,而忽視安全性、可靠性和實用性。例如,Gemini-Exp-1121在數(shù)學(xué)和推理能力上不及前版。

真正的競爭在于開發(fā)新框架來評估AI系統(tǒng)的安全性和可靠性。同時,谷歌內(nèi)部消息透露,Gemini 2.0將于12月第二周發(fā)布,帶來CoT推理能力、多模態(tài)能力增強、上下文窗口擴展和“Project Jarvis”智能代理等新特性。

谷歌還宣布全力推廣商用AI Agent,發(fā)布激勵活動和產(chǎn)品,包括一站式商用生態(tài)、AI Agent市場和激勵計劃。AI Agent市場讓用戶快速找到并試用AI Agent,簡化選擇和部署流程。

谷歌在大模型領(lǐng)域的雄心明顯,通過不斷推出創(chuàng)新模型鞏固領(lǐng)先地位。OpenAI、谷歌等科技巨頭的競爭,每次重要發(fā)布都可能改變行業(yè)格局。谷歌年底發(fā)布新版Gemini,將為AI競爭掀開新篇章。

9

昆侖萬維“天工大模型4.0”o1

9

你是o1那我是誰?國產(chǎn)模型對標”O(jiān)penAI!

昆侖萬維天工大模型4.0”o1版登場

2024年11月28日,昆侖萬維推出「天工大模型4.0」o1版(Skywork o1),這是國內(nèi)首款中文邏輯推理o1模型,具備慢思考推理能力,推理能力大幅提升,成為生態(tài)位SOTA。

昆侖萬維致力于通用人工智能,已完成“算力基礎(chǔ)設(shè)施—大模型算法—AI應(yīng)用”全產(chǎn)業(yè)鏈布局,業(yè)務(wù)涵蓋AGI與AIGC、海外信息分發(fā)與元宇宙、投資等領(lǐng)域。自2020年起,公司關(guān)注大模型和AIGC,構(gòu)建了多元AI業(yè)務(wù)矩陣,部分已商業(yè)化。

「天工大模型4.0」o1版包括三款:Skywork o1 Open(開源版本,評測指標大幅提升,解鎖復(fù)雜數(shù)學(xué)任務(wù))、Skywork o1 Lite(具備完整思考能力,中文支持好,推理速度快)、Skywork o1 Preview(完整版推理模型,思考過程多樣且深度,推理質(zhì)量高)。通過自研多智能體體系、強化學(xué)習和Q*算法等技術(shù),模型推理和反思能力得到強化。

相較于此前大模型,Skywork o1在處理復(fù)雜問題、思考反思過程、輸出答案質(zhì)量上均有大幅提升。在考研數(shù)學(xué)題、比大小問題、中文讀音陷阱問題、算24點游戲等測試中表現(xiàn)優(yōu)異,展示了強大的推理和反思能力。

然而,昆侖萬維大模型之路面臨挑戰(zhàn):高額研發(fā)投入導(dǎo)致凈虧損持續(xù)擴大,人事層面發(fā)生變動,市場競爭加劇,商業(yè)化落地挑戰(zhàn),需要不斷吸引和培養(yǎng)人才,加強技術(shù)儲備和研發(fā)能力。

昆侖萬維「天工大模型4.0」o1版的推出是國產(chǎn)AI大模型發(fā)展的重要里程碑,為商業(yè)化應(yīng)用和市場拓展奠定堅實基礎(chǔ),但需持續(xù)創(chuàng)新迭代,以應(yīng)對挑戰(zhàn),保持領(lǐng)先地位。

10

昇思人工智能框架

10

華為又一大動作!昇思人工智能框架峰會:

開源4年份額達30%,成為發(fā)展最快AI框架

2024年12月14日,昇思MindSpore在北京中關(guān)村國際創(chuàng)新中心舉辦人工智能框架峰會。人工智能作為科技革命驅(qū)動力,正重塑世界。昇思作為AI框架,加速大模型研發(fā),驅(qū)動產(chǎn)業(yè)智能化。峰會亮點包括院士致辭、昇思使能模型發(fā)布、金獎頒獎等。18家單位發(fā)布基于昇思的大模型成果,預(yù)測昇思在中國AI框架2024年新增市場份額將達30%。

會上,昇思與多家企業(yè)發(fā)布基于其框架的大模型,面向多行業(yè)推出AI應(yīng)用,加速數(shù)智化升級。華為堅持打造開放計算產(chǎn)業(yè)生態(tài),昇思AI框架需具備高效、敏捷、開放的技術(shù)與生態(tài)能力。華為將持續(xù)投入昇思,以開源方式共享技術(shù)創(chuàng)新,推動中國AI框架生態(tài)發(fā)展。

人工智能高速發(fā)展,大模型技術(shù)演進,昇思持續(xù)升級框架架構(gòu),提升開發(fā)者編程體驗,優(yōu)化大模型訓(xùn)練,強化多模型多任務(wù)能力。昇思提供分層分級學(xué)習體系,與開發(fā)者共成長,堅持開放治理,共治框架未來。昇思與算法專家合作,支持原生大模型孵化,加速成果轉(zhuǎn)化。會上頒發(fā)模型開發(fā)挑戰(zhàn)賽金獎,表彰杰出開發(fā)者及布道師。

華為通過開放硬件與軟件,助力開發(fā)者創(chuàng)新AI模型與應(yīng)用。昇騰硬件合作伙伴增至50多家,軟件合作伙伴增至2000多家,聯(lián)合開發(fā)解決方案近4000個。昇思框架于2020年開源,4年來發(fā)展迅速,成為中國發(fā)展最快的AI開源框架。昇思框架具備高效、敏捷、開放能力,助力AI模型開發(fā)、訓(xùn)練和推理。探索分布式技術(shù),創(chuàng)新多模型多任務(wù)引擎,優(yōu)化快交互能力。

華為致力于構(gòu)建開放計算產(chǎn)業(yè)生態(tài),堅持根源技術(shù)創(chuàng)新,將持續(xù)投入昇思框架,以開源方式展示創(chuàng)新成果,推動中國AI框架生態(tài)健康高速發(fā)展。昇思MindSpore框架作為華為AI核心布局,已取得顯著成就,未來有望在AI領(lǐng)域發(fā)揮更關(guān)鍵作用,推動行業(yè)智能化轉(zhuǎn)型。

分享到

lixiangjing

算力豹主編

相關(guān)推薦