年度總結報告——公司篇
2024.12.31
1
智譜AI
1
性能比肩GPT-4!智譜AI發(fā)布大模型GLM-4
人人能開發(fā)
你是否曾因不會編程而放棄將奇思妙想變?yōu)閼??現在,AI與大模型讓不會寫代碼的人也能開發(fā)應用,通過自然語言與大模型對話即可。
智譜AI在2024年1月16日的技術開放日上發(fā)布了第四代基座大模型GLM-4,其性能相比上一代提升近60%,媲美Gemini Ultra和GPT-4,中文能力超越所有競爭對手。GLM-4支持更長上下文,多模態(tài)能力增強,推理速度更快,在基礎能力、指令跟隨能力和對齊能力上均表現出色。
智譜AI還推出了GLM-4 All Tools,可自動理解、規(guī)劃復雜指令,自由調用網頁瀏覽器、代碼解釋器和多模態(tài)文生圖大模型,實現復雜任務。用戶即使不會編程,也能通過簡單提示詞創(chuàng)建自己的GLM智能體,如行程助手等。
智譜AI還宣布推動大模型開源基金,提供卡、現金和免費API tokens,并發(fā)起10億人民幣的大模型創(chuàng)業(yè)基金。智譜AI正實踐著帶領國產大模型開啟開發(fā)者生態(tài),已聯合發(fā)起多個大模型基金,為高校研究項目提供科研支持。
GLM-4的發(fā)布降低了AI大模型的應用門檻,對AI技術在各行業(yè)中的普及具有很大價值。智譜AI正在“將算力變成智力,將智力變成生產力”,期待所有研究者和開發(fā)者共同探索大模型的未來。
2
英偉達
2
英偉達AI“核彈”問世,推理性能提升30倍,
“非常非常大!”
30年來,人們追求加速運算與AI突破,生成式AI成為當前關鍵技術,正邁向多模態(tài)和視頻領域,需更大規(guī)模訓練。算力市場競爭加劇,英偉達產品不斷刷新AI芯片標桿。
2024年03月19日在GTC大會上,英偉達推出新一代AI GPU架構Blackwell及B200、GB200系列,GB200集成了Grace CPU和2個B200GPU,為最強Grace超級芯片。Blackwell架構擁有2080億晶體管,采用臺積電4nm工藝,通過NVLink高速通信,實時運行生成式AI,大型語言模型成本能耗降25倍。GB200采用MCM設計,集成兩個GPU,支持800Gb/s超高速網絡,液冷機架級系統(tǒng)性能提升30倍。
同時,英偉達發(fā)布新一代DGX SuperPOD超級計算機,采用液冷設計,提供11.5 exaflops AI運算能力,可擴展至數萬GB200超級芯片,推進大規(guī)模生成式AI部署。DGX GB200系統(tǒng)提供144 petaflops AI性能,比上代快15倍。
此外,英偉達還公布人形機器人項目GR00T,展示多個機器人產品,使用數位孿生技術學習動作,提供Robotic Foundation Model加速機器人時代。GR00T基于通用基礎模型,能接受多種輸入并處理以采取操作。英偉達還開發(fā)Jetson Thor計算芯片處理復雜任務。人形機器人賽道火熱,黃仁勛稱機器人ChatGPT時刻可能到來。
黃仁勛開完GTC發(fā)布會,強調需要更大模型和GPU,GB200預計今年發(fā)貨。英偉達超級芯片、超算、人形機器人等項目發(fā)布,使造萬億模型成為可能,開啟更大算力AI模型探索。
3
寧暢
3
構筑強大算力,寧暢以“全局智算”戰(zhàn)略發(fā)力大模型落地
2024年3月29日,寧暢發(fā)布2024年度戰(zhàn)略新品及方案,提出通過“全局智算”戰(zhàn)略推進大模型落地。該戰(zhàn)略包括六“全”特點:全體系、全液冷、全服務、全場景、全行業(yè)、全階段,旨在構建全面的AI支撐能力體系。
全體系涵蓋軟硬件棧,支持不同級別AI算力;全場景支持大模型開發(fā)適配與部署;全液冷覆蓋多形態(tài),降低能耗與成本;全行業(yè)滿足業(yè)務需求;全服務提供全時算力服務,包括軟硬件交付;全階段滿足大模型開發(fā)至部署的全流程需求。
“全局智算”戰(zhàn)略包括六層邏輯能力:硬件資源層、集群設計層、軟件層、計算能力層、AI中臺層、模型優(yōu)化層及業(yè)務層和場景層。寧暢通過優(yōu)化算力、算子、AI中臺及模型,提升AI運算能力和產品使用率。
寧暢首個“AI算力?!盢EX AI Lab在桐鄉(xiāng)落成,集成AI計算領域能力,支持大模型落地所需全方位需求。同時,寧暢為某車企打造全面AI體系支撐的自動駕駛系統(tǒng),提升計算和測試效率,加速新產品上市。
寧暢CEO秦曉寧表示,“全局智算”需生態(tài)伙伴互補融合,共同構建能力,推動大模型在各行業(yè)落地,加速科技發(fā)展,提升人民幸福感。
4
亞馬遜云科技
4
亞馬遜云科技宣布“生成式AI合作伙伴計劃”
2024亞馬遜云科技中國峰會在上海召開,宣布了圍繞行業(yè)數字化轉型與生成式AI創(chuàng)新的戰(zhàn)略合作和合作伙伴計劃。亞馬遜副總裁儲瑞松表示,生成式AI時代已到來,亞馬遜云科技將加大投入,助力企業(yè)加速數字化轉型和生成式AI創(chuàng)新。
亞馬遜云科技構成“3+1”聯盟,為企業(yè)提供全方位支持,助力構建和部署生成式AI解決方案。公司將與合作伙伴緊密合作,創(chuàng)新優(yōu)化產品與服務,支持其方案上架至亞馬遜云科技Marketplace,服務中國及全球客戶。
峰會宣布“亞馬遜云科技生成式AI合作伙伴計劃”,旨在助力企業(yè)更快應用生成式AI,打造競爭優(yōu)勢。同時推出“亞馬遜云科技行業(yè)合作伙伴計劃”,聚焦八個重點行業(yè),打造和推廣基于云的新一代行業(yè)解決方案。
亞馬遜云科技始終將安全作為最高優(yōu)先級,為客戶提供安全、穩(wěn)定、可信賴的服務,確??蛻魧W⒂跇I(yè)務創(chuàng)新和發(fā)展。
5
訊飛星火
5
訊飛星火V4.0全面領先,斬獲8項國際權威測試集冠軍
2024年6月27日,科大訊飛在北京發(fā)布訊飛星火大模型V4.0及相關應用,顯著提升七大核心能力,超越GPT-4 Turbo,在8個國際測試集中奪冠。訊飛星火APP自9月開放以來,安卓下載量達1.31億次,領跑國內工具類大模型應用。其熱門助手功能深受用戶喜愛。
發(fā)布會上,科大訊飛基于“飛星一號”推出訊飛星火V4.0,全面升級核心能力,超越GPT-4 Turbo,尤其在文本生成、語言理解等方面領先。訊飛星火V4.0在科研、金融等場景應用效果超GPT-4,長文本能力升級,推出溯源功能提升信息準確性。在12項大模型測試中,訊飛星火8項奪冠,鞏固國內領先地位。
科大訊飛《多語種智能語音關鍵技術及產業(yè)化》項目獲國家科技進步一等獎,星火語音大模型實現多語種多方言免切換識別,超越OpenAI whisper-V3,方言識別效果提升30%。訊飛同傳系統(tǒng)靈活應用于多種場景,突破多人混疊語音轉寫技術,三人同時說話場景下識別準確率高達86%。
星火汽車智能座艙升級,支持多語種多方言自由交互及多情感多模態(tài)超擬人交互,科大訊飛語音交互產品國內市場領先,廣泛出口全球,為多家車企提供智能化體驗??拼笥嶏w提出云邊端、軟硬件一體化解決方案,發(fā)布機器人超腦平臺2.0,支持多模態(tài)交互,已有400余家機器人企業(yè)采用。
訊飛星火大模型推動行業(yè)發(fā)展,助力開發(fā)者生態(tài)繁榮。自V3.5發(fā)布以來,5個月內開發(fā)者數量增至702萬,海外開發(fā)者超40萬,大模型開發(fā)者達57萬,共同探索更多場景應用。
6
360
6
360攜15家大模型,共推革命性AI助手
2024年8月1日,ISC.AI2024峰會上,360創(chuàng)始人周鴻祎宣布與15家國內大模型企業(yè)合作,推出通用的“AI助手”,并開放360安全衛(wèi)士桌面和瀏覽器入口。合作企業(yè)包括智譜、商湯、百川智能等。
這款“AI助手”融合了多種AI技術,提供智能、高效服務,標志著AI領域的又一突破。通過大模型支持,AI助手具備高度個性化和定制化能力,能理解用戶習慣和偏好,提供個性化回復和建議,提升用戶體驗。
市場對“AI助手”反響積極,用戶期待其改變工作和生活方式。行業(yè)分析人士認為,它可能在智能家居、智能辦公等領域掀起熱潮,有望成為科技行業(yè)標桿產品。
從用戶角度看,“AI助手”能高效完成日常任務,提供安全、個性化服務,如自動生成出行路線、預估到達時間,提供辦公助手服務,推薦休閑娛樂活動等,全方位提升用戶生活質量。
周鴻祎認為,中美大模型差距主要在芯片算力和中文數據質量,但國內算法訓練進步迅速。聚集15家廠商能力,綜合能力或可超越GPT-4,最終受益者是用戶。此舉受釘釘啟發(fā),釘釘開放場景并選擇七家合作伙伴,360則選擇盡可能多地聚集合作伙伴。
7
英特爾
7
跨世紀聯手!英特爾終于坐不住了,與AMD攜手成立
x86生態(tài)系統(tǒng)顧問小組
近年來,Arm架構處理器在云服務、移動設備等領域崛起,對x86架構構成競爭壓力。英特爾和AMD在聯想Tech World上宣布組建x86生態(tài)系統(tǒng)咨詢小組,以強化x86架構市場地位。英特爾CEO帕特·基辛格表示,x86架構將迎來定制化、擴大化和可拓展化時期,AMD董事長兼CEO蘇姿豐稱此舉將加速計算能力發(fā)展。
x86架構由英特爾1978年推出的8086處理器創(chuàng)立,后逐漸演變成行業(yè)標準。AMD等公司在不同時期也推出了x86兼容CPU,與英特爾形成雙雄爭霸格局。歷經四十余年發(fā)展,x86架構覆蓋領域逐漸拓展,但面臨Arm架構在移動市場的挑戰(zhàn)。
ARM架構于1983年由Acorn電腦公司開始研發(fā),1986年推出ARMv2架構。1991年,Robin Saxby加入ARM并引入IP商業(yè)模式,使ARM架構授權給多家公司設計處理器。2007年,iPhone和Android系統(tǒng)的崛起使ARM架構在智能手機市場占據霸主地位。
目前,英特爾x86架構主導計算機、服務器市場,而ARM架構壟斷手機市場。兩者競爭激烈,代表性事件包括高通嘗試打造基于ARM的服務器芯片、蘋果轉向使用ARM架構自研芯片等。ARM架構在服務器領域的競爭性不敵x86,但在移動設備領域仍具優(yōu)勢。
隨著ARM芯片性能崛起,全球PC出貨量增長,采用ARM架構的筆記本電腦引領AI筆記本熱潮。Counterpoint預測,到2027年,基于ARM架構的PC設備將占據超過25%的市場份額。
面對ARM架構的壓力,英特爾與AMD攜手成立x86生態(tài)系統(tǒng)顧問小組,旨在匯集行業(yè)領導者,共同塑造x86架構的未來,推動開發(fā)者創(chuàng)新,提升x86產品間的兼容性、可預測性和一致性。
8
高通
8
高通推出驍龍8至尊版,集成全球最快的移動端CPU
驍龍8 Elite是首個采用高通定制Oryon CPU的移動平臺,旨在開啟終端側生成式AI新時代,處理多模態(tài)AI復雜性,并注重隱私保護。眾多OEM廠商將發(fā)布搭載該平臺的終端。
高通技術公司高級副總裁表示,第二代Oryon CPU首次引入驍龍移動平臺,實現性能和能效大幅提升,將變革移動體驗,提供個性化多模態(tài)生成式AI,支持語音、情境和圖像理解,并保護用戶隱私。
智譜與高通合作,將GLM-4V端側視覺大模型適配驍龍8 Elite,推動多模態(tài)生成式AI在終端側部署,實現豐富多模態(tài)交互方式。驍龍8 Elite搭載第二代Oryon CPU和Hexagon NPU,終端側AI能力突破,支持復雜多模態(tài)生成式AI用例高效運行。
多模態(tài)生成式AI模型利用終端側傳感器數據,打造直觀、無縫智能交互體驗。驍龍8 Elite深度適配和推理優(yōu)化,支持實時語音對話、上傳照片和視頻對話等三種交互方式,應用于家庭、出行、工作和教育等場景。
9
World Labs
9
“AI教母”李飛飛創(chuàng)業(yè)歸來,AI靠單圖生成3D世界
生成式AI進入3D化沉浸式新時代
李飛飛的空間智能基于對人類空間認知的深入理解,指準確感受并表現視覺空間的能力,包括三維思考和重現影像。在斯坦福任教時,李飛飛開始研究空間智能,認為其核心在于教會計算機看、學習和行動。
首次面向大眾:2024年TED演講中,李飛飛用“貓推杯”圖片闡述人類復雜的空間推理能力,目前AI尚不具備。她研究如何讓AI理解物體在空間中的位置及其與環(huán)境的關系,推動相關系統(tǒng)進化。
技術進展:寶可夢GO團隊打造的LGM開啟了空間智能新篇章。隨后,李飛飛發(fā)布首個空間智能項目,僅憑一張圖就能生成交互性3D游戲世界。
技術意義與應用:此成果推動計算機視覺和實體智能體發(fā)展,實現從2D到3D的跨越,改變電影、游戲等制作方式。目標客戶包括游戲開發(fā)商和電影制片廠,有助于降低開發(fā)成本,實現創(chuàng)意冒險。對專業(yè)人士而言,它是與其他AI工具結合創(chuàng)造新工作流的有用工具。
多模態(tài)與空間智能的區(qū)別:李飛飛和Justin Johnson在專訪中表示,空間智能側重機器對物理世界的感知、推理和交互能力,是AI發(fā)展的必然趨勢。與語言模型一維表示不同,空間智能需三維表征為核心。算法層面,空間智能提供了新數據處理、輸出類型及問題解決途徑。
10
Open AI
10
直播整活?OpenAI開啟為期12天直播活動
第一天:發(fā)布增強推理模型o1正式版以及每月200美元的ChatGPT Pro訂閱服務。
第二天:推出強化微調研究項目,實現定制化推理模型。
第三天:文生視頻模型Sora正式版亮相。
第四天:編輯協(xié)作工具ChatGPT Canvas發(fā)布,深度融合寫作與編程場景。
第五天:ChatGPT集成Apple Intelligence,支持Siri、寫作工具升級和視覺智能能力。
第六天:新增視頻輸入和實時屏幕共享功能,高級語音模式支持音頻輸入輸出。
第七天:Projects in ChatGPT發(fā)布,用于項目管理與寫作、文件與數據管理、個性化定制等場景。
第八天:ChatGPT搜索全量上線,支持語音功能。
第九天:發(fā)布o1模型API并升級實時API。
第十天:推出可電話直呼的ChatGPT功能。
第十一天:ChatGPT桌面程序推出應用協(xié)作功能。
第十二天:新一代推理模型o3及精簡版o3-mini發(fā)布,更加專注于高性能推理任務