10月16日,零一萬物繼千億參數(shù)模型Yi-Large之后,正式對外發(fā)布新旗艦?zāi)P蚘i-Lightning。這款模型在國際權(quán)威盲測榜單LMSYS上取得了優(yōu)異成績,超越了硅谷知名OpenAI GPT – 4o – 2024 – 05 – 13、Anthropic Claude 3.5 Sonnet,排名世界第六,中國第一。這是中國大模型在LMSYS這一全球大模型必爭的公開擂臺(tái)上,首度實(shí)現(xiàn)“超越OpenAI GPT – 4o”的最佳成績,在一眾國內(nèi)模型中拔得頭籌,成為含金量最高的“中國大模型第一”。零一萬物也憑借此模型緊隨OpenAI、Google之后,與xAI打平,進(jìn)擊全球前三大模型企業(yè),以優(yōu)異模型性能穩(wěn)居世界第一梯隊(duì)大模型公司之列。
一、模型性能卓越
(一)綜合性能出眾
在LMSYS的多個(gè)分榜中,Yi – Lightning表現(xiàn)優(yōu)異。在中文分榜上,超越了xAI發(fā)布的Grok – 2 – 08 – 13、智譜發(fā)布的GLM – 4 – Plus等國內(nèi)外優(yōu)質(zhì)模型,與o1 – mini等模型并列排名世界第二;在多輪對話分榜上,超越了Google所發(fā)布的Gemini – 1.5 – Pro、Anthropic發(fā)布的Claude 3.5 Sonnet等知名旗艦?zāi)P停琶谌?;在?shù)學(xué)、代碼分榜上,分別取得第三、第四名;在以專業(yè)性與高難度著稱的艱難提問、長提問榜單上,均取得世界第四的優(yōu)異成績。
(二)推理速度大幅提升
與上半年發(fā)布的Yi – Large相比,Yi – Lightning的推理速度有極大提升。內(nèi)部評測數(shù)據(jù)顯示,在8xH100算力基礎(chǔ)下,以同樣的任務(wù)規(guī)模進(jìn)行測試,首包時(shí)間僅為Yi – Large的一半,最高生成速度提升了近四成。外部與GPT – 4o對比,其生成速度堪稱“極速”。這得益于其采用的Mixture of Experts(MoE)混合專家模型架構(gòu)以及在訓(xùn)練過程中的多項(xiàng)創(chuàng)新嘗試。
1、獨(dú)特的混合注意力機(jī)制(Hybrid Attention):在部分層次中將傳統(tǒng)的全注意力(Full Attention)替換為滑動(dòng)窗口注意力(Sliding Window Attention),并引入跨層注意力(Cross – Layer Attention, CLA)的設(shè)計(jì)。這種方式平衡了模型在處理長序列數(shù)據(jù)時(shí)的性能和計(jì)算資源消耗,使得模型在面對長序列數(shù)據(jù)時(shí)的表現(xiàn)保持在較高水平,同時(shí)顯著降低了KV緩存的大小,實(shí)現(xiàn)了2倍至4倍的減少;某些層次的計(jì)算復(fù)雜度也由序列長度的平方級降低到線性級,進(jìn)一步提高了模型的計(jì)算效率。
2、動(dòng)態(tài)Top – P路由:可以根據(jù)任務(wù)的難度動(dòng)態(tài)自動(dòng)選擇最合適的專家網(wǎng)絡(luò)組合,無需人工干預(yù)。與傳統(tǒng)的Top – K路由機(jī)制相比,能更靈活地根據(jù)任務(wù)的難度調(diào)整激活的專家網(wǎng)絡(luò)數(shù)量,從而更好地平衡推理成本和模型性能。
3、多階段訓(xùn)練(Multi – stage Training):訓(xùn)練前期注重?cái)?shù)據(jù)的多樣性,后期側(cè)重內(nèi)容更豐富、知識性更強(qiáng)的數(shù)據(jù)。通過這種方式,模型在不同階段吸收不同的知識,便于數(shù)據(jù)配比調(diào)試,同時(shí)在不同階段采用不同的batch size和LR schedule來保證訓(xùn)練速度和穩(wěn)定性。結(jié)合自創(chuàng)的高質(zhì)量數(shù)據(jù)生產(chǎn)管線,不僅保證了訓(xùn)練效率,還讓模型在具備豐富知識的同時(shí),基于復(fù)雜且重要的數(shù)據(jù)做進(jìn)一步的強(qiáng)化。在有較多新增數(shù)據(jù)或?qū)δP瓦M(jìn)行專有化時(shí),可基于此模型進(jìn)行快速、低成本的重新訓(xùn)練。
二、推理成本降低
基于MoE模型架構(gòu)與零一萬物自身的AI Infra優(yōu)勢,Yi – Lightning的推理成本大幅下降。目前已上線的Yi大模型開放平臺(tái)(https://platform.lingyiwanwu.com/)上,每百萬token僅需0.99元,直逼行業(yè)最低價(jià),以極致性價(jià)比助力開發(fā)者與企業(yè)客戶輕松實(shí)現(xiàn)SOTA大模型自由。
三、行業(yè)應(yīng)用廣泛
(一)AI 2.0數(shù)字人解決方案
10月16日,零一萬物首度對媒體公布了全新ToB戰(zhàn)略下的首發(fā)行業(yè)應(yīng)用產(chǎn)品AI 2.0數(shù)字人,聚焦零售和電商等場景,將Yi – Lightning模型實(shí)踐到行業(yè)解決方案中。AI 2.0數(shù)字人包含角色大模型、直播聲音大模型、電商話術(shù)大模型等,具備動(dòng)作訓(xùn)練、表情生成、多國語言和情感表達(dá)、智能對話等能力。Yi – Lightning接入后,數(shù)字人的實(shí)時(shí)互動(dòng)效果更好,話術(shù)更絲滑,回復(fù)也更準(zhǔn)確。在業(yè)務(wù)數(shù)據(jù)方面,某酒旅企業(yè)接入后GMV較此前上升170%。除直播外,還為數(shù)字人客戶準(zhǔn)備了AI 2.0門店短視頻解決方案,可低成本、高品質(zhì)地生成營銷視頻,與直播內(nèi)容相互配合,提升商品轉(zhuǎn)化率。該解決方案涵蓋了AI伴侶、IP形象、電商直播、辦公會(huì)議等多個(gè)應(yīng)用場景,合作案例包括全國某著名餐飲連鎖、某頭部酒旅類客戶、全國某知名水果連鎖店等,均取得了顯著的GMV提升。
(二)全行業(yè)解決方案
零一萬物的全行業(yè)解決方案,除基座模型外還會(huì)搭配RAG、Function Calling等實(shí)用工具。在過去,已基于Yi – Vision與飛書合力打造智能巡檢產(chǎn)品,基于Yi – Large與某頭部醫(yī)療機(jī)構(gòu)合作搭建在線問診平臺(tái),Yi系列模型也接入了包含360 AI助手、沉浸式翻譯在內(nèi)的知名應(yīng)用。截止目前,ToB解決方案已在零售、醫(yī)療、教育、物流等領(lǐng)域內(nèi)完成落地,涉及AI搜索、AI生產(chǎn)力工具、AI智能巡檢等應(yīng)用場景,合作企業(yè)包括世界500強(qiáng)企業(yè)等。Yi – Lightning正式接入后,無論是標(biāo)準(zhǔn)化的全行業(yè)解決方案,還是私有化定制業(yè)務(wù),都迎來了更多可能性。新旗艦?zāi)P蚘i – Lightning采用的MoE混合專家模型架構(gòu)在模型交付方面具有效率優(yōu)勢,可根據(jù)垂直領(lǐng)域的特殊需求快速重新訓(xùn)練專家模型并交付。同時(shí),其訓(xùn)練過程中的創(chuàng)新嘗試也能為客戶提供更高起點(diǎn)的標(biāo)準(zhǔn)化基座模型,更快速、高效、低成本地完成定制模型訓(xùn)練。
結(jié)語
零一萬物此次推出的Yi – Lightning模型,標(biāo)志著中國大模型行業(yè)的重大突破,彰顯了中國所孕育的強(qiáng)大技術(shù)實(shí)力。其“模型+AI基礎(chǔ)設(shè)施+應(yīng)用”的三位一體布局,不僅為自身構(gòu)筑了技術(shù)護(hù)城河,也為中國大模型產(chǎn)業(yè)的發(fā)展提供了有益的探索和借鑒,未來將繼續(xù)推動(dòng)中國大模型成為驅(qū)動(dòng)千行百業(yè)的新質(zhì)生產(chǎn)力。
零一萬物CEO李開復(fù)博士表示,Yi – Lightning的出色表現(xiàn)是“模基共建”戰(zhàn)略正確性的有力例證,也是探索“模應(yīng)一體”的重要基石,在當(dāng)前中國大模型產(chǎn)業(yè)的“耐力賽”階段,零一萬物將堅(jiān)持這一布局,積極在ToB企業(yè)級解決方案上探索TC – PMF,助力中國打造以大模型為引擎的新質(zhì)生產(chǎn)力。