99精品国产乱码久久久人妻,亚洲成年影院

10月16日，零一萬物繼千億參數(shù)模型Yi-Large之后，正式對(duì)外發(fā)布新旗艦?zāi)Ｐ蚘i-Lightning。這款模型在國際權(quán)威盲測(cè)榜單LMSYS上取得了優(yōu)異成績，超越了硅谷知名OpenAI GPT – 4o – 2024 – 05 – 13、Anthropic Claude 3.5 Sonnet，排名世界第六，中國第一。這是中國大模型在LMSYS這一全球大模型必爭的公開擂臺(tái)上，首度實(shí)現(xiàn)“超越OpenAI GPT – 4o”的最佳成績，在一眾國內(nèi)模型中拔得頭籌，成為含金量最高的“中國大模型第一”。零一萬物也憑借此模型緊隨OpenAI、Google之后，與xAI打平，進(jìn)擊全球前三大模型企業(yè)，以優(yōu)異模型性能穩(wěn)居世界第一梯隊(duì)大模型公司之列。

一、模型性能卓越

（一）綜合性能出眾

在LMSYS的多個(gè)分榜中，Yi – Lightning表現(xiàn)優(yōu)異。在中文分榜上，超越了xAI發(fā)布的Grok – 2 – 08 – 13、智譜發(fā)布的GLM – 4 – Plus等國內(nèi)外優(yōu)質(zhì)模型，與o1 – mini等模型并列排名世界第二；在多輪對(duì)話分榜上，超越了Google所發(fā)布的Gemini – 1.5 – Pro、Anthropic發(fā)布的Claude 3.5 Sonnet等知名旗艦?zāi)Ｐ?，排名第三；在?shù)學(xué)、代碼分榜上，分別取得第三、第四名；在以專業(yè)性與高難度著稱的艱難提問、長提問榜單上，均取得世界第四的優(yōu)異成績。

（二）推理速度大幅提升

與上半年發(fā)布的Yi – Large相比，Yi – Lightning的推理速度有極大提升。內(nèi)部評(píng)測(cè)數(shù)據(jù)顯示，在8xH100算力基礎(chǔ)下，以同樣的任務(wù)規(guī)模進(jìn)行測(cè)試，首包時(shí)間僅為Yi – Large的一半，最高生成速度提升了近四成。外部與GPT – 4o對(duì)比，其生成速度堪稱“極速”。這得益于其采用的Mixture of Experts（MoE）混合專家模型架構(gòu)以及在訓(xùn)練過程中的多項(xiàng)創(chuàng)新嘗試。

1、獨(dú)特的混合注意力機(jī)制（Hybrid Attention）：在部分層次中將傳統(tǒng)的全注意力（Full Attention）替換為滑動(dòng)窗口注意力（Sliding Window Attention），并引入跨層注意力（Cross – Layer Attention, CLA）的設(shè)計(jì)。這種方式平衡了模型在處理長序列數(shù)據(jù)時(shí)的性能和計(jì)算資源消耗，使得模型在面對(duì)長序列數(shù)據(jù)時(shí)的表現(xiàn)保持在較高水平，同時(shí)顯著降低了KV緩存的大小，實(shí)現(xiàn)了2倍至4倍的減少；某些層次的計(jì)算復(fù)雜度也由序列長度的平方級(jí)降低到線性級(jí)，進(jìn)一步提高了模型的計(jì)算效率。

2、動(dòng)態(tài)Top – P路由：可以根據(jù)任務(wù)的難度動(dòng)態(tài)自動(dòng)選擇最合適的專家網(wǎng)絡(luò)組合，無需人工干預(yù)。與傳統(tǒng)的Top – K路由機(jī)制相比，能更靈活地根據(jù)任務(wù)的難度調(diào)整激活的專家網(wǎng)絡(luò)數(shù)量，從而更好地平衡推理成本和模型性能。

3、多階段訓(xùn)練（Multi – stage Training）：訓(xùn)練前期注重?cái)?shù)據(jù)的多樣性，后期側(cè)重內(nèi)容更豐富、知識(shí)性更強(qiáng)的數(shù)據(jù)。通過這種方式，模型在不同階段吸收不同的知識(shí)，便于數(shù)據(jù)配比調(diào)試，同時(shí)在不同階段采用不同的batch size和LR schedule來保證訓(xùn)練速度和穩(wěn)定性。結(jié)合自創(chuàng)的高質(zhì)量數(shù)據(jù)生產(chǎn)管線，不僅保證了訓(xùn)練效率，還讓模型在具備豐富知識(shí)的同時(shí)，基于復(fù)雜且重要的數(shù)據(jù)做進(jìn)一步的強(qiáng)化。在有較多新增數(shù)據(jù)或?qū)δＰ瓦M(jìn)行專有化時(shí)，可基于此模型進(jìn)行快速、低成本的重新訓(xùn)練。

二、推理成本降低

基于MoE模型架構(gòu)與零一萬物自身的AI Infra優(yōu)勢(shì)，Yi – Lightning的推理成本大幅下降。目前已上線的Yi大模型開放平臺(tái)（https://platform.lingyiwanwu.com/）上，每百萬token僅需0.99元，直逼行業(yè)最低價(jià)，以極致性價(jià)比助力開發(fā)者與企業(yè)客戶輕松實(shí)現(xiàn)SOTA大模型自由。

三、行業(yè)應(yīng)用廣泛

（一）AI 2.0數(shù)字人解決方案

10月16日，零一萬物首度對(duì)媒體公布了全新ToB戰(zhàn)略下的首發(fā)行業(yè)應(yīng)用產(chǎn)品AI 2.0數(shù)字人，聚焦零售和電商等場(chǎng)景，將Yi – Lightning模型實(shí)踐到行業(yè)解決方案中。AI 2.0數(shù)字人包含角色大模型、直播聲音大模型、電商話術(shù)大模型等，具備動(dòng)作訓(xùn)練、表情生成、多國語言和情感表達(dá)、智能對(duì)話等能力。Yi – Lightning接入后，數(shù)字人的實(shí)時(shí)互動(dòng)效果更好，話術(shù)更絲滑，回復(fù)也更準(zhǔn)確。在業(yè)務(wù)數(shù)據(jù)方面，某酒旅企業(yè)接入后GMV較此前上升170%。除直播外，還為數(shù)字人客戶準(zhǔn)備了AI 2.0門店短視頻解決方案，可低成本、高品質(zhì)地生成營銷視頻，與直播內(nèi)容相互配合，提升商品轉(zhuǎn)化率。該解決方案涵蓋了AI伴侶、IP形象、電商直播、辦公會(huì)議等多個(gè)應(yīng)用場(chǎng)景，合作案例包括全國某著名餐飲連鎖、某頭部酒旅類客戶、全國某知名水果連鎖店等，均取得了顯著的GMV提升。

（二）全行業(yè)解決方案

零一萬物的全行業(yè)解決方案，除基座模型外還會(huì)搭配RAG、Function Calling等實(shí)用工具。在過去，已基于Yi – Vision與飛書合力打造智能巡檢產(chǎn)品，基于Yi – Large與某頭部醫(yī)療機(jī)構(gòu)合作搭建在線問診平臺(tái)，Yi系列模型也接入了包含360 AI助手、沉浸式翻譯在內(nèi)的知名應(yīng)用。截止目前，ToB解決方案已在零售、醫(yī)療、教育、物流等領(lǐng)域內(nèi)完成落地，涉及AI搜索、AI生產(chǎn)力工具、AI智能巡檢等應(yīng)用場(chǎng)景，合作企業(yè)包括世界500強(qiáng)企業(yè)等。Yi – Lightning正式接入后，無論是標(biāo)準(zhǔn)化的全行業(yè)解決方案，還是私有化定制業(yè)務(wù)，都迎來了更多可能性。新旗艦?zāi)Ｐ蚘i – Lightning采用的MoE混合專家模型架構(gòu)在模型交付方面具有效率優(yōu)勢(shì)，可根據(jù)垂直領(lǐng)域的特殊需求快速重新訓(xùn)練專家模型并交付。同時(shí)，其訓(xùn)練過程中的創(chuàng)新嘗試也能為客戶提供更高起點(diǎn)的標(biāo)準(zhǔn)化基座模型，更快速、高效、低成本地完成定制模型訓(xùn)練。

結(jié)語

零一萬物此次推出的Yi – Lightning模型，標(biāo)志著中國大模型行業(yè)的重大突破，彰顯了中國所孕育的強(qiáng)大技術(shù)實(shí)力。其“模型＋AI基礎(chǔ)設(shè)施＋應(yīng)用”的三位一體布局，不僅為自身構(gòu)筑了技術(shù)護(hù)城河，也為中國大模型產(chǎn)業(yè)的發(fā)展提供了有益的探索和借鑒，未來將繼續(xù)推動(dòng)中國大模型成為驅(qū)動(dòng)千行百業(yè)的新質(zhì)生產(chǎn)力。

零一萬物CEO李開復(fù)博士表示，Yi – Lightning的出色表現(xiàn)是“?；步ā睉?zhàn)略正確性的有力例證，也是探索“模應(yīng)一體”的重要基石，在當(dāng)前中國大模型產(chǎn)業(yè)的“耐力賽”階段，零一萬物將堅(jiān)持這一布局，積極在ToB企業(yè)級(jí)解決方案上探索TC – PMF，助力中國打造以大模型為引擎的新質(zhì)生產(chǎn)力。

分享到

lixiangjing

算力豹主編

lixiangjing

相關(guān)推薦

近期文章

熱門標(biāo)簽