2022中國(guó)算力大會(huì)是我國(guó)算力領(lǐng)域首個(gè)全國(guó)性會(huì)議,作為大會(huì)發(fā)布的重要獎(jiǎng)項(xiàng),“創(chuàng)新先鋒”優(yōu)秀成果評(píng)選旨在從設(shè)備技術(shù)、軟硬件系統(tǒng)、成果應(yīng)用、能效水平、賦能情況、流程優(yōu)化等多個(gè)方面優(yōu)中選優(yōu),充分發(fā)揮典型標(biāo)桿的示范引領(lǐng)作用。
“紫東太初”是全球首個(gè)三模態(tài)大模型,開(kāi)拓性實(shí)現(xiàn)了圖像、文本、語(yǔ)音三個(gè)模態(tài)數(shù)據(jù)之間的“統(tǒng)一表示”與“相互生成”,理解和生成能力更接近人類(lèi),向通用人工智能邁出了重要一步。紫東太初作為多模態(tài)大模型代表作,正在全力助推AI研發(fā)規(guī)則和產(chǎn)業(yè)應(yīng)用模式變革,加速各行業(yè)智能化轉(zhuǎn)型實(shí)踐。
當(dāng)下,多模態(tài)大模型受產(chǎn)學(xué)研用多方關(guān)注,原因在于人工智能產(chǎn)業(yè)高速發(fā)展帶來(lái)全新研究、應(yīng)用需求。目前,網(wǎng)絡(luò)數(shù)據(jù)90%以上為圖像與視頻,音頻數(shù)據(jù)也保持高增長(zhǎng),但當(dāng)下用于預(yù)訓(xùn)練的模型大多是以文本、圖像為主的單模態(tài)或雙模態(tài),只能涵蓋互聯(lián)網(wǎng)一小部分?jǐn)?shù)據(jù),不僅與人類(lèi)多模態(tài)交互能力差別很大,也無(wú)法充分發(fā)揮數(shù)據(jù)的生產(chǎn)要素作用,限制了下一階段人工智能應(yīng)用創(chuàng)新。
因此,推動(dòng)預(yù)訓(xùn)練模型從單模態(tài)向多模態(tài)方向發(fā)展,打通圖像、文字、語(yǔ)音壁壘,進(jìn)而使AI應(yīng)用更貼合人類(lèi)行為習(xí)慣與現(xiàn)實(shí)需求,成為當(dāng)前人工智能行業(yè)攻堅(jiān)點(diǎn)之一。
中科院自動(dòng)化所以昇騰AI平臺(tái)為基礎(chǔ),基于武漢人工智能計(jì)算中心算力,研發(fā)面向超大規(guī)模的高效分布式訓(xùn)練框架,在圖、文、音三個(gè)基礎(chǔ)模型上加入跨模態(tài)編碼和解碼網(wǎng)絡(luò),基于昇思MindSpore AI框架,打造了全球首個(gè)千億參數(shù)三模態(tài)大模型“紫東.太初”,性能領(lǐng)跑業(yè)界,可以靈活支撐圖、文、音全場(chǎng)景AI應(yīng)用,更加接近人類(lèi)真正的感情和思考,靈活性更高,通用性更強(qiáng)?;谧蠔|太初打造的虛擬人“小初”,具備視頻生成、視頻描述、圖像生成、智能問(wèn)答、語(yǔ)音識(shí)別等多個(gè)功能,甚至能在紡織生產(chǎn)線上通過(guò)聲音就能“聽(tīng)”出紗線斷頭的質(zhì)檢缺陷。
去年底,國(guó)內(nèi)首個(gè)多模態(tài)人工智能產(chǎn)業(yè)聯(lián)盟成立,吸引了新華社技術(shù)局、長(zhǎng)安汽車(chē)、中國(guó)移動(dòng)、千博手語(yǔ)等30余個(gè)成員單位加盟,通過(guò)開(kāi)源的多模態(tài)大模型快速進(jìn)行自身業(yè)務(wù)AI融合創(chuàng)新,基于“紫東太初” 陸續(xù)孵化出新媒體內(nèi)容檢索平臺(tái)、智能座艙、南宋御街?jǐn)?shù)字人、手語(yǔ)教考一體機(jī)等場(chǎng)景化行業(yè)應(yīng)用,充分展現(xiàn)了人工智能大模型的產(chǎn)業(yè)價(jià)值。
從“紫東太初”大模型的研發(fā),到產(chǎn)業(yè)聯(lián)盟的組建,AI研發(fā)規(guī)則和產(chǎn)業(yè)應(yīng)用模式迎來(lái)深刻變革,昇騰AI正在加速推動(dòng)AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化,助力中國(guó)人工智能搶占智能時(shí)代新高地。