作為一年一度的人工智能盛會,本屆開發(fā)者節(jié)以“萬物智聯(lián) 生生不息——解放生產(chǎn)力,釋放想象力”為主題。
這次的盛會上,科大訊飛曬出了全科成績單,場景覆蓋了汽車、醫(yī)療、教育等,甚至在許多“科目”中得到了第一名。
訊飛星火4.0 Turbo七大能力全面超GPT-4 Turbo
從追趕到引領 國產(chǎn)大模型逆風發(fā)力
從2022年ChatGPT爆火,到今年諾貝爾物理學獎授予AI先驅(qū),通用人工智能迎來黃金期。具體到技術層面,Sora、GPT4-o的發(fā)布驗證了大模型在多模的成功應用;OpenAI o1系列模型進一步提升復雜任務和專業(yè)領域天花板。
通用人工智能的潛能不斷被印證,也不斷被刷新。但與此同時,目前通用大模型從“可用”到“好用”仍面臨三個主要挑戰(zhàn):
首先是大模型的可信可解釋問題,其次是端到端等新框架推廣性問題,最后是大模型個性化“最后一公里”問題。
通過利用高質(zhì)量數(shù)據(jù)以及反向?qū)R技術,訊飛星火此次帶來全新的底層技術突破,優(yōu)化這些問題的同時,不斷提升大模型應用落地效果。
據(jù)劉慶峰介紹,訊飛星火4.0 Turbo全新升級,七大能力全面超過GPT-4 Turbo,數(shù)學能力、代碼能力超過GPT-4o(Open AI最新一代GPT模型)。此外,星火4.0 Turbo效率相對提升50%。
在數(shù)學能力上,訊飛星火已完成超長思維鏈、樹搜索和自我反思評價等算法驗證,預計今年底可實現(xiàn)類o1的高難度數(shù)學能力顯著提升。
與GPT 4o、Claude 3.5 Sonnet、Genmini1.5 pro等國際同行對比,星火4.0 Turbo在國內(nèi)外中英文14項主流測試集上,實現(xiàn)了9項9項第一。
星火超擬人數(shù)字人,表情動作媲美真人
在1024現(xiàn)場,超擬人數(shù)字人能力正式發(fā)布!
科大訊飛首發(fā)的多模態(tài)視覺交互和超擬人虛擬人交互,可謂是現(xiàn)場最震撼的底座升級看點之一。
要知道,這種語音、視覺、虛擬人交互的「三合一」,屬于業(yè)內(nèi)首發(fā)。在多模態(tài)技術路線中,科大訊飛儼然已處于業(yè)內(nèi)領先地位。
據(jù)了解,星火超擬人數(shù)字人在業(yè)界率先實現(xiàn)語義貫穿的“口唇-表情-動作”的超擬人數(shù)字人生成??拼笥嶏w副總裁、研究院院長劉聰現(xiàn)場進行了真機演示,超擬人數(shù)字人可以展現(xiàn)出目瞪口呆、賣萌的表情,實時與用戶實現(xiàn)交流。
星火超擬人數(shù)字人還可識別、分辨面霜、酒、模型、植物等物品,不僅能介紹產(chǎn)品、還能為用戶進行推薦,實現(xiàn)哪里不會拍哪里。劉聰演示過程中,在桌子上擺了孫悟空、奧特曼、怪獸的玩偶,超擬人數(shù)字人直接根據(jù)玩偶的站位變化,講述了一個生動的故事。
據(jù)悉,星火超擬人數(shù)字人還支持個性創(chuàng)建,僅需一張照片即可打造自己的數(shù)字分身,用戶可自定義數(shù)字人的性格、介紹、聲音等個性化設定。
科大訊飛表示,一句語音即可實現(xiàn)聲音復刻,支持多種身份、性格、場景的人設打造,人設類型已超1300多種。目前,超擬人數(shù)字人能力已正式開通內(nèi)測,所有開發(fā)者和行業(yè)人士可申請使用。
聯(lián)合華為共研小藝,解決語障問題
科大訊飛和華為聯(lián)合研發(fā)了小藝聲音修復,能讓特殊人群的發(fā)音更加清晰,實現(xiàn)正常交流。
硬件方面,科大訊飛基于翻譯技術打造的多語種AI翻譯透明屏,能幫助用戶通過這塊透明顯示屏實現(xiàn)無障礙交流。
大模型賦能民生剛需:發(fā)布教育、醫(yī)療、司法、政務等領域AI助手
在教育行業(yè),首次發(fā)布基于“問題鏈”的高中數(shù)學智能教師系統(tǒng)。
劉慶峰介紹,搭載了高中數(shù)學智能教師系統(tǒng)的星火智慧黑板2.0將于10月25日在第84屆教育裝備展上正式發(fā)布,從AI均衡視聽更公平、AI教學工具更高效、AI教師助手更智慧、全國產(chǎn)化算力更安全四個方面,推動黑板從板書工具躍遷為教學AI助手。
此外,訊飛AI學習機中首發(fā)AI作業(yè)過濾器。學習機通過OCR能力對紙質(zhì)練習題進行識別,根據(jù)學生歷史學習情況和本地化考情,將題目分出“必做題”“選做題”“建議不做題”三個等級,為學生做習題時提供“優(yōu)先級”選項,以實現(xiàn)“練得更少、學得更好”的目標。
訊飛星火醫(yī)療大模型2.0實現(xiàn)了六大核心場景能力升級,包括醫(yī)療海量知識問答、醫(yī)療復雜語言理解、醫(yī)療診斷治療推薦、醫(yī)療專業(yè)文書生成、醫(yī)療多輪交互、醫(yī)療多模態(tài)交互。
在細分的醫(yī)學影像方面,目前圍繞醫(yī)學影像的診斷治療,存在影像科醫(yī)生數(shù)量相對不足、拍片質(zhì)量參差不齊、重復影像檢查發(fā)生率達到41.82%的問題。
基于訊飛星火醫(yī)學影像大模型打造的智能醫(yī)學影像助手也正式發(fā)布。在智能質(zhì)控環(huán)節(jié),智能醫(yī)學影像助手可幫助影像技師快速評估圖像質(zhì)量,及時糾正檢查問題;在智能診斷環(huán)節(jié),可以幫助影像醫(yī)師快速生成診斷報告,解釋溯源并多期對比;在智能讀片環(huán)節(jié),可接入醫(yī)學影像大模型,通過相關問答,幫助臨床醫(yī)師制定診療方案。
會上,訊飛醫(yī)療還聯(lián)合安徽省衛(wèi)生健康委員會、認知智能全國重點實驗室,共同發(fā)布了全譜系全模態(tài)醫(yī)學影像大模型開放合作計劃,旨在匯聚全球最頂尖的影像AI科研團隊,共同推進醫(yī)學影像大模型的發(fā)展。
在司法場景,法律大模型賦能庭審筆錄制作、裁判文書編寫、法條類案檢索等司法場景,和星火通用大模型相比,效率提升從61.7%升到87.9%。
在政務服務場景,政務大模型持續(xù)迭代,全面覆蓋4500多種標準化事項和60多種材料,老百姓和政務大模型“聊天”就能實現(xiàn)邊聊邊確認辦事意圖,審核時間縮短80%,登記效率提升5倍。此外,發(fā)布會上首發(fā)了搭載政務大模型的“星火智辦一體機”,方便群眾從“問著辦”到“領著辦”。
結(jié)語
科大訊飛自成立之初便致力于人工智能領域的研究與發(fā)展,通過不斷的技術創(chuàng)新和市場拓展,已經(jīng)成長為全球領先的智能語音和人工智能公眾公司,其影響力遍及教育、醫(yī)療、金融等多個行業(yè)。未來,隨著人工智能技術的不斷發(fā)展和應用,不僅是科大訊飛,將會有更多大模型廠商為全球用戶帶來更多創(chuàng)新和價值。(文/宋雨涵)