與此前諸多的虛擬數(shù)字人不同,小知是興業(yè)證券攜手火山引擎打造的業(yè)內(nèi)首款以自有員工為原型、集“播報(bào)+服務(wù)”于一體的全真數(shù)字分身。作為智慧主播,數(shù)智服務(wù)官小知將在優(yōu)理寶App、興業(yè)證券App以及興業(yè)其他新媒體平臺(tái)為用戶解讀股市行情、播報(bào)市場資訊。

整體來看,小知不僅從外形上深度還原了興業(yè)證券明星投顧的形象,更重要的是其口唇形、微表情與動(dòng)作也都達(dá)到了較高的仿真度與自然度。作為火山引擎金融虛擬數(shù)字人解決方案的技術(shù)提供方,火山語音通過使用行業(yè)領(lǐng)先的非自回歸模型的唇形生成網(wǎng)絡(luò),合成與輸入文本或語音完全匹配的唇形,準(zhǔn)確率高達(dá)98.55%基于創(chuàng)新的Motion Graph技術(shù),數(shù)字人可以輕松做到毫秒級動(dòng)作切換延遲且自然無感知。

值得一提的是,數(shù)智服務(wù)官小知在火山語音領(lǐng)先的端到端語音合成技術(shù)加持下,還具有開心、驚訝、憤怒等豐富的情感演繹能力,并可通過預(yù)測并控制音色的重音、停頓等,賦予多樣的語氣,實(shí)現(xiàn)笑聲、哭腔等非語言現(xiàn)象建模能力,貼近真人的同時(shí)為用戶提供更有溫度的服務(wù)。

據(jù)了解,小知是興業(yè)證券在數(shù)智化轉(zhuǎn)型的一次重要探索和實(shí)踐。作為一款2D服務(wù)型虛擬數(shù)字人,其定位是集行情資訊播報(bào)、投資者教育和業(yè)務(wù)咨詢辦理服務(wù)于一體的數(shù)智官,未來還將結(jié)合更多業(yè)務(wù)場景為客戶提供豐富的服務(wù)。

在火山語音的“AI虛擬員工解決方案支持下,火山引擎已建立了包括2D、3D卡通和3D超寫實(shí)在內(nèi)的虛擬數(shù)字人產(chǎn)品矩陣;從場景適配出發(fā),包括“播報(bào)型數(shù)字人”和“交互型數(shù)字人”兩種類型。其中播報(bào)型數(shù)字人,即輸入文本或語音,就可生成自然生動(dòng)的數(shù)字人播報(bào)視頻;交互數(shù)字人作為播報(bào)型數(shù)字人的形態(tài)升級,依托于火山語音長期積累的成熟語音交互技術(shù),可以做到“善聽”、“會(huì)說”、“能想”,與用戶面對面實(shí)時(shí)交互。交互數(shù)字人集成了全雙工語音交互鏈路,前向兼容語音以及文本輸入,后向兼容2D與3D數(shù)字人表現(xiàn)力,整體端到端交互延遲在500ms左右,性能效果達(dá)到業(yè)內(nèi)領(lǐng)先水平。

多模態(tài)交互數(shù)字人技術(shù)環(huán)路

目前該方案已經(jīng)具備標(biāo)準(zhǔn)平臺(tái)的快速交付能力,面向金融、大消費(fèi)、泛互等行業(yè)提供涵蓋“金融客服”、“智慧導(dǎo)覽”、“智能助理”、“虛擬直播”等場景細(xì)分解決方案,為用戶帶來全新的互動(dòng)服務(wù)和便捷體驗(yàn)。2022年6月,火山引擎虛擬人數(shù)字平臺(tái)已獲得信通院首批數(shù)字人系統(tǒng)基礎(chǔ)能力認(rèn)證。

伴隨AI技術(shù)的不斷成熟,越來越多金融機(jī)構(gòu)也將虛擬數(shù)字人應(yīng)用到業(yè)務(wù)場景中。對此興業(yè)證券相關(guān)負(fù)責(zé)人表示,未來還將攜手火山引擎進(jìn)一步拓展虛擬數(shù)字人交互、直播等場景,提供多維度、多渠道、更滿意的客戶體驗(yàn)。

分享到

songjy

相關(guān)推薦