相比去年云棲大會(huì)發(fā)布的版本,“聽悟”今年在技術(shù)和產(chǎn)品功能上進(jìn)行了全方位升級(jí),新增三大核心AI能力:中英文自由說,采用內(nèi)嵌多語種專家模塊的“混合專家系統(tǒng)”,無需手動(dòng)切換語種即可準(zhǔn)確識(shí)別中英大篇幅混說的場(chǎng)景;會(huì)議實(shí)時(shí)翻譯,邊說邊翻譯,無需等待,讓跨國溝通更加高效順暢;QA問答對(duì)抽取,結(jié)合說話人特征、多階段訓(xùn)練技術(shù),自動(dòng)提取問題,讓訪談?wù)砀p松。
同時(shí),針對(duì)會(huì)議行業(yè)伙伴及企業(yè)用戶的多樣化需求,“聽悟”發(fā)布了PaaS產(chǎn)品形態(tài),以簡單易調(diào)用的接口方式開放核心能力,并提供多種前沿創(chuàng)新算法,從而滿足企業(yè)在音視頻會(huì)議、培訓(xùn)直播、招聘面試、智能客服等多種細(xì)分場(chǎng)景的不同需求。
阿里巴巴達(dá)摩院語音實(shí)驗(yàn)室負(fù)責(zé)人鄢志杰表示,“過去十年‘人-機(jī)’交流是語音AI解鎖的核心場(chǎng)景,更復(fù)雜的‘人-人’交流是下一個(gè)高地,未來聽悟?qū)⒃凇?人’交流場(chǎng)景繼續(xù)深入探索,提供安全、保真、精準(zhǔn)的AI識(shí)別、分析與理解能力,并基于內(nèi)容為企業(yè)提供多種智能辦公服務(wù),讓AI真正為人所用,替人分擔(dān),協(xié)助處理重復(fù)繁瑣的工作事務(wù)?!?/p>