2020 AI先行者大會(huì)
“盡管語(yǔ)音識(shí)別技術(shù)有了極大的發(fā)展,但當(dāng)前,它還沒(méi)有達(dá)到一套技術(shù)能夠打遍天下的狀態(tài),在很多真實(shí)應(yīng)用場(chǎng)景中,仍然有‘最后一公里’的問(wèn)題需要去解決?!毖ι亠w在分享演講中表示,語(yǔ)音識(shí)別在多數(shù)應(yīng)用中還是一個(gè)強(qiáng)場(chǎng)景化的技術(shù)。比如說(shuō)話(huà)人的方言、口音和特定場(chǎng)景的噪聲,很可能會(huì)造成通用系統(tǒng)識(shí)別準(zhǔn)確率的急劇下降。
同時(shí),由于識(shí)別內(nèi)容的領(lǐng)域不同,所需要去識(shí)別的話(huà)術(shù)也不一樣。例如,在聊到語(yǔ)音識(shí)別技術(shù)的時(shí)候提到遠(yuǎn)場(chǎng),可能就是遠(yuǎn)場(chǎng)識(shí)別的遠(yuǎn);而在日常生活當(dāng)中說(shuō)到原廠,那可能指的就是手機(jī)原廠設(shè)置。在不同的場(chǎng)景中,專(zhuān)業(yè)術(shù)語(yǔ)是不一樣的。
另外還有不同拾音設(shè)備導(dǎo)致的信道差異,現(xiàn)今我們可見(jiàn)到的手機(jī)拾音信道、電話(huà)通話(huà)信道,是比較普遍的信道。但還有一些特別的拾音設(shè)備,它們的采樣率、音頻失真情況等都具有自己的特點(diǎn),那業(yè)界任何一家公司的通用識(shí)別效果,都會(huì)因此出現(xiàn)明顯的下降。而這,也是行業(yè)當(dāng)前普遍面臨的痛點(diǎn)。
思必馳高級(jí)技術(shù)總監(jiān)、語(yǔ)音應(yīng)用技術(shù)負(fù)責(zé)人薛少飛
“只有解決這些問(wèn)題,AI技術(shù)才能夠真正的落地到業(yè)務(wù)場(chǎng)景?!毖ι亠w說(shuō),基于此,思必馳推出了識(shí)別自訓(xùn)練平臺(tái),賦能客戶(hù)自己做識(shí)別系統(tǒng)端到端體驗(yàn)的優(yōu)化。首先,它可以完全私有化部署在客戶(hù)場(chǎng)景當(dāng)中,具有很強(qiáng)隱私性,解決了敏感數(shù)據(jù)的安全合規(guī)問(wèn)題;其次,它的功能強(qiáng)大,支持?jǐn)?shù)據(jù)標(biāo)注、聲學(xué)模型自定制、以及包括段落文本、熱詞、敏感詞在內(nèi)的各級(jí)語(yǔ)言模型自定制;此外,它是一體化的方案,能夠賦能客戶(hù)完成分鐘級(jí)、一鍵式的自訓(xùn)練。
當(dāng)前,識(shí)別自訓(xùn)練平臺(tái)處于2.0版本,在即將發(fā)布的3.0版本中,還將發(fā)布端點(diǎn)檢測(cè)自訓(xùn)練、標(biāo)點(diǎn)斷句自訓(xùn)練等新功能,并支持增量學(xué)習(xí)方案等新特性。
通過(guò)思必馳識(shí)別自訓(xùn)練平臺(tái),客戶(hù)能夠運(yùn)用自有的行業(yè)數(shù)據(jù),持續(xù)提升在自己行業(yè)領(lǐng)域的競(jìng)爭(zhēng)力;思必馳作為紐帶和能力輸出方,并不去做客戶(hù)行業(yè)的應(yīng)用,客戶(hù)可以沒(méi)有任何后顧之憂(yōu)的使用,實(shí)現(xiàn)產(chǎn)品持續(xù)迭代。
在首屆智能家電語(yǔ)音識(shí)別與交互技術(shù)高峰論壇上,薛少飛重點(diǎn)分享了關(guān)于技術(shù)趨勢(shì)的思考。
首屆智能家電語(yǔ)音識(shí)別與交互技術(shù)高峰論壇
薛少飛認(rèn)為,在家電廠商這端,自訓(xùn)練將賦能家電廠商產(chǎn)品級(jí)定制能力,使原有的冗長(zhǎng)的交付鏈路,升級(jí)為產(chǎn)品級(jí)快速自定制。
而在家的場(chǎng)景中,人機(jī)交互體驗(yàn)將實(shí)現(xiàn)從“人與單一設(shè)備交互”到“人與設(shè)備矩陣的交互”的升級(jí)。就近喚醒與自然交互,將為家居場(chǎng)景帶來(lái)更流暢的體驗(yàn);聲音、圖像、視頻、傳感器技術(shù)的深度融合,則能夠讓家居體驗(yàn)更加智慧。結(jié)合VR和AR的虛擬家庭管家,也將出現(xiàn)在我們的家中。