據(jù)筆者了解,科大訊飛很早之前就已經(jīng)將噪音抗變換性工作做到了A,I.語(yǔ)音引擎之內(nèi)。具體來(lái)說(shuō),在進(jìn)行語(yǔ)音識(shí)別時(shí),訊飛輸入法會(huì)將待識(shí)別的語(yǔ)音處理成與模型訓(xùn)練時(shí)相一致的語(yǔ)音特征:實(shí)時(shí)語(yǔ)音錄音先通過(guò)環(huán)境嗅探區(qū)分出噪音環(huán)境的分類(lèi)(車(chē)內(nèi)外噪音、會(huì)場(chǎng)音響噪音、地鐵噪音等等)。

云圖片

具體來(lái)說(shuō),分領(lǐng)域噪音補(bǔ)償可基于環(huán)境嗅探的知識(shí)分辨出各種不同領(lǐng)域,自動(dòng)采用不同的算法去除帶噪語(yǔ)音中的噪音,從而達(dá)到提高信噪比的效果;而混合訓(xùn)練技術(shù)則可以彌補(bǔ)去噪后語(yǔ)音所產(chǎn)生的同真實(shí)安靜語(yǔ)音的語(yǔ)譜差異。以此實(shí)現(xiàn)噪音環(huán)境的識(shí)別性能大幅提升,綜合形成抗噪解決方案。

云圖片

筆者測(cè)試,在默認(rèn)中文“普通話(隨心說(shuō))”識(shí)別模式下,訊飛輸入法能夠在噪聲環(huán)境保持高精準(zhǔn)的識(shí)別效果。

可是話說(shuō)回來(lái),生活中總有一些地方比如安靜的辦公場(chǎng)所,會(huì)議室或人多的地鐵、電影院等公共場(chǎng)合,這時(shí)候大聲說(shuō)話來(lái)語(yǔ)音輸入會(huì)顯得十分尷尬,那么有沒(méi)有化解之法?

新版本的訊飛語(yǔ)音輸入法(Android和iOS)提升耳語(yǔ)輸入的識(shí)別效果。顧名思義,耳語(yǔ)輸入就是像用“耳語(yǔ)”般使用低分貝音量進(jìn)行語(yǔ)音輸入,即便聲音很小也不會(huì)影響手機(jī)的識(shí)別準(zhǔn)確率。有了這項(xiàng)功能,就能能決用戶(hù)在很多場(chǎng)合下使用語(yǔ)音輸入不便的痛點(diǎn),無(wú)論安靜的辦公場(chǎng)所、會(huì)議室還是人多的地鐵、電影院等公共場(chǎng)合都能繼續(xù)語(yǔ)音輸入。

云圖片

特別值得一提的是,訊飛輸入法的語(yǔ)音輸入已經(jīng)自適應(yīng)大聲和耳語(yǔ)。在默認(rèn)中文“普通話(隨心說(shuō))”識(shí)別模式下,點(diǎn)擊麥克風(fēng)對(duì)著手機(jī)耳語(yǔ)說(shuō)話,文字立即呈現(xiàn)在屏幕上,如此也不會(huì)打擾到周?chē)?,還能繼續(xù)暢快地使用語(yǔ)音輸入。如果你常常因大聲說(shuō)話而尷尬,不妨來(lái)試一試訊飛輸入法的耳語(yǔ)輸入。

作為一家技術(shù)驅(qū)動(dòng)型的企業(yè),近十年訊飛輸入法一直致力于語(yǔ)言和語(yǔ)音的研究,目前在語(yǔ)音識(shí)別、語(yǔ)義理解、機(jī)器翻譯等方面均取得了行業(yè)領(lǐng)先的成果并實(shí)現(xiàn)產(chǎn)品落地,此次升級(jí)A.I.語(yǔ)音輸入引擎,不僅會(huì)推動(dòng)整個(gè)行業(yè)的技術(shù)革新,也意味著科大訊飛在A.I.應(yīng)用領(lǐng)域的實(shí)力達(dá)到更高的發(fā)展水平。

分享到

songjy

相關(guān)推薦