據(jù)筆者了解,科大訊飛很早之前就已經(jīng)將噪音抗變換性工作做到了A,I.語音引擎之內(nèi)。具體來說,在進(jìn)行語音識(shí)別時(shí),訊飛輸入法會(huì)將待識(shí)別的語音處理成與模型訓(xùn)練時(shí)相一致的語音特征:實(shí)時(shí)語音錄音先通過環(huán)境嗅探區(qū)分出噪音環(huán)境的分類(車內(nèi)外噪音、會(huì)場音響噪音、地鐵噪音等等)。
具體來說,分領(lǐng)域噪音補(bǔ)償可基于環(huán)境嗅探的知識(shí)分辨出各種不同領(lǐng)域,自動(dòng)采用不同的算法去除帶噪語音中的噪音,從而達(dá)到提高信噪比的效果;而混合訓(xùn)練技術(shù)則可以彌補(bǔ)去噪后語音所產(chǎn)生的同真實(shí)安靜語音的語譜差異。以此實(shí)現(xiàn)噪音環(huán)境的識(shí)別性能大幅提升,綜合形成抗噪解決方案。
筆者測試,在默認(rèn)中文“普通話(隨心說)”識(shí)別模式下,訊飛輸入法能夠在噪聲環(huán)境保持高精準(zhǔn)的識(shí)別效果。
可是話說回來,生活中總有一些地方比如安靜的辦公場所,會(huì)議室或人多的地鐵、電影院等公共場合,這時(shí)候大聲說話來語音輸入會(huì)顯得十分尷尬,那么有沒有化解之法?
新版本的訊飛語音輸入法(Android和iOS)提升耳語輸入的識(shí)別效果。顧名思義,耳語輸入就是像用“耳語”般使用低分貝音量進(jìn)行語音輸入,即便聲音很小也不會(huì)影響手機(jī)的識(shí)別準(zhǔn)確率。有了這項(xiàng)功能,就能能決用戶在很多場合下使用語音輸入不便的痛點(diǎn),無論安靜的辦公場所、會(huì)議室還是人多的地鐵、電影院等公共場合都能繼續(xù)語音輸入。
特別值得一提的是,訊飛輸入法的語音輸入已經(jīng)自適應(yīng)大聲和耳語。在默認(rèn)中文“普通話(隨心說)”識(shí)別模式下,點(diǎn)擊麥克風(fēng)對(duì)著手機(jī)耳語說話,文字立即呈現(xiàn)在屏幕上,如此也不會(huì)打擾到周圍人,還能繼續(xù)暢快地使用語音輸入。如果你常常因大聲說話而尷尬,不妨來試一試訊飛輸入法的耳語輸入。
作為一家技術(shù)驅(qū)動(dòng)型的企業(yè),近十年訊飛輸入法一直致力于語言和語音的研究,目前在語音識(shí)別、語義理解、機(jī)器翻譯等方面均取得了行業(yè)領(lǐng)先的成果并實(shí)現(xiàn)產(chǎn)品落地,此次升級(jí)A.I.語音輸入引擎,不僅會(huì)推動(dòng)整個(gè)行業(yè)的技術(shù)革新,也意味著科大訊飛在A.I.應(yīng)用領(lǐng)域的實(shí)力達(dá)到更高的發(fā)展水平。