借著訊飛輸入法上線10周年的契機(jī),似乎有必要盤點(diǎn)下輸入法在上一個(gè)10年的歷程:站在人工智能時(shí)代的起點(diǎn)上,曾經(jīng)革新了移動(dòng)互聯(lián)網(wǎng)交互方式的輸入法,還將對(duì)世界產(chǎn)生什么樣的影響?

隨著智能手機(jī)的出現(xiàn),改變了原有的產(chǎn)品形態(tài),傳統(tǒng)的物理鍵盤徹底消失,虛擬輸入法逐漸成為一種剛需,如何提升用戶的輸入效率,成了多方力量角逐的賽點(diǎn)。在PC時(shí)代殺出一條血路的搜狗輸入法,隨即開(kāi)始向手機(jī)市場(chǎng)傾斜,原本適用于PC的產(chǎn)品邏輯被復(fù)制到手機(jī)上;汲取了PC市場(chǎng)經(jīng)驗(yàn)的手機(jī)廠商也開(kāi)始行動(dòng),谷歌將自家的輸入法作為系統(tǒng)的默認(rèn)選項(xiàng),主張封閉生態(tài)的蘋果牢牢掌控著輸入法的控制權(quán),直到2014年才開(kāi)放了第三方輸入法的 API。

云圖片

同樣是2010年,科大訊飛的一群工程師們也加入了手機(jī)輸入法的角逐賽,不過(guò)他們并沒(méi)有沿襲功能機(jī)時(shí)代的輸入理念,而是主打語(yǔ)音技術(shù),在既有輸入鍵盤上增加一個(gè)麥克風(fēng)圖標(biāo),用戶點(diǎn)擊后就能語(yǔ)音輸入。時(shí)間同樣驗(yàn)證了訊飛輸入法的前瞻性,到了2012年的時(shí)候,搜狗輸入法和百度輸入法先后推出了語(yǔ)音輸入,2013年訊飛輸入法的激活用戶量正式破億……語(yǔ)音輸入逐漸衍生成為新的流派。

智能手機(jī)時(shí)代的降臨,催生的不只有造機(jī)潮,還有工具產(chǎn)品的爆發(fā):早期的原生操作系統(tǒng)體驗(yàn)并不完善,桌面類、美顏類等工具類產(chǎn)品悄然崛起,第三方輸入法或多或少享受了特殊的紅利周期。作為工具屬性的產(chǎn)品,是不是都只是用過(guò)就“丟”一邊的產(chǎn)品呢?隨著技術(shù)革新,讓工具類產(chǎn)品有了新答案。老羅在2016年錘子手機(jī)M1的發(fā)布會(huì)上用很快的語(yǔ)速說(shuō)了相當(dāng)長(zhǎng)的一段話,訊飛輸入法無(wú)時(shí)差同步輸出了文字版本,結(jié)果幾乎沒(méi)有任何偏差,發(fā)布會(huì)現(xiàn)場(chǎng)隨即一片歡呼。發(fā)布會(huì)結(jié)束的第二天,訊飛輸入法霸占了多家應(yīng)用商店的下載榜單。

云圖片

訊飛輸入法的高光時(shí)刻至今仍時(shí)常被提及,外界忽略的是背后的技術(shù)深耕。訊飛輸入法剛剛上線的2010年,行業(yè)內(nèi)還沒(méi)有中文語(yǔ)音識(shí)別的概念。訊飛輸入法團(tuán)隊(duì)首創(chuàng)了語(yǔ)音輸入的功能,一開(kāi)始的識(shí)別準(zhǔn)確率還只有70%作用,團(tuán)隊(duì)使用大數(shù)據(jù)訓(xùn)練和深度學(xué)習(xí)技術(shù)后,語(yǔ)音識(shí)別的準(zhǔn)確率在2013年達(dá)到了92%,然后在2014年快速跨越到業(yè)內(nèi)領(lǐng)先的95%,在一定程度上超出了人耳。

其實(shí)當(dāng)訊飛輸入法的語(yǔ)音識(shí)別準(zhǔn)確率達(dá)到97%后,用戶規(guī)模已經(jīng)在不到兩年時(shí)間內(nèi)已經(jīng)翻了一番,羅永浩的示范不過(guò)是點(diǎn)燃引線的小火星。相比于那些與用戶需求和行業(yè)生態(tài)脫節(jié)的工具類產(chǎn)品,訊飛輸入法為工具類產(chǎn)品正名的策略并不復(fù)雜,即通過(guò)技術(shù)的持續(xù)創(chuàng)新將工具類產(chǎn)品服務(wù)化,向用戶提供的不是工具,而是一種服務(wù)。工具的弱點(diǎn)是用戶粘性低、可替代性強(qiáng),但訊飛輸入法用技術(shù)創(chuàng)新和產(chǎn)品服務(wù)巧妙地讓短板變成了長(zhǎng)板。

“直面用戶需求就能得到用戶的歡心?!庇嶏w輸入法選擇需求排名最高的粵語(yǔ)、四川話和河南話入手,2012年的一次版本更新后上線了粵語(yǔ)語(yǔ)音輸入,成為首款支持粵語(yǔ)語(yǔ)音輸入的輸入法,緊接著上線了四川話和河南話的語(yǔ)音輸入。截止到目前,訊飛輸入法的粵語(yǔ)語(yǔ)音識(shí)別準(zhǔn)確率已經(jīng)超過(guò)95%,陸續(xù)上線了23種方言的語(yǔ)音識(shí)別。

云圖片

因?qū)τ脩糨斎肓?xí)慣的洞察,訊飛輸入法在2013年上線了英文語(yǔ)音輸入;2015年訊飛輸入法在語(yǔ)音輸入的基礎(chǔ)上首創(chuàng)了語(yǔ)音翻譯功能 “隨聲譯”,目前已經(jīng)支持英日韓俄等多種外語(yǔ)的面對(duì)面翻譯,輸入法開(kāi)始進(jìn)化成為一種人際溝通工具。

除了語(yǔ)音識(shí)別技術(shù)上的縱向深挖,訊飛輸入法還積極在輸入場(chǎng)景上進(jìn)行橫向延伸,比如在傳統(tǒng)的手寫、鍵盤輸入外,加入了OCR掃描、智能預(yù)測(cè)等功能。

“輸入法的產(chǎn)品生命周期,其實(shí)才剛剛開(kāi)始。”訊飛輸入法上線的2010年,深度學(xué)習(xí)技術(shù)還方興未艾,人工智能還處于第二次浪潮后的靜默期。然而過(guò)了十個(gè)年頭后,等待語(yǔ)音技術(shù)的卻是全新的局面:阿爾法狗燃起了人工智能的第三波浪潮,深度學(xué)習(xí)等前沿技術(shù)加速了落地應(yīng)用的進(jìn)程,語(yǔ)音也從小眾一躍成為主流的人機(jī)交互方式之一。

至少透過(guò)訊飛輸入法等行業(yè)領(lǐng)跑者的動(dòng)作,外界看到的并非是時(shí)間賦予的老邁,而是一無(wú)既往的探索和創(chuàng)新精神。

就在訊飛輸入法10周年發(fā)布會(huì)上,知名相聲演員方清平上演了一場(chǎng)極限語(yǔ)速挑戰(zhàn)賽,用遠(yuǎn)超羅永浩當(dāng)年的語(yǔ)速讀了一段《木蘭辭》,以測(cè)試訊飛輸入法在極限快語(yǔ)速下的識(shí)別效果。結(jié)果讓人驚喜,方清平的語(yǔ)速快過(guò)了吉尼斯世界紀(jì)錄,訊飛輸入法照舊給出了100%的識(shí)別準(zhǔn)確率。

云圖片

與四年前的有所不同的是,同樣是技術(shù)上的秀肌肉,對(duì)于“快”的詮釋有了新的注解。如果說(shuō)訊飛輸入法當(dāng)年的一夜爆紅,某種程度上與大眾對(duì)語(yǔ)音輸入帶來(lái)的新鮮感有關(guān),這一次除了速度,還有溫度。

比如訊飛輸入法新近推出的10.0版本,通過(guò)唇形輔助輸入,進(jìn)一步優(yōu)化輸入效率,在近距離多人說(shuō)話的復(fù)雜場(chǎng)景中,其他人的聲音不會(huì)干擾語(yǔ)音識(shí)別結(jié)果;再比如針對(duì)盲人群體輸入不便的情況,不斷無(wú)障礙模式,實(shí)現(xiàn)了輸入面板、菜單面板以及表情面板的屏幕隨選朗讀,用戶在視力不便的情況下也能無(wú)障礙輸入文字和表情。

這些年人工智能(A.I.)技術(shù)發(fā)展非???,將人們對(duì)于智能生活的想象呈現(xiàn)在眼前。我們常用的訊飛輸入法,通過(guò)A.I.賦能將語(yǔ)音輸入效率一次又一次提升,甚至突破想象。

分享到

songjy

相關(guān)推薦