當(dāng)Diss人工智能同傳突然成為輿論主流的時候,我們也應(yīng)該看到AI同傳正在越來越多場景中證明自己。AI翻譯當(dāng)然不可能完全破解語言迷宮這個人類終極命題,但其進(jìn)步和成長速度也是肉眼可見的。把個別企業(yè)偷換概念的營銷事故,甩給一個被廣泛應(yīng)用的底層技術(shù),這鍋AI背的確實有點冤。
剛剛在中國網(wǎng)球公開賽,搜狗同傳就作為首個支持國際賽事的AI同傳,為整個行業(yè)正了一下名譽。
AI不完美,但真·AI同傳還是挺努力的
其實,訊飛造假事件中,核心問題甚至不在于AI同傳的技術(shù)能力——因為它壓根沒用AI同傳。
事實上,該會議僅僅使用了“訊飛聽見”產(chǎn)品,主打的是語音轉(zhuǎn)換文本功能。現(xiàn)場的真實工作流程其實是這樣的:
嘉賓發(fā)言→人工同傳翻譯→“訊飛聽見”識別人類同傳的譯文,并將其轉(zhuǎn)化為文本、合成人聲→人工同傳與訊飛翻譯的譯文被同時投放在大屏幕→機(jī)器合成的語音在直播中實時投放。
這也就不難理解,為什么訊飛可以在直播中輕松實現(xiàn)實時翻譯,甚至連人類語言中的一些小瑕疵也“如法炮制”,比如在緊張卡詞時用來充數(shù)的“就是”,也出現(xiàn)在了直播屏幕上。
原本只是一個將人工同傳的翻譯成果識別成中英文及語音合成的活動,但訊飛似乎并不滿足于只為大會“做一點微小的貢獻(xiàn)”。不僅在現(xiàn)場的翻譯字幕上方,都打上了“訊飛聽見”的logo,而且在活動官方頁面上公開宣傳“機(jī)器智能翻譯和自動語音播報”,讓人覺得現(xiàn)場的中英文翻譯都是訊飛的成果。
盡管事后訊飛辟謠稱“從沒講過AI同傳的概念,始終強調(diào)是人機(jī)耦合”,但這種模糊處理、偷換概念的操作,過分夸大AI的短期能力,將其置于人類的對立面,每一次都會引發(fā)“AI取代同傳”的爭議,才有了這次人類同傳的“同仇敵愾”。
究其根本,還是企業(yè)急功近利的商業(yè)心理,以及某種程度上的產(chǎn)業(yè)不自信導(dǎo)致的。
這是不是就意味著,AI同傳真的涼涼了呢?顯然不是。真正的AI同傳并不是不存在,相反,今天越來越多國際會議和新聞發(fā)布會、體育賽事等等重要場合開始使用AI同傳。
雖然依然有諸多技術(shù)不完美之處,但進(jìn)步顯著。尤其搜狗同傳,最近更是登陸了中國網(wǎng)球公開賽的舞臺,成為首個支持國際體育賽事的AI同傳。
身處風(fēng)口浪尖和聚光燈之下,搜狗同傳能否成功為AI正名呢?
首次支持國際賽事:搜狗同傳支持中網(wǎng)公開賽為AI正名
前不久,搜狗同傳作為中國網(wǎng)球公開賽的官方翻譯合作伙伴,從賽前的媒體發(fā)布會到賽后采訪,對獲勝球員的發(fā)言交流提供實時翻譯,這是AI同傳首次支持大型國際體育賽事。不僅讓整個賽事變得更具科技感和未來感,也讓AI同傳的表現(xiàn)經(jīng)歷了一場數(shù)十萬觀眾的洗禮和認(rèn)可。
賽后采訪中,新科冠軍荷蘭騎手文森特·韋穆倫的發(fā)言,被準(zhǔn)確高效地翻譯為中英雙語,同步出現(xiàn)在現(xiàn)場的屏幕上。
此前搜狗AI同傳大多出現(xiàn)在國內(nèi)外的頂級會議上,隨著與體育賽事等的跨界合作不斷加深,搜狗AI同傳的應(yīng)用場景也越來越多,幫助人類不斷突破原有的交流邊界。
從某種意義上說,搜狗代表了AI同傳的另一種進(jìn)化模式:不做拔苗助長的急先鋒,而是潤物無聲的布道者。
具體到行動上,就是不夸大營銷,也不脫離具體場景談技術(shù)。通過連接越來越多的大眾所關(guān)注的場景,比如賽事、會議、直播等,讓AI同傳的真實能力為大眾所知。
盡管在技術(shù)上,AI同傳仍然不完美,甚至偶爾還需要人類譯員救場,但其應(yīng)用價值和社會意義,也正在千錘百煉中逐漸清晰起來。
同傳的重氣壓系統(tǒng):體系化AI技術(shù)是產(chǎn)業(yè)關(guān)鍵
搜狗快速攻城略地的同時,有些公司甚至不敢拿出AI同傳產(chǎn)品。同為AI同傳,為什么表現(xiàn)差別如此之大?
背后的邏輯差異在于,AI同傳在毫厘間的表現(xiàn)差異,背后隱藏著從機(jī)器翻譯技術(shù)集成、神經(jīng)網(wǎng)絡(luò)系統(tǒng),到NLP等多種技術(shù)能力的集合。
一家公司龐大的AI+語言領(lǐng)域技術(shù)體系,最終會像重氣壓一樣,突入到終端產(chǎn)品表現(xiàn)里。所以AI同傳拼的并不是產(chǎn)品噱頭,而是背后技術(shù)體系的壓力與壓強。
以搜狗為例,正是語音識別、機(jī)器翻譯等領(lǐng)域上的深厚積累,千錘百煉之下造就了能聽會說、能理解會思考的AI同傳。
比如搜狗同傳采用的端對端神經(jīng)網(wǎng)絡(luò)翻譯技術(shù),可以使用循環(huán)神經(jīng)網(wǎng)絡(luò)生成翻譯結(jié)果,并將神經(jīng)網(wǎng)絡(luò)精簡為五層,翻譯的結(jié)果相比傳統(tǒng)機(jī)器翻譯大約能高出30%-40%,效率也大幅提升;
語音斷句算法,能很好地識別詞語和句子的停頓,輸送出更符合人類語言習(xí)慣的翻譯結(jié)果;
類似的技術(shù)創(chuàng)新還有很多,協(xié)同支撐起了搜狗AI同傳穩(wěn)定可靠的臨場表現(xiàn)。
新技術(shù)的真正爆發(fā),只有在龐大的技術(shù)體系和產(chǎn)業(yè)集群下面有才可能。以AI破解語言與溝通難題的大趨勢,是難以阻擋的。對于AI同傳這個新事物,大家的容忍度都很高,所謂的“浮夸營銷”甚至“恐慌營銷”,大可不必。
最起碼,AI同傳并不會因為個別企業(yè)的非技術(shù)事件而停止發(fā)展,更多為AI正名的技術(shù)能力與臨場表現(xiàn)還在路上。