眾所周知,機(jī)器翻譯技術(shù)涉及計(jì)算機(jī)、認(rèn)知科學(xué)、語言學(xué)等學(xué)科,一直被科學(xué)界公認(rèn)為是人工智能領(lǐng)域最難的課題之一。過去的幾十年,受限于技術(shù)方法,計(jì)算力和訓(xùn)練數(shù)據(jù)等原因,一直未能有有效的突破口。近年來,人工智能技術(shù)的不斷發(fā)展,讓自然語言處理和語義分析技術(shù),乃至深層網(wǎng)絡(luò)技術(shù)都取得了長(zhǎng)足的進(jìn)步,而Microsoft Translator則正是基于這些人工智能領(lǐng)域的前沿技術(shù),為用戶提供優(yōu)異的翻譯服務(wù),進(jìn)而彌合人與人之間的溝通障礙。

早期,基于“統(tǒng)計(jì)機(jī)器翻譯”技術(shù),Microsoft Translator就將“翻譯”轉(zhuǎn)變成了一個(gè)機(jī)器學(xué)習(xí)的課題,讓計(jì)算機(jī)不斷地對(duì)訓(xùn)練數(shù)據(jù)中的人工譯文和語言轉(zhuǎn)換結(jié)果進(jìn)行判斷與學(xué)習(xí),在不斷的糾錯(cuò)與改正中,促進(jìn)系統(tǒng)算法的自我完善與優(yōu)化。同時(shí),Microsoft Translator還能通過統(tǒng)計(jì)建模技術(shù)和高效的算法,不斷學(xué)習(xí)優(yōu)化的機(jī)器翻譯系統(tǒng)能學(xué)會(huì)根據(jù)上下文的語境,而不是單詞的意思和生硬的語法規(guī)則來匹配最恰當(dāng)?shù)姆g結(jié)果。

隨著人工智能技術(shù)的不斷發(fā)展,深度神經(jīng)網(wǎng)絡(luò)技術(shù)在過去的幾年已經(jīng)開始使用在許多人工智能領(lǐng)域, 而Microsoft Translator所有的翻譯服務(wù)也已全部使用了最先進(jìn)的深層神經(jīng)網(wǎng)絡(luò)技術(shù)。神經(jīng)機(jī)器翻譯,簡(jiǎn)言之就是對(duì)源語言的句子進(jìn)行編碼,轉(zhuǎn)化為計(jì)算機(jī)可以“讀懂”的形式,然后通過一個(gè)解碼的過程輸出譯文。

此外,Microsoft Translator背后的微軟機(jī)器翻譯系統(tǒng),不僅應(yīng)用了最新的神經(jīng)網(wǎng)絡(luò)技術(shù),還加入了自己獨(dú)有的技術(shù)。首先,它借鑒了人類在翻譯的思維方式,并且應(yīng)用了對(duì)偶學(xué)習(xí)(Dual Learning)。對(duì)偶學(xué)習(xí)能夠保證翻譯的一致性在中翻英、英翻中的過程中做到聯(lián)合優(yōu)化。其次,推敲網(wǎng)絡(luò)(Deliberation Networks),當(dāng)機(jī)器翻譯完成翻譯后,為了讓其做的更好,研究人員使用推敲網(wǎng)絡(luò)讓機(jī)器不斷推敲,不斷修改,把翻譯完的結(jié)果再輸入,再全盤考慮,做到不斷優(yōu)化。第三,一致性規(guī)范(Agreement Regularization)。讓翻譯可以從左到右進(jìn)行,也可以從右到左進(jìn)行,最終讓兩個(gè)過程生成一致的翻譯結(jié)果。

目前,在Microsoft Translator中已有21種語言應(yīng)用了神經(jīng)網(wǎng)絡(luò)翻譯,相比傳統(tǒng)統(tǒng)計(jì)機(jī)器翻譯,神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯在翻譯質(zhì)量上針對(duì)不同語言有著6%至43%不等的提升。借助深層神經(jīng)網(wǎng)絡(luò),以及對(duì)數(shù)千小時(shí)不同語言的音頻數(shù)據(jù)進(jìn)行分析和學(xué)習(xí),Microsoft Translator已經(jīng)可以“聽懂”人類的自然語音,比如,去掉“嗯”、“啊”、“這個(gè)”、“那個(gè)”之類的贅詞以及重復(fù)、口吃等語病,并添加斷句、標(biāo)點(diǎn)符號(hào),從而讓文本更貼近用戶本來的意圖,也更易閱讀和翻譯。

而在文本翻譯基礎(chǔ)上增強(qiáng)的語音翻譯引擎,Microsoft Translator還增加了更多口語文本語料庫,從而為口語會(huì)話類翻譯構(gòu)建了更好的模型。而在文本到語音的轉(zhuǎn)換過程,如果翻譯的目標(biāo)語言是Microsoft Translator目前所支持的 18 種轉(zhuǎn)換語言之一,那么Microsoft Translator就能使用語音合成技術(shù)將翻譯后的文本轉(zhuǎn)換成語音播放出來。整個(gè)語音翻譯過程中,深層神經(jīng)網(wǎng)絡(luò)技術(shù)的引入,極大程度的讓Microsoft Translator更好的獲取和理解上下文及完整句子,降低了翻譯的錯(cuò)誤率,提高了可靠性,從而輸出更高質(zhì)量和更自然的翻譯結(jié)果。

如果說,Microsoft Translator的智能來自于機(jī)器學(xué)習(xí)、深層神經(jīng)網(wǎng)絡(luò)、自然語言語義等技術(shù),那么它的可靠運(yùn)行與不斷優(yōu)化,則離不開微軟在各領(lǐng)域的資源優(yōu)勢(shì)。例如,作為一項(xiàng)云服務(wù),Microsoft Translator運(yùn)行于Microsoft Azure云平臺(tái),Azure提供了機(jī)器學(xué)習(xí)等高級(jí)分析功能的運(yùn)行平臺(tái),同時(shí)也確保了其作為SaaS云服務(wù)的高可用性和數(shù)據(jù)安全性,并且它還可以根據(jù)需要彈性擴(kuò)展運(yùn)算規(guī)模。另一方面,覆蓋全球的必應(yīng)搜索引擎,也為Microsoft Translator提供了全球規(guī)模的語言素材與學(xué)習(xí)資料,讓機(jī)器學(xué)習(xí)系統(tǒng)得以不斷地成長(zhǎng)和完善。而微軟旗下多樣化的產(chǎn)品與服務(wù),也為Microsoft Translator提供了施展才華的廣闊天地。從2006年起,Microsoft Translator便逐漸開始為越來越多的微軟產(chǎn)品提供自動(dòng)文本翻譯功能,例如Office、必應(yīng)搜索、IE和Edge瀏覽器、Skype、微軟小娜(Cortana)等等。

向業(yè)界開放提供多種翻譯服務(wù) 成為用戶的多國語言實(shí)時(shí)翻譯官

早在2014年,Microsoft Translator就推出了語音翻譯服務(wù),2016年3月又面向開發(fā)者開放了語音翻譯的API。目前,Microsoft Translator支持對(duì)包括中文普通話在內(nèi)的9種語言的實(shí)時(shí)語音翻譯。在Skype Translator以及Windows、iOS或者Android版的Microsoft Translator應(yīng)用中,甚至在日常使用的PowerPoint中,用戶都可以體驗(yàn)到這項(xiàng)私人實(shí)時(shí)口譯服務(wù)。

在2018微軟人工智能大會(huì)的現(xiàn)場(chǎng),微軟全球執(zhí)行副總裁、微軟人工智能及微軟研究事業(yè)部負(fù)責(zé)人沈向洋博士接待了一位特殊的來賓——來自南京理工大學(xué)的碩士研究生宋昊旻。宋昊旻在一歲時(shí)失去了聽力,被醫(yī)生判定終生都會(huì)是聾啞人,堅(jiān)強(qiáng)的昊旻在媽媽的支持下,堅(jiān)持訓(xùn)練出發(fā)聲能力,并成功考上了南京理工大學(xué)的本科和碩士研究生。在會(huì)議現(xiàn)場(chǎng),昊旻在微軟語音服務(wù)的幫助下,與沈向洋進(jìn)行了順暢的對(duì)話溝通。根據(jù)昊旻聲音定制的語音識(shí)別模型能夠以極高的準(zhǔn)確度、近乎實(shí)時(shí)地將他略顯吃力的語音轉(zhuǎn)換為更加流暢的普通話,還能同步翻譯成英語或其它語種,真正實(shí)現(xiàn)無障礙溝通。在大會(huì)現(xiàn)場(chǎng),宋昊旻滿含熱淚激動(dòng)地表示:“這些技術(shù)真的改變了我們的生活,讓我們與這個(gè)世界的聯(lián)系更多更廣了,也變得更加自信了!”其實(shí),微軟已經(jīng)讓Microsoft Translator就走進(jìn)了大學(xué)課堂,讓聽障學(xué)生幫助緊跟老師課堂的節(jié)奏、盡快掌握知識(shí)。在美國羅切斯特理工學(xué)院一堂普通的生物課上,除了有站在講臺(tái)上授課的教授,旁邊還有負(fù)責(zé)將教授上課內(nèi)容翻譯為手語的翻譯員,以及在課堂大屏幕上顯示的實(shí)時(shí)字幕。坐在臺(tái)下上課的有不少是有聽力障礙的學(xué)生。羅切斯特理工學(xué)院有大約1500名聽力存在障礙的學(xué)生,而其中的大約700名學(xué)生會(huì)和健聽學(xué)生一起上課,他們通過綜合利用手語翻譯員和實(shí)時(shí)字幕中的信息來掌握課堂知識(shí)。而讓課堂內(nèi)容實(shí)時(shí)以字幕形式呈現(xiàn)的就是來自微軟的Microsoft Translator,該系統(tǒng)利用自動(dòng)語音識(shí)別功能將教授原始用口語講解的內(nèi)容轉(zhuǎn)化為流暢的、含標(biāo)點(diǎn)符號(hào)的文字。

再如,Microsoft Translator的現(xiàn)場(chǎng)翻譯功能(Live Feature),就借助智能手機(jī)、平板電腦和個(gè)人計(jì)算機(jī)等設(shè)備為多人、多語言、面對(duì)面交談提供現(xiàn)場(chǎng)翻譯。其不但支持眾多語言的翻譯功能,而且還可以提供離線翻譯選項(xiàng)。用戶既可以用鍵盤輸入或者粘貼文本,也可以利用麥克風(fēng)直接錄入語音,或者是將看到的外國文字拍攝下來,讓軟件自動(dòng)識(shí)別并翻譯。在最新版本中,Microsoft Translator還加入了支持9種語言的實(shí)時(shí)語音翻譯功能,讓語言不通的兩個(gè)人,僅憑一部手機(jī)就能進(jìn)行面對(duì)面的實(shí)時(shí)語音交流。

在今年的微軟全球開發(fā)者大會(huì)上,微軟還展示了這項(xiàng)人工智能翻譯服務(wù)在會(huì)議室中的應(yīng)用。演示中,智能會(huì)議室搭配了360度全景攝像頭和陣列麥克風(fēng),它們可以幫助會(huì)議組織者確定參加會(huì)議都有什么人,這些智能設(shè)備可以用不同的語言跟參會(huì)者打招呼,也能非常準(zhǔn)確地復(fù)述他們所說的話,實(shí)現(xiàn)不同國家不同語言的無縫交流。微軟多年以來都致力于翻譯服務(wù),也正是這些日積月累的研發(fā),這項(xiàng)功能最終將會(huì)在這套智能會(huì)議室解決方案中扮演重要的角色。

此外,Microsoft Translator移動(dòng)端應(yīng)用絕對(duì)是海外旅行必備的利器,它不但可以幫助海外旅行者問路,還能靠拍照辨認(rèn)街道、商鋪和沒有圖片的菜單,甚至可以讓旅行者和五湖四海的新朋友進(jìn)行一次真正有意義的談話,每個(gè)人只需在各自的智能設(shè)備上打開Microsoft Translator應(yīng)用程序,掃描二維碼并進(jìn)入聊天界面,即可開始交流,真正體會(huì)到四海一家的暢快溝通。

而“海淘”則是Microsoft Translator的另一個(gè)用武之地?;贛icrosoft Translator技術(shù)的必應(yīng)翻譯提供了在線文本翻譯和網(wǎng)站翻譯功能,用戶只需輸入海淘網(wǎng)址,就能實(shí)現(xiàn)整個(gè)網(wǎng)頁的機(jī)器翻譯,這項(xiàng)功能同樣支持50多種語言,讓你的海外購物無障礙。

與此同時(shí),Microsoft Translator針對(duì)PowerPoint的Presentation Translator插件功能還能在幻燈片播放的過程中實(shí)時(shí)地顯示翻譯字幕,其支持包括中文普通話在內(nèi)的10種語言的語音輸入,并可翻譯成60多種語言的文本字幕。不僅如此,在演講中,觀眾們還可以通過Microsoft Translator APP加入會(huì)議,在智能手機(jī)、平板設(shè)備或電腦上看到各自選定的語言字幕。同時(shí),Presentation Translator功能還能將演講者或老師的口語轉(zhuǎn)化為實(shí)時(shí)字幕,并將翻譯的文字結(jié)果保存在手機(jī)中,幫助聽障礙人士理解演講或講課內(nèi)容,更加輕松、高效地學(xué)習(xí)及參與討論。

現(xiàn)在,Microsoft Translator也更多的出現(xiàn)在了我們周圍的產(chǎn)品之中。去年微軟就與華為合作,首先在具有AI芯片的Mate 10手機(jī)上實(shí)現(xiàn)了AI驅(qū)動(dòng)型離線翻譯功能。而這一功能現(xiàn)在擴(kuò)展到所有安卓、iOS和亞馬遜Fire設(shè)備。近日,搭載微軟AI翻譯系統(tǒng)的“AI翻譯機(jī)”也已經(jīng)在國內(nèi)的小米有品首發(fā)上架,不僅內(nèi)置了來自微軟的人工智能翻譯引擎,還整合了微軟語音、自然語言理解和機(jī)器翻譯三大模塊。在翻譯過程中,可以將結(jié)果譯回原文多次比對(duì)并進(jìn)行學(xué)習(xí)優(yōu)化,從而使翻譯結(jié)果更加準(zhǔn)確。而在我們最熟悉的微信中也有Microsoft Translator的身影。我們只需在對(duì)話界面中,長(zhǎng)按對(duì)話氣泡內(nèi)出現(xiàn)的法語、日語或者阿拉伯語等文本,選擇“翻譯”,就會(huì)出現(xiàn)Microsoft Translator給你帶來的中文譯文。

未來,機(jī)器翻譯技術(shù)的發(fā)展雖然面對(duì)著很多不同的挑戰(zhàn),但也會(huì)在前行的道路上解決遷移學(xué)習(xí)、通用領(lǐng)域?qū)W習(xí)、自適應(yīng)等不同的難題,從而實(shí)現(xiàn)貼合用戶的個(gè)性化對(duì)話定制等功能。Microsoft Translator凝聚了微軟研究院20多年自然語言處理領(lǐng)域的研究成果,匯集了機(jī)器學(xué)習(xí)、大數(shù)據(jù)、 語言學(xué)、云計(jì)算等幾種前沿技術(shù)。目前全球已有數(shù)千間企業(yè)在使用微軟自動(dòng)翻譯技術(shù),提高業(yè)務(wù)效率和服務(wù)質(zhì)量。

歡迎于各大應(yīng)用商店搜索“微軟翻譯”或“Microsoft Translator”下載體驗(yàn)支持多人、多語言、跨設(shè)備的現(xiàn)場(chǎng)翻譯功能的Microsoft Translator 服務(wù),即刻開啟交流暢通無阻的全新世界吧!

分享到

xiesc

相關(guān)推薦