阿里巴巴iDST智能語音交互團(tuán)隊(duì)研究員 馮津偉

馮津偉曾就讀國內(nèi)頂級(jí)聲學(xué)研究機(jī)構(gòu)南京大聲學(xué)研究所,師從音頻聲學(xué)泰斗沙家正先生,并與導(dǎo)師一起研制出了全球第一臺(tái)揚(yáng)聲器紙盆共振頻率的自動(dòng)測試系統(tǒng),極大地幫助了國內(nèi)的電聲行業(yè)提高生產(chǎn)效率。馮津偉博士畢業(yè)于在主動(dòng)降噪領(lǐng)域著名的弗吉尼亞理工大學(xué)VAL實(shí)驗(yàn)室。

Polycom是語音和視頻協(xié)作解決方案領(lǐng)域的全球領(lǐng)導(dǎo)者,占全球視頻會(huì)議市場份額第一。馮津偉曾在Polycom工作17年,擁有十余項(xiàng)美國專利,大部分已產(chǎn)品化,是名聲在外的世界級(jí)音頻專家。他曾主持開發(fā)基于麥克風(fēng)陣列的視頻跟蹤系統(tǒng),即在多人視頻會(huì)議時(shí),攝像頭能基于方位和距離,精準(zhǔn)定位發(fā)言人,產(chǎn)品創(chuàng)新性引業(yè)內(nèi)效仿。

阿里巴巴iDST語音團(tuán)隊(duì)負(fù)責(zé)人鄢志杰表示:“馮博士的入職,是物理學(xué)和互聯(lián)網(wǎng)間的‘跨界’。阿里嚴(yán)肅看待智能語音交互技術(shù)全鏈路,逐步組建世界級(jí)專家團(tuán)隊(duì)。從源頭和信號(hào)采集開始,在端上做突破性的智能語音交互體驗(yàn)?!?/p>

此前,iDST語音團(tuán)隊(duì)的技術(shù)成果已通過阿里云人工智能ET等對外輸出,在法庭庭審識(shí)別、智能客服、視頻審核和實(shí)時(shí)字幕轉(zhuǎn)寫、聲紋驗(yàn)證、物聯(lián)網(wǎng)等多個(gè)場景成功應(yīng)用。全國有近300家法院和超過6000家法庭在使用ET,每年有超過1.2億次客服電話由ET協(xié)助人類接聽。

在語音交互產(chǎn)品方面,阿里iDST研究的技術(shù)平臺(tái)能夠精準(zhǔn)轉(zhuǎn)換用戶的語音為對互聯(lián)網(wǎng)內(nèi)容和服務(wù)的意圖,觸達(dá)手機(jī)、IoT設(shè)備、互聯(lián)網(wǎng)汽車、電視、智能音箱等各類終端,如與斑馬網(wǎng)絡(luò)、上汽合作的的榮威互聯(lián)網(wǎng)汽車、與海爾合作的人工智能電視等。

馮津偉入職后將依托其在聲學(xué)與信號(hào)處理領(lǐng)域的背景,主持領(lǐng)導(dǎo)語音交互設(shè)備端的研究工作。聲學(xué)是物理學(xué)分支學(xué)科之一,研究媒質(zhì)中機(jī)械波的產(chǎn)生、傳播、接收和效應(yīng)。以時(shí)下最熱門的智能音箱為例,如何選擇麥克風(fēng)的材質(zhì)、擺放位置、結(jié)構(gòu),就是聲學(xué)設(shè)計(jì)要解決的問題。

關(guān)于加入阿里巴巴,馮津偉認(rèn)為是一次全新的機(jī)會(huì)。他表示,過去自己的專業(yè)知識(shí)基本用于會(huì)議模式,而未來阿里豐富的智能交互場景將為聲學(xué)設(shè)計(jì)與信號(hào)處理的發(fā)展提供寶貴的實(shí)戰(zhàn)經(jīng)驗(yàn)。

馮津偉的研究方向?yàn)椤跋乱淮藱C(jī)自然交互技術(shù)”,該領(lǐng)域已經(jīng)得到阿里巴巴重點(diǎn)投入,此前成立的“達(dá)摩院”就包含這一研究領(lǐng)域。

阿里巴巴iDST透露,馮津偉已參與一秘密項(xiàng)目開發(fā),項(xiàng)目在全球沒有先例。

 

分享到

xiesc

相關(guān)推薦