SQuAD的負(fù)責(zé)人Pranav Rajpurkar難掩興奮之情。他在社交媒體上表示,2018年一個強(qiáng)勁的開始,第一個模型(阿里巴巴iDST團(tuán)隊(duì)提交的SLQA +)在精準(zhǔn)度匹配上超越人類表現(xiàn)!下一個挑戰(zhàn):模糊匹配,人類仍然領(lǐng)先2.5分!

SQuAD比賽構(gòu)建了一個大規(guī)模的機(jī)器閱讀理解數(shù)據(jù)集(包含10萬個問題),文章來源于500多篇維基百科文章。人工智能在閱讀完數(shù)據(jù)集中的一篇短文之后,需要回答若干個基于文章內(nèi)容的問題,然后與標(biāo)準(zhǔn)答案進(jìn)行比對,得出精確匹配(Exact Match)和模糊匹配(F1-score)的結(jié)果。

SQuAD是行業(yè)內(nèi)公認(rèn)的機(jī)器閱讀理解頂級賽事,吸引了包括谷歌、卡內(nèi)基?梅隆大學(xué)、斯坦福大學(xué)、微軟亞洲研究院、艾倫研究院、IBM、Facebook等知名企業(yè)研究機(jī)構(gòu)和高校的深度參與。

此次技術(shù)的重大突破源于阿里巴巴研究團(tuán)隊(duì)提出的“基于分層融合注意力機(jī)制”的深度神經(jīng)網(wǎng)絡(luò)模型。該模型能夠模擬人類在做閱讀理解問題時的一些行為,包括結(jié)合篇章內(nèi)容審題,帶著問題反復(fù)閱讀文章,避免閱讀中遺忘而進(jìn)行相關(guān)標(biāo)注等。

模型可以在捕捉問題和文章中特定區(qū)域關(guān)聯(lián)的同時,借助分層策略,逐步集中注意力,使答案邊界清晰;另一方面,為避免過于關(guān)注細(xì)節(jié),采用融合方式將全局信息加入注意力機(jī)制,進(jìn)行適度糾正,確保關(guān)注點(diǎn)正確。

阿里巴巴自然語言處理首席科學(xué)家司羅表示,對于解決wiki類客觀知識問答,機(jī)器已經(jīng)取得非常好的結(jié)果,我們將繼續(xù)向?qū)νㄓ脙?nèi)容的“能理解會思考”的終極目標(biāo)邁進(jìn)。今后,研發(fā)的重點(diǎn)在于把這項(xiàng)技術(shù)真正應(yīng)用在廣大實(shí)際場景,讓機(jī)器智能普惠生活。

實(shí)事上,這項(xiàng)技術(shù)已經(jīng)在阿里巴巴內(nèi)部被廣泛使用。比如,每年雙11都會有大量的顧客對活動規(guī)則進(jìn)行咨詢。阿里小蜜團(tuán)隊(duì)通過使用司羅團(tuán)隊(duì)的技術(shù),讓機(jī)器直接對規(guī)則進(jìn)行閱讀,為用戶提供規(guī)則解讀服務(wù),是最自然的交互方式。

再比如,顧客還會針對單個商品詢問大量的基礎(chǔ)問題,而這些問題其實(shí)在商品詳情頁都是有答案的?,F(xiàn)在通過機(jī)器閱讀理解技術(shù),能夠讓機(jī)器對詳情頁中的商品描述文本進(jìn)行更為智能地閱讀和回答,降低服務(wù)成本的同時提高購買轉(zhuǎn)化率。

由司羅領(lǐng)導(dǎo)的自然語言處理團(tuán)隊(duì)支撐了阿里巴巴整個生態(tài)的技術(shù)需求。由他們研發(fā)的AliNLP自然語言技術(shù)平臺每日調(diào)用1200億+次,Alitranx 翻譯系統(tǒng)提供20個語種在線服務(wù)日調(diào)用量超過7億+次。此前曾在2016年ACM CIKM 個性化電商搜索、2017年IJCNLP中文語法檢測CGED評測、2017年年美國標(biāo)準(zhǔn)計(jì)量局TAC評比英文實(shí)體分類等大賽中取得全球第一的成績。

分享到

xiesc

相關(guān)推薦