AAAI 2021是人工智能領(lǐng)域的國際頂級學(xué)術(shù)會議,歷史悠久,由美國美國人工智能協(xié)會主辦(Association for the Advance of Artificial Intelligence),覆蓋了機器學(xué)習(xí)、視覺、NLP等人工智能多個重點領(lǐng)域。據(jù)悉,AAAI 2021于2月2日到2月9日在線上舉辦,大會一共收到9034篇論文,競爭激烈,其中有效審稿有7911篇,最終錄取1692篇,接收率為21.4%。

阿里巴巴這次共有54篇論文入選大會,是全球入選最多的科技公司之一,在人工智能多個領(lǐng)域均有突破,尤其是NLP領(lǐng)域。在論文《Nested Named Entity Recognition with Partially-Observed TreeCRFs》中,阿里研究人員關(guān)注NLP領(lǐng)域中的重要研究任務(wù)嵌套命名實體識別(Nested Named Entity Recognition,簡稱Nested NER),提升識別準(zhǔn)確率,較原來的業(yè)界最佳模型提升0.3%(ACE04數(shù)據(jù)集)和0.7%(ACE05數(shù)據(jù)集),不斷逼近極限。

據(jù)介紹,所謂NER中的“實體”包括人名、地名、機構(gòu)名等,嵌套是指多個實體疊加組合,像醫(yī)學(xué)名詞“肝癌檢查”就包括多個實體:“肝癌”是一種癌癥,“肝”是一種人體器官,“癌”是一種疾病類型…這種嵌套在醫(yī)療文本中廣泛存,要讓AI讀懂病歷、輔助醫(yī)生診療,必須解決這一難題。阿里研究人員提出了一種新的建模嵌套實體識別任務(wù)的方式,并應(yīng)用新算法提升計算效率,從而突破原有的技術(shù)瓶頸。讓AI更懂病歷。

除了54篇大會論文之外,阿里還有多篇論文入選AAAI2021的workshop,希望用科技來解決社會問題。在論文《Transformer-based Language Model Fine-tuning Methods for COVID-19 Fake News Detection》中,阿里研究人員關(guān)注新冠疫情中廣泛傳播的謠言和假新聞問題,他們提出了一種新穎的基于transformer編碼器的假新聞分類模型,能夠精準(zhǔn)地捕捉到不同新聞之間的文本信息和語義信息差別,從而判別新聞的真假性。這彌補了通用語言模型在假新聞識別方面的缺陷。

據(jù)介紹,以2017年達摩院成立為標(biāo)志,阿里巴巴在基礎(chǔ)科研和創(chuàng)新技術(shù)研究上傾注全力,多次包攬國際頂會的收稿冠軍和最佳論文。其中,29篇論文入選人工智能頂會SIGIR 2020,全球第一;5篇論文入選網(wǎng)絡(luò)通信頂會SIGCOMM 2020,刷新中國紀(jì)錄。

分享到

xiesc

相關(guān)推薦