閱讀理解是衡量人們?nèi)绾握莆詹⒗斫馄湔陂喿x的內(nèi)容的一項技能。閱讀理解的提高涉及到閱讀和大量的實踐來衡量和辨別不同的文字用法和上下文內(nèi)容。同樣的道理也適用于人工智能。

Facebook公布的多項數(shù)據(jù)表明,人工智能已被用于訓(xùn)練其自制的神經(jīng)網(wǎng)絡(luò)之中。其中有些文本是經(jīng)典小說,如拉迪亞德·吉卜林的《叢林之書》,J·M·巴里的《彼得·潘》,以及劉易斯·卡羅爾的《愛麗絲夢游仙境》;其他一些文本則是童話故事集合,如安德魯·朗格的童話書,納撒尼爾·霍桑的《重講一遍的故事》,和奧斯卡·王爾德的《快樂王子與其他故事》。這些大多是從網(wǎng)上免費圖書館古登堡計劃獲得的。

基于這些書籍來培訓(xùn)其人工智能系統(tǒng),F(xiàn)acebook正試圖確保系統(tǒng)可以對讀取以及邏輯關(guān)聯(lián)方面的過程管理。該項目的核心便是Facebook所謂的“兒童圖書測試” ,它可以使用這個指標(biāo)來確定人工智能的進展。

根據(jù)其分析文章來看,F(xiàn)acebook研究員訓(xùn)練了一種運用列表書籍作為樣品的神經(jīng)網(wǎng)絡(luò)。在此之后,他們從未閱讀的故事中以簡短摘錄的形式將其呈現(xiàn)出來。隨即人工智能被要求選擇一個選項列表中的單詞,該詞可填補在最后一句空白處丟失的字。

言外之意閱讀法

人工智能選擇”獅鷲”一詞填空

由于能夠解答這些問題,研究人員認(rèn)為,這表明一項人工智能系統(tǒng)可以在情境中更廣范圍地做出裁決或判斷。該技能在表示和記憶信息碎片方面是至關(guān)重要的,這將提高人工智能在處理讀取之外的需求方面的表現(xiàn)能力;另一個Facebook設(shè)計的智力測驗旨在理解中短篇小說思想之間的關(guān)系。

“我們的團隊訓(xùn)練電腦如何看句子的上下文并更準(zhǔn)確地預(yù)測那些較難詞匯,名詞和名字,這往往是句子的最重要的部分,”Facebook的CEO馬克·扎克伯格在帖子中解釋道。

“當(dāng)計算機關(guān)注適量的相關(guān)內(nèi)容時,它所做的預(yù)測是最準(zhǔn)確的,不是太多,也不是太少,”他說,并稱其為“金發(fā)原則?!?/p>

這些結(jié)果被納入M項目 — 即目前正在測試中的Facebook Messenger數(shù)字助理程序 —?在人工智能可以像人類一樣成熟地探究、理解和回答問題之前仍需要更多的研究與處理過程。

但重要的是,計算機程序也逐漸學(xué)會那些人類自然習(xí)得的認(rèn)知行為;這是一個艱難的過程(也許比任何人想象的更困難),但程序在穩(wěn)步發(fā)展。最終的目標(biāo)是做出人工智能(或約如此)的程序和算法,即可以更自然地與人類交互,并與Siri(語音控制功能)或Cortna(微軟個人智能助理)相結(jié)合,形成其對語言變化的理解能力,或是形成微妙的諷刺、挖苦或急躁等情緒的語言特點。

當(dāng)我們學(xué)習(xí)如何將直覺與認(rèn)知的復(fù)雜性融入計算機程序中時,也許會在前進的道路上更多一點地了解我們自己。

原文標(biāo)題:Facebook Is Training Its Artificial Intelligence to Understand Language

(DOIT獨家譯稿)

更多行業(yè)資訊,請關(guān)注DOIT官方微信號DOIT(微信號:doitmedia),關(guān)注科技與數(shù)據(jù)經(jīng)濟,洞察IT新走向。

分享到

zhangnn

相關(guān)推薦