沃森研究項目主管埃里克·布朗

特迪曼:《危險邊緣》為何會是一個值得讓"深藍"的繼承者下戰(zhàn)書的游戲?我了解原因,但我想知道是否有許多人會將《危險邊緣》看作是一個可與國際象棋相提并論的智力挑戰(zhàn)。

布朗:在"深藍"問世之前,人們認為開發(fā)一套可以擊敗國際象棋大師的電腦系統(tǒng)是不可能的,這令其成為"大挑戰(zhàn)賽"一個非常有趣的問題。但是,國際象棋定義明確,主要涉及數(shù)學,電腦可以輕易代表每一個游戲狀態(tài)及相應步驟?!段kU邊緣》則要求電腦必須理解人類自然語言。與國際象棋不一樣,人類語言完全是開放式的,往往模棱兩可,需要上下文才能理解意思。雖然我們可以輕松理解人類語言,但開發(fā)理解人類語言的電腦系統(tǒng)卻極具挑戰(zhàn)性?!段kU邊緣》便是推動我們突破這項技術的了不起的途徑。

特迪曼:我看過《為什么是危險》(Why Jeopardy)視頻,有人說過的一句話給我留下了深刻印象,即如果你認為沒有把握就不要回答問題。這種情況會發(fā)生在"沃森"身上嗎?如果會發(fā)生,它為何不知道答案呢?

布朗:這是《危險邊緣》節(jié)目的一個核心部分–如果你的回答錯誤,會受到懲罰,提示值會從你的得分中扣除 –這與商戰(zhàn)的情況一樣,如果你因信息不全面作出錯誤的決定,你便會受到懲罰。這意味著"沃森"不僅要給出正確的答案,而且還要對答案相當有信心,以決定是否接受某個提示。至于"沃森"為何不知道答案,這里的問題或許就在于,"沃森"怎樣可能知道所有問題的答案呢?

我們要考慮以下幾個問題。首先,在參加《危險邊緣》節(jié)目時,"沃森"必須全靠自身力量–它不能與互聯(lián)網(wǎng)連接。"沃森"用于回答問題的所有內容都要提前進行確認,即在看到問題以前。

其次,《危險邊緣》的線索包羅萬象,涵蓋各種各樣的話題。事實上,我們分析了隨機挑選的2萬個提示樣本,發(fā)現(xiàn)這些提示涉及2500種不同類型的事情。既然范圍如此之廣,我們不可能做到預測《危險邊緣》問到的每個線索,并就相應的答案建一個數(shù)據(jù)庫。作為"沃森"超級電腦基礎的DeepQA技術可以讀取數(shù)百萬頁文本數(shù)據(jù),利用深度自然語言處理技術產(chǎn)生候選答案,根據(jù)諸多不同尺度評估那些問題。

最后,《危險邊緣》線索通過復雜而棘手的人類自然語言來表達。僅僅理解線索所作出的提示,本身就是一個挑戰(zhàn)。

特迪曼:簡單地說,"沃森"用于回答問題的內容來源是什么?

布朗:"沃森"會運用百科全書、字典、新聞報道、書籍、網(wǎng)絡內容等資源。

特迪曼:沃森團隊如何認定"沃森"已經(jīng)做好了與最優(yōu)秀的《危險邊緣》冠軍選手對決的準備?

布朗:在開發(fā)"沃森"的四年間,我們主要以兩種方式評估這套系統(tǒng)。首先,我們以成批的方式(如每次3000 個問題)進行大規(guī)模測試以評估系統(tǒng)性能,實施錯誤分析,提高系統(tǒng)性能?;谶@種多問題的表現(xiàn)可以讓我們從統(tǒng)計學角度作出重要的性能評估。

我們評估"沃森"的第二個方式是,與《危險邊緣》以前的參賽選手進行"陪練"比賽。在2009年冬天,我們與曾經(jīng)出現(xiàn)在《危險邊緣》的選手進行了79場比賽,在剛剛過去的秋天,我們與獲得過《危險邊緣》比賽冠軍的選手進行了55場對決。這些陪練比賽讓我們對沃森的性能有了深入認識。

特迪曼:你為何對"沃森"擊敗兩位冠軍選手滿懷信心?如果其中一位選手最終勝出,你會有多驚訝?

布朗:我們對"沃森"頗具競爭力充滿信心。但是,表演賽只有兩場比賽,一切皆有可能發(fā)生。鑒于此,"沃森" 或任何一位選手在連續(xù)兩場比賽中可能會有運氣不好的時候。這是我們進行陪練比賽的另一個原因–通過更多的游戲書寫記錄。

特迪曼:在完成了這些大規(guī)模測試以后,哪類問題對"沃森"的挑戰(zhàn)最大?

布朗:由于我們尚未參加最終的表演賽,我無法給你一個確切的答案。不過,我可以告訴你,"沃森"獲取正確線索的能力經(jīng)常讓我們大吃一驚。

特迪曼:在一段有關"沃森"的視頻中,我注意到一個細節(jié),當被要求確定R.E.M。歌曲的兩個人的身份時,而提示為"它是我們所知道的世界末日",首字母是"L.B。","沃森"對此意思完全理解錯誤,回答說,"我覺得應該是"。"沃森"需要作出哪些改變,才能克服對基本語言的錯誤理解呢?

布朗:這個問題的有趣之處是,人類或許將這個當作"基本的語言誤解",但讓我們看一看究竟發(fā)生了什么。由于層層遞進,那類線索頗具挑戰(zhàn)性。你需要了解這首歌的歌詞,知道"那個人"是干什么的,找到歌詞中描寫的那個人,清楚"首字母"是什么,比較首字母找到正確答案。這便需要復雜的信息分解和處理能力。

特迪曼:請告訴我從事這個項目最令你感到吃驚的地方?

布朗:我認為,最令人吃驚的地方是我們可以如此快地推動這項技術。這個項目剛剛啟動時,我們的問答系統(tǒng)與《危險邊緣》選手相比根本沒有競爭性。在過去的四年,沃森團隊取得了不可思議的進步,解決了無數(shù)個挑戰(zhàn),從自然語言處理運算到向外擴展、潛在因素。解決了這么多難題的確使人感到無比驚訝。

另外一個令我們吃驚的地方是,IBM公司內部、客戶以及學術界對這種挑戰(zhàn)的反應。由于這項技術的演示,人們才真正對《危險邊緣》感興趣。這對整個團隊來說都是巨大的回報。

特迪曼:你的團隊從沃森計劃學到了哪些東西,可以應用于其他現(xiàn)實世界的計劃或問題?

布朗:"沃森"是一項重要技術的應用,這項技術通過評估具有許多不同證據(jù)和運算法則的候選答案(或"假定")做出更好的決定。我們看到這個方法在醫(yī)學、商業(yè)智能、咨詢臺等領域具有諸多令人激動的應用。

特迪曼:最后一個問題,我喜歡做即時通訊采訪有以下幾點原因:相比電話采訪或面對面采訪,它使我的嘉賓可以進行更多的思考和更多的表達。我得到了一份完美的成績單,即時通訊(IM)可以實現(xiàn)多任務操作。所以,如果你不介意,能否告訴我你在這次采訪期間還從事別的事情了嗎?

布朗:我接到了同事發(fā)來的一些即時信息,我與進出我所在會議室的一些人說了幾句話。但在大多數(shù)時間,我都專心于這次采訪。

特迪曼:非常感謝你接受采訪。這個計劃讓我無比激動,我確實期待著它的結果。

分享到

zhabin

相關推薦