大會首日,百度、領英、IBM、Uber、Google、Facebook等企業(yè)分別分享了各自的最新技術和研究觀點。從各家的分享內(nèi)容綜合來看,關于“道”的探討更大于“術”,大家更注重AI發(fā)展的邏輯思考,而不是具體的某一項技術或應用。以下是大會首日各企業(yè)分享的干貨摘要。
谷歌大腦首席科學家:機器人研究中的機器學習
代表谷歌做技術分享的是谷歌大腦首席科學家、負責谷歌機器人研究項目的 Vincent Vanhoucke。盡管深度學習給很多應用領域帶來了更好的效果,但是Google覺得在機器人領域,機器學習算法的應用仍然很少。這是因為與圖像識別、文本處理等應用不同,要控制機器人的行為,不但需要學習,其反饋系統(tǒng)同樣重要。
機器人手臂隨機抓取物體的實驗為例:
強調(diào)在學習過程中并沒有任何假設信息(Assumption),于是學習過程沒有任何限制;
通過多個“并行手臂”實驗,彼此共享學習經(jīng)驗從而加速學習過程;
對于已知機械結構的手臂,學習經(jīng)驗的共享和傳遞是可靠的。
聽眾對于“No assumption”的關注很多,其中一位觀眾的問題指出如果假設信息可以作為先驗知識添加到學習模型中,則可能比沒有假設信息更能加速學習收斂。
Google雖然認為機器學習算法不夠多,但不可否認的是機器學習相比過去更容易研究和突破,因為不論是方法論還是硬件,現(xiàn)在都比以前優(yōu)越很多。
Facebook AML負責人:大規(guī)模設計AI應用于日常生活
Facebook應用機器學習實驗室負責人Joaquin Quinonero Candela分享了解決問題之道:專注于當前的需求任務,實施并快速改進,而并非直接追求完美。
Applied Machine Learning (AML)實驗室開發(fā)的學習系統(tǒng)可以應用在圖像、文本、語音等方面。以圖像和視頻理解平臺Lumos為例,通過調(diào)整優(yōu)化圖像標簽而重新訓練的模型,可以改善其圖像識別的效果并得到更多高級的應用。比如,不僅僅停留在圖像表面的內(nèi)容表述,而是根據(jù)圖片人物和背景推斷人物的活動和情緒等;或者當用戶搜索的關鍵字不在圖像的相關表述中時,仍然能通過該模型搜索得到圖片;對于視頻文件進行實時分類處理等。
為了更好將不同任務的結果進行更好的匹配,Lumos將某一任務過程和結果按照計算量/識別精度進行細化,使得后續(xù)的不同任務可以分別對應到不同細化層面,從而在計算量和識別精度中尋找平衡點。
Facebook圖像識別平臺Lumos是目前最智能的圖像搜索工具之一,因為它能夠讀懂照片,可根據(jù)圖片內(nèi)容進行搜索,而不是依靠已有的標簽,而這得益于深度學習的進步??梢韵胂?,這種技術未來的價值不可限量,如反垃圾信息、自動圖像抓取等。
百度副總裁王海峰:百度的自然語言處理
百度認為自然語言特別是母語是人類進行思考的載體,因此NLP是讓機器具備人類思考和理解能力的重要技術。
百度的NLP以大數(shù)據(jù)、機器學習和語言學為基礎,結合知識圖譜(包括Entity graph,Intent graph和Attention graph),在語言理解和語言生成方面有重要應用,并形成問答、機器翻譯和對話等應用系統(tǒng)。其NLP平臺擁有過20+ NLP模塊,每天的請求數(shù)量超過1000億次。
具體來說,Entity graph用于實現(xiàn)復雜關系的推理,Attention graph應用在文檔理解方面以改善推薦系統(tǒng),Intent graph則應用于對話系統(tǒng)中。依存句法分析、基于深度學習的語義理解大幅度改善了查詢理解的效果。在語言生成領域,百度列舉了新聞寫作、籃球評論、中文作詩等應用實現(xiàn)。
人機交互的方向是自然語言的方式,但自然語言處理是人工智能中最為困難的問題之一。相比其他公司,在NLP領域百度擁有得天獨厚的用戶和數(shù)據(jù)優(yōu)勢,海量的交互和用戶行為,以及知識庫可使百度保持強勁的競爭力。
領英Deepal Agarwal:大規(guī)模創(chuàng)造專業(yè)機會的AI
領英強調(diào)AI技術未來可能給更大規(guī)模范圍的用戶提供職業(yè)機會。AI技術不僅僅為用戶提供職業(yè)信息,還可以就各種職業(yè)問題尋求幫助,同時在全球范圍內(nèi)協(xié)調(diào)技能差距。
領英重點強調(diào)了其面臨的兩大問題:推薦和搜索。在推薦問題上,借助機器學習來優(yōu)化短期推薦系統(tǒng)算法并最終實現(xiàn)長期目標;在搜索問題上,首先通過顯性或隱性線索來推測用戶意圖,基于用戶特征和推薦類別特征對搜索答案進行排序并輸出。
領英的大量原始數(shù)據(jù)來源于用戶,而基于人工智能的分類方法將對數(shù)據(jù)進行提煉優(yōu)化。用戶彼此間建立的聯(lián)系不僅為領英提供更多數(shù)據(jù),同時也將通過領英獲取更多價值。
此外,領英還介紹了基于領英自主開發(fā)的Photon Machine Learning (Photon ML) Library的GAME – Generalized Additive Mixed Effect Model。還指出,雖然深度學習在很多應用中有重要作用,但是在實際應用中深度學習并非唯一的途徑。
對于招聘者和求職者來說,更精準的結果和更佳的匹配度就是最好的服務體驗。單從這一點來說,領英所強調(diào)的推薦和搜索問題正是求職平臺上的關鍵痛點,借助AI技術改善平臺服務,相信將是所有社交化招聘網(wǎng)站所關注的方向。
IBM:應對復雜狀況的AI
IBM的Michael Withbrock在演講中指出,一般認為需要解決的問題可以分為兩種:對于可表述的一致性問題,一般都可通過編程來實現(xiàn);對于難于表述的多樣化問題,只有少部分可以通過人工完成,而那些需要機器學習和推理的問題,則需要尋求更好的表示和計算模型。
針對這個問題,IBM提出超越數(shù)據(jù)、程序以及任務限制的模型:基于組合理論(compositional theory),利用符號來表示問題的顯性部分;利用變量的統(tǒng)計模型表達隱形部分。這種模型可用以解決需要機器學習和推理來完成的大多數(shù)多樣化問題。
IBM強調(diào)了符號主義的重要性,認為知識表達、邏輯在解決復雜問題中非常重要?;谶壿嫷膫鹘y(tǒng)知識表示值得引起我們的重新思考(Rethink)。IBM在此方面的研究優(yōu)勢是從計算硬件的堆棧層面對機器學習算法進行近似,從而加速運算效率。
IBM任何時候都是個技術主義者,而且能夠在諸多領域產(chǎn)生了巨大的應用價值,比如在醫(yī)療方面。此次,他們提出超越數(shù)據(jù)、程序以及任務限制的模型,目的是提高機器學習和推理的效率和結果,讓機器更好地理解人類并幫助人類。
Uber AI實驗室主任:人工智能局限性以及對通用AI的需求
Uber AI實驗室主任、Geometric Intelligence創(chuàng)始人兼CEO Gary Marcus在會上做了分享。Marcus認為,深度學習并非是“萬能藥”,目前可以勝任的任務也相當有限。未來如何提取常識信息是重要且具有挑戰(zhàn)性的,盡管現(xiàn)在有一些眾包方案試圖解決此類問題,但終究無法遍及全部常識,這些常識對于行動判斷是至關重要的。
盡管深度學習在圖像識別方面帶來了巨大的革命,但是在復雜的實際應用情況下,如模糊視線中的物體識別等,仍有待改善。由此給Uber帶來的問題是,無人車可能只是“會開車”,但并非能“安全行駛”。
我們一般認為Uber是一家平臺公司,而非技術公司,但實際上Uber正在努力成為一家技術性企業(yè)。因此他們不僅關注AI技術如何服務出行行業(yè),也正在發(fā)展自己的人工智能技術力量,他們的目標是像谷歌、facebook等公司一樣。
復旦&小i機器人:聚焦機器自然語言理解的分類體系
復旦大學肖陽華博士帶隊的研究小組與小i機器人合作的Graph-Based Wrong IsA Relation Detection in a Large-Scale Lexical Taxonomy《基于圖模型的大規(guī)模分類體系中的錯誤檢測》和 On the Transitivity of Hypernym-Hyponym Relations in Data- Driven Lexical Taxonomies《數(shù)據(jù)驅(qū)動的大規(guī)模分類體系中上下位關系的傳遞性》兩篇論文被大會收錄,并做口頭報告。
自然語言理解是實現(xiàn)人工智能的關鍵,而分類體系在機器自然語言理解中不可缺少。兩篇論文從不同的角度對大規(guī)模分類體系進行了深度探討。
其中《基于圖模型的大規(guī)模分類體系中的錯誤檢測》主要研究如何提升自動構建的大規(guī)模知識庫的質(zhì)量:知識庫在人工智能中起著重要的作用,其中,不管是人工構建的還是自動構建的知識庫都獲得了較多關注。相對于人工構建的知識庫,自動構建的知識庫規(guī)模更大,覆蓋更廣,但常包含更多的錯誤。該研究小組關注于包含isA關系的分類體系知識庫,他們發(fā)現(xiàn)這些分類體系中往往存在環(huán),而這些環(huán)經(jīng)常是由于錯誤的isA關系導致的。從這個發(fā)現(xiàn)中,論文提出了兩種模型用于從環(huán)中找出錯誤的isA關系。第一個模型通過在分類體系中提取DAG子圖來消除其中的環(huán),而第二個模型利用對分類體系中的結點定義層級來消除環(huán)。目前,已經(jīng)在最先進的自動構建的分類體系Probase上實現(xiàn)了這兩個模型。在處理了數(shù)千萬關系以后,以91%的準確率消除了7.4萬條錯誤關系。
《數(shù)據(jù)驅(qū)動的大規(guī)模分類體系中上下位關系的傳遞性》研究分類體系中的基礎關系——上下位關系。
近幾年研究人員構建了許多大規(guī)模的從語料自動抽取并構建的分類體系。這些分類體系包含了詞匯之間的上下位關系(hypernym-hyponym)。上下位關系使得機器具備泛化能力,可廣泛用于諸如實體分類、推薦等應用。論文聚焦于上下位關系的一個重要特性:傳遞性的判定問題。研究者發(fā)現(xiàn),與人工構建的小規(guī)模分類體系和本體庫不同,在大規(guī)模的自動構建的分類體系中,傳遞性并不總是成立。因此,他們提出了一個有監(jiān)督方法來判定一個大規(guī)模自動構建的分類體系中傳遞性是否成立?;谶@一判定方案,他們進一步利用傳遞性推斷來發(fā)現(xiàn)分類體系中缺失的上下位關系。研究團隊通過大量實驗驗證了相關模型與方法的有效性,并為當前現(xiàn)有的分類體系補全了近4百萬缺失的上下位關系。
本文轉(zhuǎn)自新智元,原文鏈接http://www.itmsc.cn/archives/view-150977-1.html