譯名 發(fā)表于:14年07月01日 12:27 [轉(zhuǎn)載] 手機中國
巴西世界杯足球賽激戰(zhàn)正酣,有爆冷出局的,也有意外晉級的。本屆比賽雖然沒有了“預言帝”章魚保羅,但是預測比賽結(jié)果已經(jīng)有了新工具——能夠分析數(shù)據(jù)、學習思考的人工智能。目前,百度公司就有這樣一個叫做“百度大腦”的項目,用計算機加上深度學習等人工智能技術(shù)去模擬人腦的思維,這個機器大腦到底是如何思考的?讓我們一起來看看。——編 者
能做什么
提高語音識別、圖像搜索準確率,助力大數(shù)據(jù)應用推理預測
德國奪冠率17%,阿根廷奪冠率12.9%……打開百度的大數(shù)據(jù)引擎,點開世界杯預測一欄,可以看到每個參賽隊伍的奪冠概率分析——這都是根據(jù)大數(shù)據(jù)實時分析得出的結(jié)果。
這個大數(shù)據(jù)引擎是如何運轉(zhuǎn)的?與人類思考一樣,大數(shù)據(jù)引擎對數(shù)據(jù)的搜索分析及預測也通過一個機器大腦——百度大腦來實現(xiàn)。這個“大腦”用計算機模擬人腦神經(jīng)網(wǎng)絡,包括模擬人腦學習分析的能力,從而通過多層的學習模型和海量的訓練數(shù)據(jù)進行數(shù)據(jù)智能分析,然后做出預測。
“從功能上來定義百度大腦,可以說它是以大規(guī)模機器學習和深度學習為基礎的人工智能在搜索引擎中的應用,旨在優(yōu)化搜索業(yè)務和提升用戶體驗。”百度高級副總裁王勁舉例說明,比如目前用戶已經(jīng)不滿足于傳統(tǒng)搜索引擎只能提供網(wǎng)頁鏈接,他們希望能夠通過搜索引擎來直接找到答案。并且需要更加個性化的搜索體驗,希望使用更加自然的人機交互方式,比如通過語音圖像等形式讓機器理解,完成信息與用戶需求的精準匹配。據(jù)悉,目前中國每天都有60億次的搜索需求。
目前,通過百度大腦的思考,語音識別的相對錯誤率降低了20%—30%,掃描文本圖像生成漢字文本的相對錯誤率降低了30%,相似圖像搜索效果顯著超過同類產(chǎn)品,通過大數(shù)據(jù)顯著提升廣告點擊率,提升網(wǎng)頁搜索排序質(zhì)量等等。
同時百度大腦也能通過推理決策為大數(shù)據(jù)的應用提供助力,社會價值初步顯現(xiàn)。除了預測世界杯外,還能預測高考擇校、城市旅游熱度、景點旅游舒適度、疾病等。比如,通過“疾病預測”可以知道所處城市是否處于流感高發(fā)期,大家都去哪個醫(yī)院看病,從而了解當前流行病態(tài)勢及未來7天的變化趨勢。
百度大數(shù)據(jù)引擎這樣描述預測原理:“每天網(wǎng)民在百度搜索大量流行病相關信息,匯聚起來就有了統(tǒng)計規(guī)律,經(jīng)過一段時間的積累,可以形成一個個預測模型,預測未來疾病的活躍指數(shù)”。分析數(shù)據(jù)形成預測模型,其中就有百度大腦的“思考”。
怎樣工作
模仿人類大腦的神經(jīng)網(wǎng)絡,通過多層次的網(wǎng)絡模型結(jié)構(gòu)認知事物
今年4月,百度董事長兼首席執(zhí)行官李彥宏首度披露百度大腦這一項目。在王勁看來,百度大腦的應運而生,受多方面因素的推動。
“首先是服務器的能力和云計算的能力有了很大突破,數(shù)萬臺服務器能夠集合起來像一臺服務器一樣工作。其次是大數(shù)據(jù)的積累達到了相當大的規(guī)模。”王勁分析。2013年全球每天產(chǎn)生25PB(拍字節(jié),資訊計量單位)數(shù)據(jù),相當于1500個國家圖書館信息量總和。互聯(lián)網(wǎng)技術(shù)的突飛猛進及數(shù)據(jù)庫的積累為人工智能提供了突破的環(huán)境與機遇。