探討:如何用大數(shù)據(jù)創(chuàng)造復(fù)雜的人工智能
鳳凰科技 發(fā)表于:13年04月01日 09:49 [轉(zhuǎn)載] DOIT.com.cn
現(xiàn)在的電腦系統(tǒng)是根據(jù)編寫程序時(shí),明確要求它們遵循的規(guī)則來進(jìn)行運(yùn)算的。因此,當(dāng)一個(gè)結(jié)果偶爾無可避免地出錯(cuò)的時(shí)候,我們可以回過頭去,看看電腦是如何得出這個(gè)結(jié)果的。
比如,我們可以問“為什么外部傳感器發(fā)現(xiàn)濕度突然大幅上升時(shí),自動(dòng)駕駛系統(tǒng)會(huì)將飛機(jī)抬高五度?”今天的電腦代碼可以被打開檢查,人們可以追蹤并理解運(yùn)算的基礎(chǔ),無論這個(gè)基礎(chǔ)如何復(fù)雜。
但是,有了大數(shù)據(jù)分析之后,這種追蹤就會(huì)變得困難許多。算法預(yù)言的基礎(chǔ)可能會(huì)復(fù)雜得讓常人難以理解。
大數(shù)據(jù)的“不可解釋”性
當(dāng)電腦根據(jù)程序編寫的明確要求遵循系列指令,比如IBM在1954年發(fā)展的將俄語翻譯為英語的程序,人可以輕易理解為什么軟件會(huì)用一個(gè)詞代替另一個(gè)詞。但谷歌翻譯在判斷英語單詞“light”是該翻譯成法語的“lumière”還是“léger”時(shí)(即描述“光”還是“重量”),卻動(dòng)用了數(shù)十億頁的翻譯資料。一個(gè)人不可能追蹤到程序作出最后選擇的準(zhǔn)確原因,因?yàn)檫@些選擇是基于海量的數(shù)據(jù)和大量的統(tǒng)計(jì)運(yùn)算的。
大數(shù)據(jù)運(yùn)作的規(guī)模也超乎我們的想象。比如,谷歌分辨幾個(gè)搜尋關(guān)鍵詞和流感的關(guān)聯(lián)是測(cè)試4.5億個(gè)數(shù)學(xué)模型的結(jié)果。相對(duì)地,麻省理工學(xué)院統(tǒng)計(jì)學(xué)助理教授辛西婭?魯丁(Cynthia Rudin),為檢修孔是否會(huì)著火設(shè)計(jì)了106個(gè)預(yù)測(cè)指標(biāo),而且她可以向聯(lián)合愛迪生電力公司的經(jīng)理們解釋,為什么她的程序優(yōu)先了某些檢查位置。
人工智能界所說的“可解釋性”,對(duì)于我們常人來說是很重要的,我們總是想知其所以然,而不僅是知其然。可是,如果系統(tǒng)自動(dòng)生成了601個(gè)預(yù)報(bào),而不是 106個(gè)呢?如果這601個(gè)中大多數(shù)都不是特別重要,但把它們放在一起,就會(huì)提升模型的精確性?任何預(yù)報(bào)的基礎(chǔ)都可能非常復(fù)雜。要說服經(jīng)理們重新分配有限的預(yù)算,她該告訴他們什么呢?
在這個(gè)情景中,我們可以看到,大數(shù)據(jù)預(yù)報(bào)的風(fēng)險(xiǎn),及其背后的算法和數(shù)據(jù)集,可以變成不可說明、不可追蹤,甚至不可信的黑匣子。要防止這樣的事情發(fā)生,大數(shù)據(jù)需要監(jiān)控和透明,這就要求新的專業(yè)知識(shí)和機(jī)構(gòu)。這些新成員會(huì)幫助社會(huì)仔細(xì)檢查某些領(lǐng)域的大數(shù)據(jù)預(yù)報(bào),會(huì)讓被數(shù)據(jù)傷害的人得到平反。
算法師的崛起
在社會(huì)上,當(dāng)一個(gè)特定領(lǐng)域的復(fù)雜性和專業(yè)性大幅上升,因而對(duì)管理新技術(shù)的專家產(chǎn)生緊急需求時(shí),我們常會(huì)看到這些新實(shí)體出現(xiàn)。法學(xué)、醫(yī)學(xué)、會(huì)計(jì)和工程學(xué)的專業(yè)人才在超過一世紀(jì)前就經(jīng)歷了這種巨變。最近,電腦安全和隱私專家突然冒起,以保證公司遵從諸如國際標(biāo)準(zhǔn)組織這樣的機(jī)構(gòu)訂立的最佳操作準(zhǔn)則。
大數(shù)據(jù)會(huì)需要新的一群人來擔(dān)當(dāng)這個(gè)角色。也許他們會(huì)被稱為“算法師”。他們可能分兩類——從外部監(jiān)測(cè)公司的獨(dú)立實(shí)體,或從內(nèi)部監(jiān)測(cè)公司的雇員或部門——就像公司有內(nèi)部會(huì)計(jì)師和外來審計(jì)師來檢查財(cái)務(wù)一樣。
這些專業(yè)人士會(huì)是計(jì)算機(jī)科學(xué)、數(shù)學(xué)和統(tǒng)計(jì)學(xué)方面的專家;他們會(huì)檢查大數(shù)據(jù)的分析和預(yù)報(bào)。算法師必須中立并保密,就像會(huì)計(jì)師和其他一些職業(yè)現(xiàn)在所做的那樣。他們會(huì)評(píng)價(jià)數(shù)據(jù)源的選擇,分析和預(yù)報(bào)工具的選擇,包括算法和模型,以及對(duì)結(jié)果的闡釋。在有爭(zhēng)議時(shí),他們會(huì)獲取得出某個(gè)結(jié)果的算法、統(tǒng)計(jì)方法和數(shù)據(jù)集。
如果2004年的時(shí)候國土安全局有算法師,他就可能防止該局產(chǎn)生一張如此多錯(cuò)誤的禁飛名單,上面竟然還有參議員肯尼迪。在日本、法國、德國和意大利,最近都有算法師本可以有所作為的例子,這些國家的人們抱怨說谷歌的“自動(dòng)完成”功能誹謗了他們,這個(gè)功能會(huì)根據(jù)一個(gè)輸入的名字產(chǎn)生一系列常見的搜索關(guān)鍵詞。這些詞基本是基于過往搜索的頻率得出的:詞語根據(jù)概率排列。盡管如此,當(dāng)一個(gè)潛在的商業(yè)伙伴或情人上網(wǎng)查我們的時(shí)候,我們的名字跟“罪犯”或“妓女”放在一起的,誰能不生氣呢?
我們預(yù)想的算法師是為像這樣的問題提供市場(chǎng)導(dǎo)向的解決方法的人,他們的存在可能減少過分的規(guī)范管制。他們滿足的需求與會(huì)計(jì)師和審計(jì)師在20世紀(jì)早期出現(xiàn)應(yīng)對(duì)泛濫的金融資訊所滿足的需求是相似的。洶涌而來的數(shù)字讓人難以理解。它要求專家以靈活而自律的方式組織在一起。市場(chǎng)的反應(yīng)是讓專門進(jìn)行財(cái)務(wù)監(jiān)察的有競(jìng)爭(zhēng)力的公司形成一個(gè)新興行業(yè)。通過提供這種服務(wù),新型職業(yè)提升了社會(huì)對(duì)經(jīng)濟(jì)的信心。算法師可提供類似的信心提升,大數(shù)據(jù)按說能夠并應(yīng)該從中獲益。
打開黑匣子
沒有任何簡(jiǎn)單的方法,可以讓我們充分準(zhǔn)備好迎接大數(shù)據(jù)的世界。它要求我們建立新的準(zhǔn)則以管束自己。我們實(shí)際操作上的一系列重要改變,可以在社會(huì)逐漸熟悉大數(shù)據(jù)的特點(diǎn)和缺點(diǎn)時(shí)提供幫助。我們必須設(shè)計(jì)保障,讓新的“算法師”專業(yè)階層可以評(píng)估大數(shù)據(jù)分析——這樣一個(gè)因?yàn)榇髷?shù)據(jù)而變得難以掌握的世界,才不會(huì)變成一個(gè)黑匣子,以一種不可知代替另一種不可知。
公司簡(jiǎn)介 | 媒體優(yōu)勢(shì) | 廣告服務(wù) | 客戶寄語 | DOIT歷程 | 誠聘英才 | 聯(lián)系我們 | 會(huì)員注冊(cè) | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.