另外,李開復(fù)還說,如果從過去深藍(lán)擊敗世界冠軍的“成長過程”來看,深藍(lán)大約1993年達(dá)到職業(yè)大師水平,4年后才在一場六盤的比賽中擊敗世界冠軍(大約500Elo積分點(diǎn)的提升)。今天的AlphaGo應(yīng)該和1993年的深藍(lán)相似,剛進(jìn)入職業(yè)大師水平。若要擊敗世界冠軍,雖然未必需要4年的時間,但是幾個月似乎不夠。
雖然沒有給出明確的預(yù)測結(jié)果,回答的很慎重。另外,存儲在線總編宋家雨昨天撰文從理性角度分析了AlphaGO下棋方法做出了對勝敗的預(yù)測。他提到:
從技術(shù)上看,AlphaGO涉及兩個專業(yè)術(shù)語:深度神經(jīng)網(wǎng)絡(luò)和蒙特卡洛算法。機(jī)器學(xué)習(xí),神經(jīng)網(wǎng)絡(luò),簡單說就是模擬人類大腦思考問題的方式。
有一種解釋比較透徹:機(jī)器下棋的算法本質(zhì)都是搜索樹,AlphaGO也不例外。IBM深藍(lán)就是依靠這種方法,該方法之所以不能應(yīng)對圍棋,原因在于樹寬。國際象棋的樹寬只有幾十,圍棋則可以達(dá)到300多(3611),在有限時間內(nèi)要遍歷300多樹寬,就只有犧牲遍歷深度(俗稱“往后看幾步”),而圍棋又是依賴遠(yuǎn)見的游戲,不僅要看“幾步”,甚至要看幾十步,甚至上百步。
在圍棋比賽中,棋手經(jīng)常出現(xiàn)長考,其實(shí)就是計(jì)算這種深度。以往棋手長考時間很長,現(xiàn)在為了轉(zhuǎn)播需要,棋手的保留時間有限,所以很多情況來不及計(jì)算。對于AlphaGO也是如此,盡管擁有1202個CPU和176個GPU,40個線程,但面對圍棋比賽的需要,計(jì)算能力仍然受限,沒有辦法進(jìn)行完全計(jì)算。
如果犧牲了遍歷深度,那么AlphaGO要想擊敗高手就是一個笑話。在不犧牲深度的情況下,就需要適當(dāng)縮小樹寬,避免一些沒有必要的搜索樹的計(jì)算。所謂蒙特卡洛算法。采樣越多,越近似最優(yōu)解。就像從100個蘋果中挑出最大的。隨機(jī)拿1個,再隨機(jī)拿另外1個進(jìn)行比較,留下大的,再隨機(jī)拿1個……,拿的次數(shù)越多,挑出的蘋果就越大,但除非拿100次,否則無法肯定挑出了最大的。這就屬于蒙特卡羅算法。與蒙特卡洛算法對應(yīng)的是拉斯維加斯算法:采樣越多,越有機(jī)會找到最優(yōu)解。
采用蒙特卡洛算法,可以解決樹寬的問題,結(jié)合機(jī)器學(xué)習(xí),AlphaGO被科學(xué)界寄予了厚望,存儲在線總編對比賽結(jié)果的預(yù)測是AlphaGO贏。
AlphaGo對未來的意義
AlphaGo 是什么?在今年一月的Nature上有AlphaGo的詳細(xì)介紹,AlphaGo是一套為了圍棋優(yōu)化的設(shè)計(jì)周密的深度學(xué)習(xí)引擎,使用了神經(jīng)網(wǎng)路加上MCTS (Monte Carlo tree search),并且用上了巨大的谷歌云計(jì)算資源,使用了GPU的通用計(jì)算能力。
AlphaGo的特點(diǎn)在于充分利用現(xiàn)在的機(jī)器學(xué)習(xí)技術(shù),可擴(kuò)張的架構(gòu),它不僅僅是用一臺超級計(jì)算機(jī),而是可以利用谷歌龐大的計(jì)算資源來做這個深度學(xué)習(xí),提升學(xué)習(xí)能力。谷歌提供了15-20名世界頂級的計(jì)算機(jī)科學(xué)家和機(jī)器學(xué)習(xí)專家和全世界最龐大的谷歌后臺計(jì)算平臺,看看能把圍棋這種高難度的人類游戲項(xiàng)目做到什么高度?
把人類感性的東西,通過計(jì)算機(jī)龐大的計(jì)算能力和高水平的人工智能程序來解釋,通過機(jī)器的自我學(xué)習(xí)來提升,這是很有意義的。
AlphaGo里面的深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、MCTS,和AlphaGo的擴(kuò)張能力計(jì)算能力都是通用的技術(shù)。AlphaGo今天要進(jìn)入一個新的應(yīng)用領(lǐng)域,用AlphaGo的底層技術(shù)和AlphaGo的團(tuán)隊(duì),應(yīng)該可以更快更有效地開發(fā)出解決方案。
AlphaGo如果在圍棋上擊敗頂級的人類智能,那么這種學(xué)習(xí)能力用于其他難以精確計(jì)算而依靠人類經(jīng)驗(yàn)判斷的領(lǐng)域,也會擊敗人類。
要知道,現(xiàn)在傳感器實(shí)際上有遠(yuǎn)遠(yuǎn)優(yōu)于人類的感知能力,如果計(jì)算機(jī)對非精確描述的事物學(xué)習(xí)能力也超過人類,那么人類真的就可以被替代了。
無人駕駛是小菜一碟,人類能學(xué)會的,計(jì)算機(jī)都可以學(xué)會,而且學(xué)得更好,那么人類的所有的技能與經(jīng)驗(yàn)就全部變成可替代的了,包括編程。計(jì)算機(jī)可以自我發(fā)展,完成各種功能,人類的各種勞動都可以解放了。
這個世界聽上去似乎很熟悉,沒錯,The Matrix就在不遠(yuǎn)的將來。