今年3月9日-15日,在韓國首爾進(jìn)行的韓國圍棋九段棋手李世石與人工智能圍棋程序“阿爾法圍棋”(AlphaGo)之間的比賽吸引了全人類的關(guān)注。3月12日,作為業(yè)余五段的崔曉波與棋圣聶衛(wèi)平、北京葛玉宏道場(chǎng)創(chuàng)始人葛玉宏在北京小米之家一起解說第三局。
到阿爾法圍棋下了176手后,李世石投子認(rèn)負(fù)。此時(shí)圍棋人機(jī)大戰(zhàn)前三盤人類三連敗。作為第三方移動(dòng)數(shù)據(jù)服務(wù)平臺(tái)TalkingData的CEO,崔曉波“心情復(fù)雜”。
但是后來,崔曉波發(fā)現(xiàn),實(shí)際上從2014年開始,谷歌已經(jīng)在中國購買大量的棋譜。后來他到美國拜訪所有跟機(jī)器學(xué)習(xí)相關(guān)的公司,發(fā)現(xiàn)他們有一個(gè)共同的地方,就是特別注重?cái)?shù)據(jù)的積累?!暗谌斯ぶ悄艽鬅岬那闆r下,這一切是被忽略的。”
“我們過大的強(qiáng)調(diào)了AI的作用”
被忽略的有兩點(diǎn),1.阿爾法圍棋的基礎(chǔ)是大量的數(shù)據(jù);2.棋譜凝聚了專家智慧,也就是說,阿爾法圍棋的數(shù)據(jù)中其實(shí)包含人類智慧。
根據(jù)TalkingData的數(shù)據(jù),我國智能手機(jī)13.05億部,智能手表1200萬只,傳感器80.54億個(gè),每人每天手機(jī)使用時(shí)長(zhǎng)3.93小時(shí),可以說,以人為中心的世界正在全速數(shù)字化的進(jìn)程。
知道你的手機(jī)上有傳感器嗎?據(jù)稱手機(jī)上隱藏的傳感器達(dá)16個(gè)。不算攝像頭、語音,一部手機(jī)每天要產(chǎn)生1G的數(shù)據(jù)。今天,數(shù)據(jù)以前所未有的速度在產(chǎn)生和發(fā)展。
基于數(shù)據(jù),才有人工智能的發(fā)展。比如谷歌,在語音識(shí)別領(lǐng)域取得了很大的進(jìn)展,原因在于積累的巨量的數(shù)據(jù)。
大量的數(shù)據(jù)上來后,人工智能怎么識(shí)別這個(gè)世界?從創(chuàng)業(yè)公司來說,雖然大量的公司都在研究機(jī)器學(xué)習(xí),但,這只是一個(gè)開始。感知、識(shí)別、認(rèn)知甚至是預(yù)測(cè),不會(huì)一蹴而就。
“所有的前沿技術(shù),包括人工智能,對(duì)世界的感知,還都處于早期階段。”
崔曉波強(qiáng)調(diào):“我們過大的強(qiáng)調(diào)了AI的作用。在目前的情況,機(jī)器代替人作決策還不會(huì)發(fā)生。我們還需要引入專家的智慧?!?/p>
智能數(shù)據(jù)時(shí)代是什么?
那么,引入專家智慧的大數(shù)據(jù)時(shí)代是什么?怎么引入?
其實(shí),現(xiàn)階段的“數(shù)據(jù)”與以往的數(shù)據(jù)已經(jīng)有很大不同。數(shù)據(jù)內(nèi)容包含的信息量越來越大、維度越來越多,從圖像、聲音等富媒體數(shù)據(jù),逐漸過渡到人的動(dòng)作、姿態(tài)、行為軌跡,再加上地理位置、天氣、社會(huì)群體行為等等,按照以往處理數(shù)據(jù)的思路已經(jīng)難以適應(yīng)“數(shù)據(jù)”本身發(fā)展的速度。
一個(gè)融合人類智慧、人工智能以及海量非結(jié)構(gòu)化數(shù)據(jù)的智能數(shù)據(jù)時(shí)代已經(jīng)來臨。因此,“發(fā)展多年的‘大數(shù)據(jù)’即將進(jìn)入‘下半場(chǎng)’?!?/p>
基于“智能數(shù)據(jù)時(shí)代已經(jīng)到來”這一判斷,TalkingData發(fā)布了智能數(shù)據(jù)平臺(tái)(SmartDP)——“基于智能數(shù)據(jù)應(yīng)用探索商業(yè)價(jià)值的平臺(tái),具有數(shù)據(jù)管理、數(shù)據(jù)工程和數(shù)據(jù)科學(xué)的能力”。它包括四個(gè)核心部分:數(shù)據(jù)、技術(shù)、咨詢、生態(tài)。而商業(yè)價(jià)值是基礎(chǔ)。
崔曉波表示,智能數(shù)據(jù)時(shí)代,企業(yè)將面臨四個(gè)方面的挑戰(zhàn):1.業(yè)務(wù)數(shù)據(jù)化。所有業(yè)務(wù)都以數(shù)據(jù)的形式進(jìn)行流轉(zhuǎn)。2.數(shù)據(jù)資產(chǎn)化。在很多企業(yè),業(yè)務(wù)與運(yùn)營沒有形成閉環(huán);數(shù)據(jù)沒有資產(chǎn)化,只是先儲(chǔ)存起來而已。智能數(shù)據(jù)時(shí)代,會(huì)倒過來,業(yè)務(wù)可能不賺錢,但數(shù)據(jù)將體現(xiàn)出商業(yè)價(jià)值。3.應(yīng)用場(chǎng)景化。企業(yè)與用戶的每一個(gè)交互點(diǎn),都具有改變用戶認(rèn)知的功能,因此場(chǎng)景化將成為營銷的核心。4.技術(shù)開源化。
據(jù)不完全統(tǒng)計(jì),目前中國有130家做大數(shù)據(jù)的公司;而美國有7000家,雖然是紅海,但由于產(chǎn)業(yè)環(huán)境良好,依然有發(fā)展空間。
為了促進(jìn)大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展,崔曉波發(fā)布了兩項(xiàng)重要的框架開源:Myna和Fregata。
Myna是基于物聯(lián)網(wǎng)的數(shù)據(jù)采集工具,預(yù)制了人工屬性,具有情境感知功能,與國外的同類技術(shù)相比,效率可以提高三倍,并且耗電低;
Fregata是一種機(jī)器學(xué)習(xí)引擎,可以根據(jù)容量自動(dòng)調(diào)整參數(shù),提高模型加載速度,根據(jù)測(cè)試,十個(gè)節(jié)點(diǎn)內(nèi)存加速的情況下,可以在十秒鐘之內(nèi)完成整個(gè)訓(xùn)練過程。