360大數(shù)據(jù)中心副總裁傅志華發(fā)表了“互聯(lián)網(wǎng)大數(shù)據(jù)應用與展望”的主題演講。大數(shù)據(jù)很重要的發(fā)展驅(qū)動力是網(wǎng)絡的發(fā)展。在當前互聯(lián)網(wǎng)大數(shù)據(jù)里,手機已經(jīng)超越了PC,移動互聯(lián)網(wǎng)已經(jīng)成為互聯(lián)網(wǎng)大數(shù)據(jù)的重要的驅(qū)動力。
“未來互聯(lián)網(wǎng)大數(shù)據(jù)很重要的方向,將是通過圖像識別的手段,讓計算機更加聰明,更加知道身邊的環(huán)境是什么樣的。收集完這些數(shù)據(jù)以后,再給客戶更好的反饋和體驗。”傅志華說。
以下為演講主要內(nèi)容。
各位領導、各位來賓大家下午好!非常榮幸有機會在這里跟大家分享互聯(lián)網(wǎng)大數(shù)據(jù)的應用。我看到在座很多專家和學者感覺到非常鼓舞,因為我看到了不同行業(yè)的專家都在關注大數(shù)據(jù),我相信這是一個很重要的信號。大數(shù)據(jù)肯定是未來很重要的生產(chǎn)力,就像科技一樣,科技是很重要的生產(chǎn)力,我相信大數(shù)據(jù)也是。
今天我主要聚焦在互聯(lián)網(wǎng)領域,剛才有航空界的專家。我跟大家分享一下在互聯(lián)網(wǎng)領域里面,大數(shù)據(jù)主要的應用場景,包括未來重要的方向。首先跟大家分享一下我自己的感受,互聯(lián)網(wǎng)大數(shù)據(jù)很重要的發(fā)展驅(qū)動力是什么?除了我們看到很多大數(shù)據(jù)的技術,除了數(shù)據(jù)處理、數(shù)據(jù)倉庫的技術,隨著處理技術的成熟和發(fā)展以外,很重要的是因為網(wǎng)絡的發(fā)展。
這是今年上半年中國網(wǎng)民數(shù)6.7億,相當于中國有一半公民上網(wǎng),這一半里面很重要的,有89%的網(wǎng)民是通過手機上網(wǎng),相當于有6億手機網(wǎng)民。對于我自己親身看過移動互聯(lián)網(wǎng),是什么時候超越了PC互聯(lián)網(wǎng)?我在前幾家公司都看到一些重量級的互聯(lián)網(wǎng)產(chǎn)品,手機端的活躍度在2011年已經(jīng)超過了PC端的活躍度,我是親眼看到的,它超越了PC互聯(lián)網(wǎng)。互聯(lián)網(wǎng)大數(shù)據(jù)里面,手機超越PC的特點,手機網(wǎng)民為主的特點給我們什么樣的啟發(fā)和注意點,我們要利用互聯(lián)網(wǎng)大數(shù)據(jù)去優(yōu)化我們的商業(yè)銀行或者傳統(tǒng)行業(yè)借用互聯(lián)網(wǎng)的時候,要利用移動互聯(lián)網(wǎng)的大數(shù)據(jù),我們要做些什么呢?我分享一下我自己的親身感受。
你們想想,移動互聯(lián)網(wǎng)數(shù)據(jù)和PC互聯(lián)網(wǎng)數(shù)據(jù)有什么最大的同?手機是可移動的,移動就意味著你有很多場景化的信息,在PC互聯(lián)網(wǎng)的時代,幾乎是沒有的,或者很難采集到的,場景化信息,比如說位置信息,PC互聯(lián)網(wǎng)是IT地址,現(xiàn)在我們看到移動互聯(lián)網(wǎng)時代,除了經(jīng)緯度數(shù)據(jù)以外,更精確的知道你在商場里的第幾層,在哪個區(qū)域都可以知道。這些場景化的數(shù)據(jù)跟PC互聯(lián)網(wǎng)是完全不一樣的。我們利用移動互聯(lián)網(wǎng)的時候,一定要注意這些特點,有很多場景化的數(shù)據(jù)。
為什么說移動互聯(lián)網(wǎng)是互聯(lián)網(wǎng)大數(shù)據(jù)很重要的一個驅(qū)動力?我們做大數(shù)據(jù)最核心的是有數(shù)據(jù),以往采集數(shù)據(jù)的方式有很多,通過攝像頭也可以采集,通過人工記錄也可以采集,這種效率低,成本也高。我們?nèi)粘?吹胶芏喙飞系臄z像頭,處理成本很高。但是移動互聯(lián)網(wǎng)給大數(shù)據(jù)帶來一個什么好處?數(shù)據(jù)采集成本顯著降低,只要你使用應用里面,這個應用有數(shù)據(jù)打點上報就有可能采集到你的數(shù)據(jù),這個成本是非常低的。比如說攝像頭頭像識別,這種處理成本相對很低,而且移動互聯(lián)網(wǎng)的數(shù)據(jù)有一個特點,除了場景信息以外,還有一個特點,記錄人全方位的行為,因為手機是隨身攜帶的,對于一些大型互聯(lián)網(wǎng)企業(yè)來說是有機會了解到您的生活軌跡,你的興趣偏好的。如果是你愿意把數(shù)據(jù)上報給它的話,在PC互聯(lián)網(wǎng)時代是做不到的,這個也是移動互聯(lián)網(wǎng)對互聯(lián)網(wǎng)大數(shù)據(jù)很重要的驅(qū)動。
另外一個是什么呢?移動互聯(lián)網(wǎng)又是很好的一個數(shù)據(jù)應用的渠道。就是因為數(shù)據(jù)要產(chǎn)生價值嘛?;氐絼偛盼艺f的攝像頭,比如說這里有一個攝像頭監(jiān)控我的情況,它會跟我有什么交互和反饋呢?交互和反饋的能力是比較難的。但是移動互聯(lián)網(wǎng)很容易,如果我猜到你有什么樣的簡單需求,可能手機就給你反饋一條相關的你感興趣的商品信息和感興趣的功能體驗。為什么這兩年互聯(lián)網(wǎng)大數(shù)據(jù)發(fā)展這么好,我認為很重要是移動互聯(lián)網(wǎng)的推動。
另外一個反向的壓力是什么?PC企業(yè)從互聯(lián)網(wǎng)轉到移動互聯(lián)網(wǎng)時代有一個很重要的特點,對于產(chǎn)品來說有一個更大的挑戰(zhàn),為什么呢?因為我們看到電腦屏幕,一般都是十幾寸,PC電腦屏幕十幾寸,手機屏幕一般也就五六寸已經(jīng)比較大了。一個互聯(lián)網(wǎng)產(chǎn)品從大屏幕走到小屏幕,挑戰(zhàn)在于什么?挑戰(zhàn)是產(chǎn)品非常不適應,為什么?如果簡單把一個PC網(wǎng)站搬到你手機上,我估計咱們都不會瀏覽,因為信息太多了,看不過來。
所以對移動互聯(lián)網(wǎng)的產(chǎn)品特點來說,就得簡單有效,一個屏幕不能放太多的廣告,在PC互聯(lián)網(wǎng)時代,上一個網(wǎng)站可以幫助十幾個廣告出來,但是在手機上做不到,用戶看不過來,體驗也非常差。所以這個時候,我們就更加投其所好,比如說一個用戶只能放三個廣告,放多了,用戶看不過來,或者體驗不好,假如說放三個廣告,PC互聯(lián)網(wǎng)網(wǎng)站可以放10個廣告,你有什么理由從10個減掉3個,這10個里面,我哪7個要砍掉,你的理由和依據(jù)是什么?產(chǎn)品經(jīng)理拍腦袋嗎?還是老板拍腦袋?肯定不是這樣的。這時候大數(shù)據(jù)就起到作用了。
我通過大數(shù)據(jù)了解到用戶的興趣愛好,我就知道可能那7個廣告沒有效果的。我只能放那3個,這就是大數(shù)據(jù)對企業(yè)的運營起到的很重要的作用。所以從這幾個方面來看,互聯(lián)網(wǎng)大數(shù)據(jù)很重要的特點,就是移動互聯(lián)網(wǎng)本身的特性對互聯(lián)網(wǎng)大數(shù)據(jù)很重要的一個影響。接下來我跟大家分享一下互聯(lián)網(wǎng)大數(shù)據(jù)的一些應用。
我主要分享企業(yè)運營的應用,我總結了一個金字塔,大數(shù)據(jù)在企業(yè)運營里面的金字塔,基本上代表了很多互聯(lián)網(wǎng)企業(yè)的應用場景。分為這么幾層,最底層是數(shù)據(jù)平臺,剛才我說了,做大數(shù)據(jù)肯定得先有數(shù)據(jù),這一層面是解決數(shù)據(jù)質(zhì)量的問題,這是第一個核心要點。很多企業(yè)數(shù)據(jù)質(zhì)量非常不好,而且還有很多問題。比如說數(shù)據(jù)是孤島,這兩個是一個問題,是銀行好,還是電信好?數(shù)據(jù)散落在企業(yè)不同的部門,數(shù)據(jù)不關聯(lián)起來,價值比較低,數(shù)據(jù)資產(chǎn)不能很好的反映出來。
我跟人聊,他說我們企業(yè)也有做大數(shù)據(jù)的,你跟他交流一下,看有什么差異?我給他最大的啟發(fā),把數(shù)據(jù)當成無形資產(chǎn)管理,大數(shù)據(jù)是企業(yè)的無形資產(chǎn),如果不重視數(shù)據(jù)的整合和數(shù)據(jù)質(zhì)量的話,最后你這個企業(yè)要精細化運營的時候,數(shù)據(jù)就很難起到作用了。數(shù)據(jù)起到作用是這個企業(yè)增長放緩,或者行業(yè)增長放緩的時候,數(shù)據(jù)價值就起到更大的作用,老板那時候才重視數(shù)據(jù),重視精細化運營,精細化的分析。經(jīng)歷過粗暴式運營,形成很多信息孤島,一開始沒有把數(shù)據(jù)整合在一起的話,后面的數(shù)據(jù)應用就非常困難了。
這里面會有什么建議呢?我看到很多傳統(tǒng)行業(yè)數(shù)據(jù)是孤島,銀行、電信很多企業(yè)都有數(shù)據(jù),包括醫(yī)療的數(shù)據(jù)孤島。你通過規(guī)范把數(shù)據(jù)整合到一起嗎?通過規(guī)范是非常難的。
比如說我碰到一些做醫(yī)療行業(yè)大數(shù)據(jù)的朋友,制定規(guī)范,上有政策,下有對策,最后整合的數(shù)據(jù)質(zhì)量也非常差。所以解決這個問題最好是通過技術來解決。我們在360內(nèi)部,前幾年也碰到過這個問題,就是數(shù)據(jù)質(zhì)量不是特別理想。后來我們用了一套技術方法,做了一套統(tǒng)計SDK的解決方案,只要用戶們接入我數(shù)據(jù)SDK服務,這是一個技術解決方案,它的數(shù)據(jù)完全按照我的技術方案上報的,就不會存在數(shù)據(jù)質(zhì)量的問題,這是一個。
還要解決另外一個問題,對于互聯(lián)網(wǎng)企業(yè)來說,我們天天說用戶,我要了解用戶的興趣愛好,我這一層要解決的是什么?我了解我的用戶要達到像我了解家人一樣了解它。我要做畫像打標簽。好的一個互聯(lián)網(wǎng)企業(yè),一個用戶打上上萬個標簽,通過訪問行為和使用行為了解他的愛好,這一層是很重要的。
做完底層以后,上面很多都是應用層,包括業(yè)務運營監(jiān)控,通過大數(shù)據(jù)的優(yōu)化用戶體驗,包括精準的運營和營銷,這里面有很多相應的方法。包括在經(jīng)營分析層面和戰(zhàn)略分析層面可能有不同的應用。
業(yè)務運行監(jiān)控,對于老板來說,他看數(shù)據(jù),一般就是看大數(shù),比如說收入多少,日活躍用戶有多少,老板最關注的是什么?比較厲害的老板可能每天都看日報,或者比較注重數(shù)據(jù)的老板每天都會看日報,他會問今天的用戶活躍度為什么下滑了。如果要通過人工的分析提數(shù)據(jù),寫報告這種方式是很慢的。一般的互聯(lián)網(wǎng)企業(yè),一般做出一套解決方案,根據(jù)他關注的KPI,我們做一個金字塔式的拆解。金字塔上面所有的數(shù)據(jù)每天都更新。如果頂上的數(shù)據(jù)有異動的話,我們可以通過計算機金字塔每天拆解,每天監(jiān)控,計算機可以告訴我們,哪一點數(shù)據(jù)有問題。
對互聯(lián)網(wǎng)產(chǎn)品來說,我們可以定位到用戶活躍度,總的活躍度出問題了,通過這個里面,我就有可能知道,某一個模塊有可能有BUG,或者某一個模塊出現(xiàn)什么問題引起KPI下滑,這種產(chǎn)品是非常成熟的。
對于業(yè)務運營監(jiān)控層,我們希望做出更多智能化的數(shù)據(jù)工具,就像360提出來的給用戶做體檢,我們給企業(yè)運營做體檢,通過大數(shù)據(jù)每天都可以拿著“體溫計”測,我就知道哪個環(huán)節(jié)有問題,傳統(tǒng)的超過38.5度就發(fā)燒了,我們能不能做出類似的數(shù)據(jù)工具,可以讓我們的運營人員通過大數(shù)據(jù)一下就知道哪個環(huán)節(jié)出問題了。
第二個場景,在精細化運營里面,用戶生命周期管理,任何一個用戶都是有生命周期,從一開始用你的產(chǎn)品到最后離開,時間短了可能半年,時間長了兩年三年都可能會有。使用我們產(chǎn)品的時候,你能不能通過大數(shù)據(jù)手段實時知道它處于哪個狀態(tài)。跟你的產(chǎn)品是熱戀期、高風險還是流失期,到底屬于哪個狀態(tài)。
在互聯(lián)網(wǎng)企業(yè)里面,我們可以通過大數(shù)據(jù)了解一些核心產(chǎn)品的用戶屬于哪個階段。屬于哪個階段還不夠,我們通過算法可以計算出來他們處于哪個階段。比如說處于跟我產(chǎn)品的磨合期,也就是剛使用,對于很多產(chǎn)品來說,剛使用的最大的風險可能流失,這個月,或者過了三個月可能就不付錢了。我能不能通過數(shù)據(jù)識別的手段識別出來,他下個月可能不付錢。甚至通過數(shù)據(jù)挖掘出來,下個月可能會走的人,是什么原因要走。這里面全可以通過算法做自動化的分類,,給用戶打上相應的標簽。
如果用戶使用我們產(chǎn)品的時候,我們就可以自動化的知道,假設說我有1億用戶,哪些用戶處于哪個階段。比如說兩千萬用戶處于磨合期,這兩千萬磨合期用戶都處于什么樣的狀態(tài),興趣愛好是什么樣的?一下子就知道了。做的比較好的情況下,如果我知道,處于磨合期的時候,我可能可以通過系統(tǒng),自動化的推送一些他感興趣的活動,或者一些產(chǎn)品功能。
還有另外一種大數(shù)據(jù)作為產(chǎn)品的引擎。剛才我說到的這兩個分別是導航儀的作用,我通過幫老板分析,幫企業(yè)經(jīng)營分析,第二種是把數(shù)據(jù)嵌入到生產(chǎn)系統(tǒng),可以知道他的方向。還有一個是發(fā)動機,作為業(yè)務的引擎。
我相信這種應用會越來越多,這是360的攝像頭,智能攝像機,頭像是我,因為上班很早,每天通過這個產(chǎn)品跟我們家小孩兒交流,我通過手機的攝像頭可以看到小孩兒,他可以聽見我的聲音,我們可以進行互動。這個產(chǎn)品跟大數(shù)據(jù)有什么關系?
比如說這里面,我們最近開發(fā)出來的功能,一開始這個產(chǎn)品是沒有這個功能的,門被打開的時候會報警,我們通過軟件的方式讓它有這個功能,通過大數(shù)據(jù)圖像識別手段實現(xiàn)這個功能。我手機截一個圖,家里們門窗打開了,這是陽臺的窗戶,我老爸晾衣服的時候,把陽臺打開了,通過圖像識別手段給我報警,我相信通過圖像識別,越來越多的場景會產(chǎn)生,大數(shù)據(jù)對非結構化數(shù)據(jù)未來是非常常見的場景。
未來的機器人,指向智能化的話一定要通過大數(shù)據(jù)看得見的能力,因為機器看不見你,看不見前面有什么,看不見有什么樣的交互,通過聲音給他,這是淺層的需求,如果通過看得見的東西做交互和響應一定會更聰明。未來互聯(lián)網(wǎng)大數(shù)據(jù)很重要的方向,通過圖像識別的手段,讓計算機更加聰明,更加知道我們身邊機器環(huán)境是什么樣的。收集完這些數(shù)據(jù)以后,再給機器人客戶給到更好的反饋和體驗,這是未來很重要的方向,這是更重要的,我認為這是產(chǎn)品引擎,我就講這么多,謝謝各位!