他提到,QQ是中國最受歡迎的一款即時(shí)通訊軟件,它的月活躍用戶突破8.4億,同時(shí)在線超過2.1億,QQ間的活躍用戶超過6.5億,QQ好友的關(guān)系超過900億對(duì),這么多的用戶每天產(chǎn)生大量的數(shù)據(jù),每天產(chǎn)生的QQ消息有155億條,發(fā)表的空間說說超過6500萬條,我們每天為了處理這些大數(shù)據(jù)要新增存儲(chǔ)200T,每天截獲數(shù)據(jù)超過1萬億條。
這么多的數(shù)據(jù)有什么特征呢?我們分成四個(gè)方面,第一個(gè)方面是人口的概念,用戶會(huì)在他的個(gè)人信息里面填寫他的資料,包括年齡、性別、星座等。第二個(gè)方面,我們通過他的好友關(guān)系進(jìn)一步挖掘他跟好友之間是什么樣的關(guān)系,究竟是親人、同學(xué)、同事還是朋友,我們通過數(shù)據(jù)分析可以得出這樣一個(gè)關(guān)系。
第三個(gè)是多樣性,QQ不僅僅是聊天,還可以玩游戲、聽音樂,或者閱讀、購物,所以它的數(shù)據(jù)是多樣的,我們擁有豐富類型的數(shù)據(jù)。
第四點(diǎn),它是一個(gè)全互聯(lián)網(wǎng)生態(tài)的,QQ是對(duì)互聯(lián)網(wǎng)開放的,用戶可以在別的網(wǎng)站進(jìn)行QQ登錄,或者把別的網(wǎng)站信息通過QQ帳號(hào)進(jìn)行分享到QQ空間里面去,所以它不僅是在QQ里面運(yùn)行著,它是在整個(gè)中國互聯(lián)網(wǎng)運(yùn)行著的一個(gè)數(shù)據(jù)生態(tài)。
這些類型的數(shù)據(jù)能夠產(chǎn)生什么樣的應(yīng)用價(jià)值呢?其實(shí)如果把它挖掘出來可以產(chǎn)生很多的價(jià)值,這個(gè)價(jià)值主要分成三個(gè)方面,它可以滿足政府的需求,企業(yè)的需求,或者個(gè)人的需求。先來看看政府的需求,在今年春節(jié)我們做了一個(gè)抓圖發(fā)布到網(wǎng)絡(luò)上,是關(guān)于中國人在春節(jié)期間遷徙的一個(gè)數(shù)據(jù)分析,我們根據(jù)QQ登錄地點(diǎn)的變化,來去分析用戶遷徙的情況,我們可以發(fā)現(xiàn)在北上廣深四個(gè)城市,有多少的比例用戶會(huì)因?yàn)榇汗?jié)遷徙出他原來的城市。春節(jié)過后我們可以統(tǒng)計(jì)出來,有多少人原來不在這個(gè)城市里,他為了尋找新的工作機(jī)會(huì)或者學(xué)業(yè)等等,又來到了這些城市,我們發(fā)現(xiàn)其實(shí)北京每年春節(jié)過后會(huì)有大量新人涌入的,我們發(fā)現(xiàn)北京有27%的流動(dòng)人口是在春節(jié)后涌入的,上海、廣州、深圳也比較多。
那么中國人在春節(jié)里面的流動(dòng),不僅僅是在國內(nèi)城市之間流動(dòng),很多人會(huì)選擇出國進(jìn)行度假,我們也通過這些地理位置的變化,分析出來他們最喜歡去的是什么樣的國家,美國排第一位,其次是法國,然后是韓國、日本和泰國。哪些省份的人會(huì)比較喜歡春節(jié)外出呢?我們發(fā)現(xiàn)原來最喜歡春節(jié)外出的人是在江蘇省,其次是廣東省,然后是北京、上海和遼寧,這都為我們的交通運(yùn)輸?shù)鹊忍峁┖芎玫姆?wù)。我們還可以根據(jù)這些地理位置變化去進(jìn)行中國城鎮(zhèn)化進(jìn)度的一個(gè)研究,去為政府提供服務(wù)。以上就是為政府方面提供的價(jià)值。
另外一方面,我講講對(duì)企業(yè)所提供的價(jià)值,首先先介紹一下我們的廣點(diǎn)通,廣點(diǎn)通是騰訊的一個(gè)廣告系統(tǒng),可以根據(jù)廣告主的需要,把他要推廣的商品和跟他的目標(biāo)人群進(jìn)行配對(duì),進(jìn)行精準(zhǔn)營銷,并且這些廣告可以發(fā)布在我們最大的兩個(gè)平臺(tái)上,QQ和QQ空間,能讓很多用戶看得到。我們是怎么樣進(jìn)行精準(zhǔn)推送的呢?首先我們有海量的用戶數(shù)據(jù),有一些很基礎(chǔ)的屬性,比如他的性別、年齡、職業(yè)等等,或者行為,我們可以根據(jù)他在我們的拍拍網(wǎng)這些電商網(wǎng)站購物行為,來知道他的一些喜愛,比方說她喜歡女裝還是哪款的包包,或者他點(diǎn)擊哪些廣告特別多,知道他的一些喜愛,或者他喜歡的什么樣的游戲,我們也可以給他推送這些游戲。
有了這些基礎(chǔ)大數(shù)據(jù),我們可以根據(jù)廣告的類型,對(duì)這些人進(jìn)行匹配,首先是人的歸類,如果我們發(fā)現(xiàn)一批用戶對(duì)這一類型的廣告商品特別喜愛的話,我們就可以分析出來跟這些人有相同屬性的人群,也許他們也是很喜愛這批商品的,我們也可以去給他推送這款廣告。
另外一塊就是對(duì)廣告內(nèi)容進(jìn)行歸類,我們可以分析出如果這個(gè)人喜歡這款商品,那我們也可以給他推送跟這款商品具有類似屬性的商品,也許他會(huì)更加喜愛,來增加點(diǎn)擊率。
另外一塊就是協(xié)同效應(yīng),我們可以根據(jù)關(guān)系鏈接推薦,如果你的朋友們都喜歡這款游戲的話,我們可以給你推送這款游戲,比如說你的朋友們也喜歡這款游戲,你要不要來玩一下,通過這些資料和算法,我們可以對(duì)人和廣告進(jìn)行一個(gè)精確的匹配,大大提升效率和產(chǎn)生價(jià)值。因此我們的廣點(diǎn)通系統(tǒng)深受我們的廣告客戶歡迎。
另外一個(gè)例子是我們根據(jù)廣點(diǎn)通的精確定位,跟紅米手機(jī)做了一個(gè)營銷案例,我們通過廣點(diǎn)通系統(tǒng)90秒內(nèi)就把小米手機(jī)賣出十萬臺(tái)。 OK,以上就是對(duì)企業(yè)的應(yīng)用。
第三塊簡單聊一下對(duì)個(gè)人的應(yīng)用,個(gè)人征信系統(tǒng)是我們對(duì)未來互聯(lián)網(wǎng)金融的一個(gè)暢想,大家現(xiàn)在如果要去銀行貸款的話,會(huì)先調(diào)取一個(gè)個(gè)人信息系統(tǒng),隨著互聯(lián)網(wǎng)金融的發(fā)展,未來我們需要一套基于互聯(lián)網(wǎng)的個(gè)人征信系統(tǒng),除了可以跟線下的征信系統(tǒng)結(jié)合,還可以跟他在互聯(lián)網(wǎng)上的一些行為結(jié)合,比方說他的一些網(wǎng)購行為,如果他基本上網(wǎng)購都是一個(gè)守信用的買家的話,我們可以認(rèn)為這個(gè)人的征信是比較可信可靠的。
另外一個(gè)可以根據(jù)他的社交屬性,我們發(fā)現(xiàn)他在社交網(wǎng)絡(luò)中地位是比較凸顯的,他所發(fā)表的內(nèi)容會(huì)獲得他朋友們比較好的良好評(píng)價(jià)的話,我們也會(huì)認(rèn)為這個(gè)人的信用是比較可靠的,我們可以結(jié)合這些信息,然后綜合出來一個(gè)基于互聯(lián)網(wǎng)的個(gè)人征信系統(tǒng),去為互聯(lián)網(wǎng)金融服務(wù)。以上就是對(duì)個(gè)人征信系統(tǒng)的一些暢想。
其實(shí)我們要做的不止這些,未來還可以做更多,因?yàn)槲磥黼S著智能硬件的發(fā)展,我相信一定會(huì)迎來大數(shù)據(jù)的第二波浪潮,設(shè)備越智能,我們采集的信息就可以越多,比方說智能手表、智能手環(huán)可以采集一些健康信息,或者智能汽車,我們可以通過大量的信息的采集,可以提煉出更高的價(jià)值,去為社會(huì)服務(wù)。