有了這個數(shù)據(jù)庫去進(jìn)行數(shù)據(jù)挖掘,或者在建立數(shù)據(jù)的過程中,企業(yè)需要從什么方向去探索,也不是漫無目的的。首先應(yīng)該跟著你的業(yè)務(wù),業(yè)務(wù)現(xiàn)在有哪些問題,或者說這個行業(yè)里面主要的競爭點(diǎn)在哪里,這是很關(guān)鍵的。有了這個業(yè)務(wù)關(guān)系以后,再形成假設(shè),也就是說未來的競爭點(diǎn)可能在哪里,大到未來的戰(zhàn)略競爭,小到哪些方面。然后下一步要怎么做,這些形成一個假設(shè),其次做一些小樣本的測試。很多企業(yè)一看大數(shù)據(jù)就很恐怖,說我也買不起那些大數(shù)據(jù),也雇不起那么專業(yè)的團(tuán)隊,怎么辦?自己做一些小樣本的測試,甚至通過電子表格Excel都可以做數(shù)據(jù)挖掘。不一定非要那么龐大、那么貴的數(shù)據(jù)。然后再做大樣本的驗(yàn)證,驗(yàn)證出來的結(jié)果就可以應(yīng)用到現(xiàn)實(shí)中去。

在大數(shù)據(jù)尤其是互聯(lián)網(wǎng)時代還有一個最重要的點(diǎn),就是失效預(yù)警。即你發(fā)現(xiàn)一個規(guī)律,在現(xiàn)實(shí)中應(yīng)用了,但是你一定要設(shè)立一些預(yù)警指標(biāo)。就是當(dāng)指標(biāo)達(dá)到什么程度的時候,之前發(fā)現(xiàn)的規(guī)律失效,那你就必須發(fā)現(xiàn)新的、相關(guān)的,否則也會造成一種浪費(fèi)。筆者看到一篇文章,其中有一個重要結(jié)論。大家都在說大數(shù)據(jù)的價值很有用的時候,很多企業(yè)說我積累了多少TB,多少PB,但是你基于老的數(shù)據(jù)得出的很多結(jié)論實(shí)際是在浪費(fèi)你的資源。你挖掘出來很多數(shù)據(jù)、很多規(guī)律,如果錯了,明天按這個去做,就是浪費(fèi)。因此需要有一個失效預(yù)警。在這樣的過程中,最終你需要對應(yīng)建立起內(nèi)部團(tuán)隊,他們對數(shù)據(jù)的敏感度也才能培養(yǎng)起來。這時候你再去買大數(shù)據(jù)服務(wù)的時候才是有價值的。

所有這些工作作為企業(yè)來說是需要內(nèi)部去做的,最終才能開花結(jié)果,有一些收獲。企業(yè)大數(shù)據(jù)起步,要從小數(shù)據(jù)開始。

注1:關(guān)于數(shù)據(jù)挖掘過程中是直接上來就大數(shù)據(jù)、全數(shù)據(jù),還是可以從一些小數(shù)據(jù)、小樣本入手,這方面目前存在一些爭論。本文為復(fù)旦大學(xué)主辦的“大數(shù)據(jù)與營銷傳播”高峰論壇的演講稿整理,僅代表作者觀點(diǎn),供參考。

分享到

wangxueyang

相關(guān)推薦