佚名 發(fā)表于:14年08月19日 10:26 [轉載] 賽迪網(wǎng)
“大數(shù)據(jù)時代真的來了,大數(shù)據(jù)帶來了大機會,同時也存在大忽悠和大危險。但挖掘數(shù)據(jù)離不開其他人文學科相關專業(yè)的基礎知識支撐,商業(yè)應用中的數(shù)據(jù)挖掘如果忽視人性,精準挖掘就成了精準騷擾,大數(shù)據(jù)則會淪為大忽悠。”北京大學新聞與傳播學院,新媒體研究副院長、教授劉德寰在8月14日舉辦的2014夏季騰訊思享會上講到。
在題為《大數(shù)據(jù)開啟時代轉型》的主題演講中,劉德寰指出,大數(shù)據(jù)時代洶涌來臨,給各行各業(yè)都帶來了大機會,電子商務、信息產(chǎn)業(yè)、公共衛(wèi)生、醫(yī)療、教育各個產(chǎn)業(yè)都在突飛猛進的運用大數(shù)據(jù),尤其是零售業(yè),在大數(shù)據(jù)應用情況下,可以發(fā)現(xiàn)更多“啤酒與紙尿褲”的搭售規(guī)律,讓商家更懂得消費者。
不過他認為,由于當前的運算技術有限,大數(shù)據(jù)搜集也存在斷裂和封閉現(xiàn)象,數(shù)據(jù)太多太大也導致了數(shù)據(jù)失真,加之人們急功近利等原因,出現(xiàn)了很多假規(guī)律、假相關和虛假運算結果,很多運算變成了自我高潮,導致大數(shù)據(jù)變成“大忽悠”。
他分析道,如果大數(shù)據(jù)忽視了抽樣的調查,在沒有總結整體規(guī)律的基礎上預測和理解眾多的個體,簡單粗暴,不一定實用。一個模型代替不了所有個體,忽視了個體的大數(shù)據(jù)就是空中樓閣,只見到數(shù)據(jù)不見人的時候是非常危險的。
劉德寰總結到:算法依賴于人們對該領域知識的理解深度,不是數(shù)學技能和IT能力,忽視基礎知識的大數(shù)據(jù)應用永遠不能成功。數(shù)據(jù)挖掘的商業(yè)本質要簡單不能再簡單,但是過程非常復雜。不是簡單的CRM、ERP跑一圈兒就給你推送,那是從精準營銷蛻變?yōu)榫珳黍}擾。所以,數(shù)據(jù)挖掘不是黑箱,不是一個調動數(shù)據(jù)的方法,也不是整理數(shù)據(jù)的方法。它實際上需要在思想的基礎上做。真正進行跟人相關的大數(shù)據(jù)挖掘的時候一定要關注人性。
“22年前,我選了‘數(shù)據(jù)分析’這門課,當時非常之冷,但現(xiàn)在非常之熱,熱到受不了。大數(shù)據(jù)其實相當于給了大家一個新算盤,一個各個領域都能用的新工具,希望大家在實際應用中抓住大機會,規(guī)避掉忽悠和風險。”劉德寰表示