(圖說:阿里巴巴副總裁車品覺擁有豐富的數(shù)據(jù)實(shí)戰(zhàn)經(jīng)驗(yàn),他指出很多企業(yè)常陷入數(shù)據(jù)迷思,為數(shù)據(jù)而數(shù)據(jù)。照片來源:林衍億攝。)
車品覺笑說:「觀察一個(gè)人的行為只能回答一部分的問題,如果不面對(duì)面討論的話,很多問題的答案是你怎么蒐集都蒐集不來的,這就是用數(shù)據(jù)拿數(shù)據(jù)(data gets data)?!管嚻酚X一語(yǔ)道破大數(shù)據(jù)的迷思,他認(rèn)為,現(xiàn)在很多企業(yè)都陷入了數(shù)據(jù)迷思,為了數(shù)據(jù)而數(shù)據(jù),卻忽略了更快更精確的方法,就好像去觀察一個(gè)人的家想要了解這個(gè)人,卻忘了其實(shí)直接問本人更快,「所以如果你今天很擔(dān)心大數(shù)據(jù)的問題,你不如去擔(dān)心將來有很多人會(huì)為了數(shù)據(jù)而數(shù)據(jù),多愚蠢啊,舍近而求遠(yuǎn)。」
用面試說明現(xiàn)在許多企業(yè)陷入的數(shù)據(jù)迷思,俯拾即是生動(dòng)的例子,將生硬難懂的大數(shù)據(jù)說得動(dòng)聽、說得生活化,這就是在大數(shù)據(jù)中打滾數(shù)十年,自稱「每天在玩數(shù)據(jù)活兒」的阿里巴巴副總裁車品覺的魅力。
車品覺日前來臺(tái)宣傳新書《大數(shù)據(jù)的關(guān)鍵思考》,在接受《數(shù)位時(shí)代》專訪時(shí),他分享了三個(gè)常見的大數(shù)據(jù)迷思和八個(gè)大數(shù)據(jù)實(shí)戰(zhàn)密技,具體而微地解說現(xiàn)在企業(yè)在透過大數(shù)據(jù)變現(xiàn)的過程中,遇到了什么樣的問題以及該如何解決,以下為專訪內(nèi)容摘要:
三個(gè)大數(shù)據(jù)迷思
1.忘掉大數(shù)據(jù)吧!如果大數(shù)據(jù)已經(jīng)成為大家用數(shù)據(jù)的常態(tài)了,你何必特別講他出來呢?98年的時(shí)候互聯(lián)網(wǎng)是一個(gè)流行語(yǔ),現(xiàn)在還有人會(huì)說他是流行語(yǔ)嗎?現(xiàn)在有很多電子商務(wù)公司叫做傳統(tǒng)電子商務(wù)啊,多悲哀啊,有人還以為電子商務(wù)是新東西的時(shí)候,已經(jīng)有所謂的傳統(tǒng)互聯(lián)網(wǎng)公司。
2.數(shù)據(jù)也只是創(chuàng)新決策其中一部分,他只不過是新工具,也不用把他想得這么萬(wàn)能這么神。不是所有的問題都是數(shù)據(jù)問題,也不是所有的問題都是大數(shù)據(jù)問題,你就把他想成單純的工具使用,該用刀就用刀,該用槍就用槍,有些地方會(huì)比較適合使用數(shù)據(jù),不用太神化他,太多的行外人把他講得很神,反而我們業(yè)內(nèi)人不敢說得太神話,因?yàn)橹纼冬F(xiàn)不了。
3.不要為數(shù)據(jù)而數(shù)據(jù)。以前我們做一B2B的網(wǎng)站,客單價(jià)不停地掉,我們用很多數(shù)據(jù)方法去解決問題,但都沒有起色,有一天早上我覺得不對(duì),我說我們不要看數(shù)據(jù)了,我跟工程師說,你在顧客進(jìn)網(wǎng)站時(shí)問他:「你是幫自己買東西嗎?」結(jié)果有50%以上的人說對(duì),你知道我花了半年的時(shí)間去尋找答案,這根本就是為了數(shù)據(jù)而數(shù)據(jù)啊,所以如果你今天很擔(dān)心大數(shù)據(jù)的問題,你不如去擔(dān)心將來有很多人會(huì)為了數(shù)據(jù)而數(shù)據(jù)
(圖說:車品覺在新書中噼頭就說「忘掉大數(shù)據(jù)吧!」,未來數(shù)據(jù)將會(huì)成為每家公司的常態(tài),無須多言。照片來源:林衍億攝。)
八個(gè)大數(shù)據(jù)實(shí)戰(zhàn)密技
1.不要說大數(shù)據(jù),就說我們使用數(shù)據(jù)的時(shí)候到底我們知不知道這個(gè)背后數(shù)據(jù)的數(shù)據(jù)是什么?如果我的判斷是對(duì)的,你要用什么數(shù)據(jù)去證明我是對(duì)的?比如說今天氣象局說今天的溫度是12度,那我問說,過去來講這個(gè)環(huán)境中,他預(yù)測(cè)12度的正確的概率是多少?錯(cuò)的概率是多少?這就是數(shù)據(jù)的數(shù)據(jù),我要用一個(gè)數(shù)據(jù)之前,我一定會(huì)問,這個(gè)數(shù)據(jù)可不可信啊,可靠性是如何,沒有對(duì)數(shù)據(jù)的可靠性,你就先使用,你是盲目地使用,所以數(shù)據(jù)的數(shù)據(jù)是一個(gè)層面,決定可不可靠。
2.中小企業(yè)先用數(shù)據(jù)量化自己,再來談大數(shù)據(jù)。如何用好數(shù)據(jù)來量化自己?用數(shù)據(jù)理解自己,量化自己,我覺得在這個(gè)基礎(chǔ)上去思考我們有什么東西是可以用大數(shù)據(jù)的?這樣會(huì)更有效。小企業(yè)應(yīng)該去嘗試用數(shù)據(jù)量化決策,而不是大數(shù)據(jù),沒大這件事,就是用數(shù)據(jù)做決策,其實(shí)公司本身內(nèi)部有的數(shù)據(jù)問題很多的,像是大部分公司客服數(shù)據(jù)從來沒跟公司主要數(shù)據(jù)連上,因?yàn)楹芏喙镜目头行亩荚谕獠浚赃@個(gè)數(shù)據(jù)他拿不到,他不知道消費(fèi)者的反應(yīng),這個(gè)數(shù)據(jù)又無法跟你的經(jīng)營(yíng)數(shù)據(jù)做關(guān)聯(lián),所以整個(gè)數(shù)據(jù)在一個(gè)中小企業(yè)里面也是四分五裂的嘛,你在這個(gè)地方?jīng)]用好的情況下,你居然說你想用大數(shù)據(jù),其實(shí)是有點(diǎn)難以理解。
3.數(shù)據(jù)案例很多會(huì)失敗都是因?yàn)樯L集數(shù)據(jù)歸蒐集,但蒐集起來之后這跟塬本的數(shù)據(jù)決策是沒有辦法合在一起的。這不僅線下會(huì)發(fā)生問題,線上也有這個(gè)問題,你可以問問現(xiàn)在管理首頁(yè)的人,他管理首頁(yè)有多少是根據(jù)數(shù)據(jù)去設(shè)計(jì)的,你不如問他們?nèi)绻麄兏陌媸醉?yè),他們?nèi)绾卧u(píng)估這個(gè)改版后的首頁(yè)是成功的?用什么數(shù)據(jù)去決定?
4.數(shù)據(jù)的刷新頻率是什么?這個(gè)值非常關(guān)鍵。刷新得快不一定比慢好,有些地方要刷得慢一點(diǎn)。有些東西太敏感了,你刷新的數(shù)據(jù)不一定正確,比如你要買一個(gè)二十年的保險(xiǎn),就是很長(zhǎng)遠(yuǎn)的東西,或者你要做重大投資,在這個(gè)時(shí)候你應(yīng)該去看歷史的穩(wěn)定數(shù)據(jù),如果今天你剛從電影院看完一部戲,你剛看完想吃麻辣火鍋,這秒鐘,你不需要猜他的歷史性格,你應(yīng)該去猜他下個(gè)場(chǎng)景會(huì)是什么,這個(gè)時(shí)候地點(diǎn)的數(shù)據(jù)非常關(guān)鍵。
5.真正的數(shù)據(jù)創(chuàng)新還沒出現(xiàn),現(xiàn)在大部分的企業(yè)沒法串起數(shù)據(jù)、算法和應(yīng)用創(chuàng)新,沒有人既懂商業(yè)又懂?dāng)?shù)據(jù),要抓到這種機(jī)會(huì)點(diǎn)的人極少,我算是,但是我只是電商和零售領(lǐng)域的專家而已。
6.數(shù)據(jù)的創(chuàng)新來自兩點(diǎn):一、把不該再分裂的數(shù)據(jù)分裂;二、把兩個(gè)不該拼合的數(shù)據(jù)拼合。這會(huì)產(chǎn)生很大的力量,例如性別不是男就是女,這兩個(gè)東西應(yīng)該再也不能分裂了,但在數(shù)據(jù)上我們可以說這個(gè)人的態(tài)度有三成很女生,有七成很男生,他的態(tài)度有男生的態(tài)度在里面。有些數(shù)據(jù)已經(jīng)是塬子了,但你一剖開發(fā)現(xiàn)不是塬子,還可以再分裂,在這個(gè)時(shí)候分出來的數(shù)據(jù)的破壞力或創(chuàng)意是很大的,你沒想過嘛,這對(duì)推薦引擎來講太關(guān)鍵了。商業(yè)的世界很競(jìng)爭(zhēng),當(dāng)兩個(gè)敵對(duì)公司一結(jié)盟,像是根據(jù)開車數(shù)據(jù)調(diào)整保費(fèi),就是一個(gè)數(shù)據(jù)結(jié)合的創(chuàng)新案例。
7.我看到的大數(shù)據(jù)項(xiàng)目都是失望比較多的,很多大數(shù)據(jù)項(xiàng)目都還在實(shí)驗(yàn)室,當(dāng)這些東西到企業(yè)就不行了,企業(yè)需要準(zhǔn)確,還有很多問題是要分場(chǎng)景化的。
8.數(shù)據(jù)分析師要量化自己的量化,這對(duì)我們這行很重要。我們整個(gè)行業(yè)最討厭什么東西你知道嗎?你找一個(gè)人去準(zhǔn)確算出一個(gè)東西,不難,但是六個(gè)月都準(zhǔn),很難,時(shí)間一長(zhǎng),就不準(zhǔn)確了。時(shí)間一長(zhǎng),整個(gè)模型是用歷史數(shù)據(jù)建立出來的,當(dāng)歷史數(shù)據(jù)變得越來越不重要的時(shí)候,這個(gè)模型就會(huì)變得沒那么準(zhǔn)確了,這個(gè)時(shí)候你就要改進(jìn)你的算法了。