在Gartner研究人員與MapR、HortonWorks和Cloudera等Hadoop大數(shù)據(jù)廠商的一次座談中,與會(huì)者趨于兩點(diǎn)共識(shí):MapReduce一直是Hadoop的瓶頸,而且Hadoop是“原始”的大數(shù)據(jù)技術(shù),已經(jīng)過(guò)時(shí)了。這兩個(gè)觀點(diǎn)標(biāo)志著大數(shù)據(jù)的光環(huán)已經(jīng)幻滅。Gartner:大數(shù)據(jù)光環(huán)幻滅
此外,Sicular與多家Hadoop用戶溝通后發(fā)現(xiàn),最先嘗試大數(shù)據(jù)應(yīng)用的企業(yè)鮮有成功案例。
企業(yè)們一開(kāi)始對(duì)大數(shù)據(jù)報(bào)以極大幻想,期望值很高,仿佛得到了數(shù)字水晶球,但是他們很快發(fā)現(xiàn)實(shí)現(xiàn)可靠的大數(shù)據(jù)方案是一件非常困難的事情,例如一些嘗試輿情分析的應(yīng)用讓企業(yè)感到失望,因?yàn)榇髷?shù)據(jù)廠商們無(wú)法提供成熟的方案。
此外,面對(duì)大數(shù)據(jù)的水晶球,提出正確的問(wèn)題,并問(wèn)題分解成眾多子問(wèn)題進(jìn)行解答本身是企業(yè)大數(shù)據(jù)應(yīng)用面臨的最大挑戰(zhàn)。其次,確定答案本身是大數(shù)據(jù)應(yīng)用的另外一個(gè)難點(diǎn)。大數(shù)據(jù)分析面對(duì)的是不確定性(尤其是預(yù)測(cè)性分析),滿足和滿意是兩個(gè)不同層次的境界。
雖然大數(shù)據(jù)應(yīng)用案例失敗居多,但是也有例外,Sicular的一位客戶使用Splunk分析日志文件取得了非常理想的成果。這表明成熟的大數(shù)據(jù)工具(例如Splunk)才是現(xiàn)階段企業(yè)掘金大數(shù)據(jù)最需要的。
最后,Sicular總結(jié)說(shuō),隨著大數(shù)據(jù)光環(huán)的幻滅,越來(lái)越多的負(fù)面報(bào)道將接踵而來(lái)。
反方聲音:社交輿情和人才行情顯示大數(shù)據(jù)熱度不減
雖然Gartner的分析師開(kāi)始唱衰大數(shù)據(jù),但是根據(jù)Ovum分析師Tony Baer的報(bào)告給出了相反的結(jié)論,DataSift在分析了220萬(wàn)條提及大數(shù)據(jù)的推文后發(fā)現(xiàn),對(duì)大數(shù)據(jù)廠商做出正面評(píng)價(jià)的推文是負(fù)面評(píng)價(jià)推文數(shù)量的三倍。對(duì)于一個(gè)尚處于熱炒階段的新技術(shù)來(lái)說(shuō),大數(shù)據(jù)能獲得這么高的社交用戶評(píng)價(jià)非常難得。
此外,雖然Sicular調(diào)研發(fā)現(xiàn)很多率先嘗試大數(shù)據(jù)的企業(yè)都遭遇了困難或者失敗,但根據(jù)科技招聘網(wǎng)站Dice.com的數(shù)據(jù)統(tǒng)計(jì),2012-2013年企業(yè)大數(shù)據(jù)相關(guān)人才的薪水行情卻在看漲,平均高達(dá)10萬(wàn)美元,超過(guò)云計(jì)算/虛擬化(9萬(wàn)美元)和移動(dòng)(8萬(wàn)美元)。Dice的董事總經(jīng)理Alice Hill表示:“我們都聽(tīng)說(shuō)大數(shù)據(jù)是曇花一現(xiàn)的炒作,但事實(shí)是數(shù)據(jù)專業(yè)人才供不應(yīng)求,且身價(jià)不菲。”
總之,企業(yè)對(duì)數(shù)據(jù)科學(xué)家等數(shù)據(jù)專業(yè)人才的瘋狂爭(zhēng)奪與Sicular的調(diào)研結(jié)論并不矛盾——提出正確的問(wèn)題才是企業(yè)大數(shù)據(jù)應(yīng)用的最大挑戰(zhàn)。而所謂數(shù)據(jù)科學(xué)家,就是那些能了解企業(yè)業(yè)務(wù)并能向大數(shù)據(jù)水晶球提出正確問(wèn)題的人。