張戈 發(fā)表于:14年08月29日 15:00 [來稿] DOIT.com.cn
我們看到的大數(shù)據(jù),遠(yuǎn)沒有聽到的那么清晰。我們聽到的大數(shù)據(jù)似乎無所不能,但我們看到的大數(shù)據(jù)似乎又混沌不清。
大數(shù)據(jù)的三“V”特征
Gartner數(shù)據(jù)中心首席分析師張瑾長期關(guān)注大數(shù)據(jù)產(chǎn)業(yè)發(fā)展,其認(rèn)為,現(xiàn)階段大數(shù)據(jù)呈現(xiàn)出三“V”特點(diǎn):
其一,Volume,數(shù)據(jù)海量化。過去兩年中所產(chǎn)生的數(shù)據(jù)量占到人類有史以來所積累的數(shù)據(jù)總量的90%,現(xiàn)在每秒鐘有500萬筆交易發(fā)生,每天有5億個通話記錄產(chǎn)生。
其二,VelocITy,分析實(shí)時(shí)性。越來越多的用戶認(rèn)為,大數(shù)據(jù)還不夠快,這里所指的大數(shù)據(jù)速度,并不是傳輸速度,而是分析處理速度。張瑾認(rèn)為,數(shù)據(jù)從挖掘,到分析,再到產(chǎn)生支持決策的結(jié)果,這個過程還是略顯緩慢。之前的數(shù)據(jù)挖掘,大多是基于對歷史數(shù)據(jù)的分析,找到趨勢,并預(yù)測未來,但現(xiàn)在越來越多的用戶更在乎數(shù)據(jù)的實(shí)時(shí)分析。“但實(shí)時(shí)大數(shù)據(jù)分析,要達(dá)到傳統(tǒng)趨勢性分析同樣的水平,還要經(jīng)歷一個過程,一個數(shù)學(xué)分析模型建立的過程。當(dāng)針對所有突發(fā)性事件都已積累起分析模型時(shí),其效率自然將得到提升。”
其三,Variety,數(shù)據(jù)多樣性。一方面數(shù)據(jù)結(jié)構(gòu)趨于多樣性,以微信為例,無法預(yù)知被分析數(shù)據(jù)是文本,還是語音、或是圖片、視頻,但可以肯定的是,非結(jié)構(gòu)性數(shù)據(jù)所占比例越來越高。另一方面,數(shù)據(jù)來源多樣性,傳統(tǒng)數(shù)據(jù)分析,被分析數(shù)據(jù)來自企業(yè)自身,所有權(quán)沒有任何疑議,但目前被分析數(shù)據(jù)可能來自多個渠道,也許是微博、微信,也可能是淘寶中的交易數(shù)據(jù)。數(shù)據(jù)來源多樣性可能產(chǎn)生一系列問題,例如是否侵權(quán),或?qū)υ械赖聵?biāo)準(zhǔn)也會形成挑戰(zhàn)等。
產(chǎn)業(yè)鏈待完善
綜上所述,大數(shù)據(jù)似乎相當(dāng)清晰,必須符合三“V”特征,但實(shí)際情況是,現(xiàn)代諸多IT廠商提出了諸多大數(shù)據(jù)產(chǎn)品,其中既有基于Hadoop平臺的開源解決方案,也有SAP、甲骨文推出的大數(shù)據(jù)一體機(jī),“我們甚至不能將所有解決方案進(jìn)行分類,因?yàn)榇蠖鄶?shù)方案還沒有實(shí)現(xiàn)市場化。” 張瑾說:“市場中可能出現(xiàn)各種各樣的解決方案,他們聲稱可以解決各種各樣的問題,但實(shí)際上市場仍處于混沌狀態(tài),用戶不清楚自己的問題,也不清楚大數(shù)據(jù)究竟能解決哪些問題。甚至用戶已經(jīng)知道可以應(yīng)用何種技術(shù)解決大數(shù)據(jù)問題,但找不到供應(yīng)商,以及合適的軟件版本。即使以上問題,都能得到解決,用戶也找不到合適的服務(wù)商,提供合適的數(shù)學(xué)分析模型,提供產(chǎn)品集成,用戶自己也沒有人才儲備,維護(hù)系統(tǒng)正常運(yùn)轉(zhuǎn)。”
可以看出,在大數(shù)據(jù)產(chǎn)業(yè)鏈中幾乎每個環(huán)節(jié)都有缺失。大數(shù)據(jù)在互聯(lián)網(wǎng)公司的應(yīng)用已經(jīng)證明了其在技術(shù)上的價(jià)值,但大數(shù)據(jù)的生態(tài)系統(tǒng)面臨的問題是,如何將一個開源的技術(shù),轉(zhuǎn)化為一套能夠創(chuàng)造價(jià)值的解決方案。
挑戰(zhàn)一:最流行的大數(shù)據(jù)技術(shù)大多基于開源軟件,開源技術(shù)首先考慮的是產(chǎn)品是否夠“酷”,而不是產(chǎn)品是否有足夠的商用化程度,甚至可以說,有些產(chǎn)品并不完全符合商用標(biāo)準(zhǔn)。例如安全性,Hadoop的安全性設(shè)計(jì)就相當(dāng)簡單,從任何角度考量,都不符合商用標(biāo)準(zhǔn)。因此,用戶在接受開源技術(shù)方面總是心有余悸,但也要看到,現(xiàn)在越來越多的IT巨頭企業(yè),例如英特爾的介入,必將加入大數(shù)據(jù)商業(yè)化進(jìn)程。
挑戰(zhàn)二,服務(wù)商缺乏。要將開源的產(chǎn)品轉(zhuǎn)變成能夠落地的解決方案,一方面是產(chǎn)品本身的定制化,另一方面是將產(chǎn)品集成為解決方案。以傳統(tǒng)產(chǎn)業(yè)鏈來看,此部分工作應(yīng)該由集成商完成,但目前,在大數(shù)據(jù)領(lǐng)域,還沒有集成商能完全勝任類似的工作。
“現(xiàn)在市場中所謂的大數(shù)據(jù)產(chǎn)品,只是獲多或少地具有大數(shù)據(jù)某一方面的特征。當(dāng)然,在一個解決方案中,用戶也不一定要求一個產(chǎn)品具備所有大數(shù)據(jù)特征,例如,在股票買賣系統(tǒng)中,用戶的首要訴求是處理速度快,而不是對海量信息的存儲。這就要求集成商在了解產(chǎn)品的同時(shí)了解用戶需求,但實(shí)際情況是,我們不缺乏產(chǎn)品,而是缺乏能將產(chǎn)品組合成解決方案的集成商,也缺乏能將優(yōu)秀產(chǎn)品應(yīng)用到最合適的應(yīng)用場景的集成商。” 張瑾還指出:“大數(shù)據(jù)更關(guān)鍵一環(huán)是搭建數(shù)學(xué)分析模型,這項(xiàng)工作由誰來完成,是用戶、廠商,還是集成商,似乎現(xiàn)在還沒有定論,能做此工作的公司還是鳳毛麟角鳳。”
賺錢的大數(shù)據(jù)
想了解大數(shù)據(jù)產(chǎn)業(yè)鏈的完善程度,可以進(jìn)行一個有意思的對比,張瑾認(rèn)為,大數(shù)據(jù)目前的狀態(tài)相當(dāng)于三年前的云計(jì)算水平。目前業(yè)內(nèi)對大數(shù)據(jù)的炒作甚至要超出當(dāng)年的云計(jì)算。
從推動大數(shù)據(jù)發(fā)展的動力看,大數(shù)據(jù)與云計(jì)算也有明顯的差異,云計(jì)算的推進(jìn)是自下而上,由CIO推動,最終需要CEO拍板執(zhí)行,而大數(shù)據(jù)是自上而下,首先關(guān)注大數(shù)據(jù)的企業(yè)CEO。因?yàn)樵朴?jì)算可以幫助CIO省錢,而大數(shù)據(jù)是告訴CEO如何賺錢。
正因如此,大數(shù)據(jù)的推進(jìn)可能就具有更多的盲目性,或說缺少系統(tǒng)的規(guī)劃。“用戶不確定衡量大數(shù)據(jù)項(xiàng)目成功的標(biāo)準(zhǔn)是什么?甚至有些項(xiàng)目還停留在盡力而為的程度。”張瑾認(rèn)為:“中國最成功的大數(shù)據(jù)應(yīng)用一定首先出現(xiàn)在金融、電信、互聯(lián)網(wǎng)。” 金融企業(yè)可以根據(jù)用戶在商城中的第一筆消費(fèi),而迅速推送周邊商戶的促銷打折信息,而運(yùn)營商企業(yè)可以根據(jù)用戶的通話和上網(wǎng)流量數(shù)據(jù),推送最適合的套餐組合。
但實(shí)際情況是,國內(nèi)成功的大數(shù)據(jù)案例還屈指可數(shù)。曾經(jīng)有一個著名的失敗案例,國內(nèi)某知名電器銷售企業(yè)CEO對大數(shù)據(jù)相當(dāng)感興趣,內(nèi)部強(qiáng)力推動,CIO邀請諸多IT廠商前來應(yīng)標(biāo),需求只有一個——“我們要上大數(shù)據(jù),但具體方案由你們提。”類似如此,需求不明確的項(xiàng)目,失敗本應(yīng)就在情理之中。 “大數(shù)據(jù)有可能是一個5萬元的項(xiàng)目,也可能是一個5億元的項(xiàng)目,成功的大數(shù)據(jù)項(xiàng)目必須有明確的建設(shè)目標(biāo),并且用戶需有將目標(biāo)逐一進(jìn)行分解的能力。” 張瑾說。
購邏輯的改變
還有一點(diǎn)需要注意,在傳統(tǒng)IT系統(tǒng)建設(shè)中,只要用戶能提出明確的需求,自然有人來應(yīng)標(biāo),但在“大數(shù)據(jù)”系統(tǒng)建設(shè)中,用戶必須自己充當(dāng)自己的集成商,其采購邏輯在改變。用戶也希望有方案商來協(xié)助他來完成這項(xiàng)工作,但問題是沒有。
國內(nèi)傳統(tǒng)方案商大多經(jīng)歷了從產(chǎn)品代理,到系統(tǒng)集成,再到解決方案提供的發(fā)展過程,因此他們的知識基礎(chǔ)多是來源于廠商,他們熟悉IBM的服務(wù)器、甲骨文的數(shù)據(jù)庫、思科的網(wǎng)絡(luò)設(shè)備,對IT廠商的技術(shù)亦步亦趨,而系統(tǒng)建設(shè)流程也是,用戶聽集成商“忽悠”,集成商聽廠商“忽悠“。
但SDN的出現(xiàn),可能會使CCIE文憑變得一文不值。同樣,大數(shù)據(jù)的出現(xiàn),方案商也必須更加關(guān)注開源系統(tǒng),到2016年,至少50%的中國大型企業(yè)將部署Hadoop平臺,在開源系統(tǒng)方面,沒人會教你,沒人會給你免費(fèi)培訓(xùn),方案商的業(yè)務(wù)實(shí)施能力和競爭力,完全取決于其自我的學(xué)習(xí)能力。
也就是說,未來可能會出現(xiàn)這樣一類方案商,完全不依附于某一廠商,甚至他們與IT廠商之間會形成競爭關(guān)系,因?yàn)樗麄優(yōu)橛脩籼峁┗陂_源系統(tǒng)的解決方案。而一旦此類方案商形成競爭力,硬件設(shè)備的品牌似乎也不那么重要,白牌機(jī)的生意也許會更好。
“當(dāng)然,企業(yè)采購模式也將出現(xiàn)改變,開源軟件能否進(jìn)入企業(yè)采購名錄,而且企業(yè)對開源軟件是否有足夠的容忍度,是否能夠允許小范圍的失敗。”還有一點(diǎn)需求注意,既然越來越多的項(xiàng)目開始基于開源軟件平臺,因此企業(yè)的IT人才結(jié)構(gòu)也將發(fā)生改變,“CIO們將會需要越來越多的掌握Hadoop、OpenStack技術(shù)的人才,而IT工程師不能只懂得IBM、思科。”同時(shí),張瑾說:“當(dāng)然,企業(yè)也可以不必自己做人才儲備,而可以通過云服務(wù)模式租用大數(shù)據(jù)服務(wù),美國亞馬遜已經(jīng)開始提供類似服務(wù)。”
公司簡介 | 媒體優(yōu)勢 | 廣告服務(wù) | 客戶寄語 | DOIT歷程 | 誠聘英才 | 聯(lián)系我們 | 會員注冊 | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.