那些即使已經(jīng)在大數(shù)據(jù)方面進(jìn)行大規(guī)模投資的企業(yè)也表示,他們投資于大數(shù)據(jù)部分原因其實(shí)是因?yàn)榇髷?shù)據(jù)概念的營銷,而真正對于大數(shù)據(jù)其實(shí)則可能是相對缺乏理解的。到今天為止,網(wǎng)絡(luò)媒體對于何謂大數(shù)據(jù)的解釋工作其實(shí)做點(diǎn)很不好。正如SAP業(yè)務(wù)分析執(zhí)行副總裁史蒂夫•盧卡斯所說:“事實(shí)上,當(dāng)我看到這些調(diào)查結(jié)果,我所想到的第一句話就是,哇。我們連一個(gè)關(guān)于何為大數(shù)據(jù)的準(zhǔn)確的定義都還沒有。這還真是一個(gè)大問題啊!”

5億美元的金字塔

問題是,現(xiàn)在許多公司都面臨著傳統(tǒng)數(shù)據(jù)庫的進(jìn)化道路,尤其是現(xiàn)在成千上萬的用戶同時(shí)通過移動設(shè)備應(yīng)用程序進(jìn)行訪問已成為一項(xiàng)任務(wù)。Hadoop框架興起于雅虎的一個(gè)開源項(xiàng)目,目前已經(jīng)成為其自身的商業(yè)行業(yè),提出了可行的解決方案。但是,大數(shù)據(jù)對于那些已經(jīng)有數(shù)據(jù)中心的客戶來說相當(dāng)難以理解,難怪調(diào)查發(fā)現(xiàn),企業(yè)的大數(shù)據(jù)戰(zhàn)略各個(gè)方向,五花八門。

“我從調(diào)查結(jié)果的有關(guān)統(tǒng)計(jì)中發(fā)現(xiàn)了一個(gè)相當(dāng)令人驚訝的結(jié)果是,18%的年收入低于5億美元的中小企業(yè)均認(rèn)為大數(shù)據(jù)是由社交網(wǎng)絡(luò)和機(jī)器產(chǎn)生的。”盧卡斯繼續(xù)說道。“規(guī)模較小的公司正在從他們當(dāng)前的網(wǎng)絡(luò)處理大量的交易,而移動設(shè)備的采購,向他們提出了挑戰(zhàn)。規(guī)模較大的公司有相應(yīng)的基礎(chǔ)設(shè)施和處理能力。因此,他們集中了諸如機(jī)器生成的數(shù)據(jù)、來自手機(jī)、移動設(shè)備、傳感器,以及社交網(wǎng)絡(luò)的數(shù)據(jù)。”

倉促的判斷

去年四月,哈里斯針對美國的154名跨國公司的企業(yè)高層管理人員進(jìn)行了一系列問題的調(diào)研,調(diào)研的問題之一便是要求這些受訪的企業(yè)高管們根據(jù)自己所在企業(yè)的戰(zhàn)略簡單地定義一下“大數(shù)據(jù)”。其結(jié)果可謂五花八門。有28%的受訪者認(rèn)可“大量增長的交易數(shù)據(jù)”最接近自己的理解(認(rèn)可這一概念的比例越來越大);24%的受訪者認(rèn)可“旨在解決數(shù)量、品種,和速度挑戰(zhàn)問題的新技術(shù)即為大數(shù)據(jù)”(這一概念使得數(shù)據(jù)庫系統(tǒng)變得更復(fù)雜);19%的受訪者贊同“需要存儲并進(jìn)行監(jiān)管的數(shù)據(jù)”的概念;18%的受訪者選擇了“爆炸的新數(shù)據(jù)來源”;11%的人選擇了“其他”。

上述所有這些定義選項(xiàng)似乎達(dá)成一個(gè)共同的主題,數(shù)據(jù)庫的發(fā)展超出了我們目前的技術(shù)能力。但是,當(dāng)這些高管們再次被問到,給出一個(gè)策略來解決這一問題時(shí),結(jié)果再次變得五花八門。

當(dāng)SAP的盧卡斯進(jìn)一步對調(diào)研結(jié)果進(jìn)行探究。他發(fā)現(xiàn),以年收入5億美元為分界點(diǎn)。年?duì)I收低于該數(shù)值的公司(約占總受訪者的60%),多認(rèn)為大數(shù)據(jù)主要集中諸如Twitter這樣網(wǎng)站。年?duì)I收高于該數(shù)值的企業(yè)有可能已經(jīng)開始在處理社會網(wǎng)絡(luò)的數(shù)據(jù),而他們的問題是集中處理大量的來自新的移動設(shè)備應(yīng)用程序的數(shù)據(jù),以及他們正在使用的用于與他們的客戶連接所產(chǎn)生的數(shù)據(jù)的問題,這些應(yīng)用程序規(guī)模較小的企業(yè)還不太熟悉。

“以5億美元年?duì)I收為臨界點(diǎn),不同的企業(yè)其基礎(chǔ)設(shè)施投資優(yōu)先次序方面的思路也很不同。”盧卡斯說。“他們還指出,云的一個(gè)關(guān)鍵部分是其大數(shù)據(jù)策略。我們將其作為第一大優(yōu)先投資選項(xiàng)。”

那么什么是正確的答案?這里是一個(gè)對于“大數(shù)據(jù)”的解釋,我相信,適用于任何人:

鑒于數(shù)據(jù)庫技術(shù)無法擴(kuò)大規(guī)模,已成為了業(yè)務(wù)邏輯的一種阻礙。這種邏輯使用效率不高的方法來訪問和操縱數(shù)據(jù)。但這些低下的效率往往被硬件的增長速度和能力,以及存儲的價(jià)格下降所掩蓋。當(dāng)然,這種低效直到2007年左右,都沒有人真正注意或關(guān)心。

效率低下,最終納入開放新的應(yīng)用程序時(shí),發(fā)現(xiàn)大量數(shù)據(jù)推斷的重要成果(經(jīng)常是分析的一種)的新的和實(shí)際用途。我們總是用傳統(tǒng)的數(shù)據(jù)庫系統(tǒng)的方法,不能擴(kuò)大。大數(shù)據(jù)技術(shù)的建立是為了使應(yīng)用程序可以擴(kuò)大,但更重要的一點(diǎn),其解決了過去30年來一直困擾我們的系統(tǒng)效率低下的問題。效率低下與尺寸或規(guī)模幾乎沒有關(guān)系,而是源于懶惰,我們更傾向于一拖再拖的不解決這些不愉快的細(xì)節(jié),直到他們真正成為我們的麻煩。

從本質(zhì)上講,大數(shù)據(jù)工具解決的是大量數(shù)據(jù)的存儲、訪問、操縱和分析的方式。他們代替了傳統(tǒng)數(shù)據(jù)庫。至少,代替了存儲系統(tǒng)(Hadoop),但他們也可以代替存取方法。

分享到

zhaohang

相關(guān)推薦