從數(shù)據(jù)到大數(shù)據(jù)
王偉 吳以四 | 發(fā)表于:12年06月11日 10:34 [來稿] DOIT.com.cn
人類自從誕生以來就在源源不斷地創(chuàng)造著數(shù)據(jù),商業(yè)文明的發(fā)展自始至終都離不開對于數(shù)據(jù)寶藏的挖掘,在商業(yè)世界中,數(shù)據(jù)一直都不是什么新鮮的東西,但是當海量的數(shù)據(jù)積累所造就的“大數(shù)據(jù)”時代到來,經(jīng)濟的新的增量已經(jīng)逐漸露出了面紗。
盡管數(shù)據(jù)挖掘的工作人類已經(jīng)做了幾十年,但是“大數(shù)據(jù)”與我們通常所說的“數(shù)據(jù)”還是有顯著的不同。
1997年,一臺名叫“深藍”的計算機擊敗了當時的國際象棋冠軍Garry Kasparov。2011年,另一臺計算機Watson在廣受歡迎的美國電視智力競賽節(jié)目《Jeopardy!》再次戰(zhàn)勝前幾屆的冠軍。
這兩件事很好地詮釋了數(shù)據(jù)與大數(shù)據(jù)這兩個不同的商業(yè)時代。誕生于數(shù)據(jù)時代的深藍,通過將象棋的游戲規(guī)則轉化為以0和1形式存在的算法,借助全新并行處理技術,計算可能的走棋結果,如今,幾乎任何一臺計算機都能夠通過掃描數(shù)據(jù)庫而將結構化查詢與答案匹配起來。而在大數(shù)據(jù)相關技術的幫助下,Watson則能夠回答那些以人類說話方式提出的不可預測的問題,Watson 能夠“讀取”大量人類知識載體,包括百科全書、報告、報紙、書籍等。它以分析形式評估證據(jù),假設應答結果,并計算每種可能性的可信度。它在數(shù)秒內提供一個最有可能正確的答案。另外,它在做這些工作時,速度和準確性都超過世界一流的人類對手。
大數(shù)據(jù)的迅速增長及相關技術的發(fā)展正在帶來全新的商業(yè)機遇。據(jù)《麻省理工學院斯隆管理評論》和IBM商業(yè)價值研究院聯(lián)合舉行的2011年新智能企業(yè)全球高管調查和研究項目指出,絕大多數(shù)企業(yè)都已抓住了這些機遇。2011年,58%的企業(yè)已經(jīng)將分析技術用于在市場或行業(yè)內創(chuàng)造競爭優(yōu)勢,而2010年這一比例僅為37%。值得注意的是,采用分析技術的企業(yè)持續(xù)超越同行的可能性要高兩倍。
對于任何企業(yè)來說,數(shù)據(jù)都是其商業(yè)皇冠上最為耀眼奪目的那顆寶石。伴隨著傳統(tǒng)的商業(yè)智能系統(tǒng)向縱深應用的拓展,商業(yè)決策已經(jīng)越來越依賴于數(shù)據(jù)。然而,傳統(tǒng)的商業(yè)智能系統(tǒng)中用以分析的數(shù)據(jù),大都是企業(yè)自身信息系統(tǒng)中產生的運營數(shù)據(jù),這些數(shù)據(jù)大都是標準化、結構化的。事實上,這些數(shù)據(jù)只占到了企業(yè)所能獲取的數(shù)據(jù)中很小的一部分——不到15%。
通常情況下,企業(yè)的數(shù)據(jù)可以分為3種類型:結構化數(shù)據(jù)、半結構化數(shù)據(jù)和非結構化數(shù)據(jù)。其中,85%的數(shù)據(jù)屬于廣泛存在于社交網(wǎng)絡、物聯(lián)網(wǎng)、電子商務等之中的非結構化數(shù)據(jù)。這些非結構化數(shù)據(jù)的產生往往伴隨著社交網(wǎng)絡、移動計算和傳感器等新的渠道和技術的不斷涌現(xiàn)和應用。企業(yè)用以分析的數(shù)據(jù)越全面,分析的結果就越接近于真實。大數(shù)據(jù)分析意味著企業(yè)能夠從這些新的數(shù)據(jù)中獲取新的洞察力,并將其與已知業(yè)務的各個細節(jié)相融合。
在沃爾沃集團,通過在卡車產品中安裝傳感器和嵌入式CPU,從剎車到中央門鎖系統(tǒng)等形形色色的車輛使用信息,正源源不斷地傳輸?shù)轿譅栁旨瘓F總部。“對這些數(shù)據(jù)進行分析,不僅可以幫助我們制造更好的汽車,還可以幫助客戶們獲取更好體驗。”沃爾沃集團CIO Rich Strader說。
現(xiàn)在,這些數(shù)據(jù)正在被用來優(yōu)化生產流程,以提升客戶體驗和提升安全性。將來自不同客戶的使用數(shù)據(jù)進行分析,可以讓產品部門提早發(fā)現(xiàn)產品潛在的問題,并在這些問題發(fā)生之前提前向客戶預警。“產品設計方面的缺陷,此前可能需要有50萬臺銷量的時候才能暴露出來,而現(xiàn)在只需要1000臺,我們就能發(fā)現(xiàn)潛在的缺陷。” Rich Strader說。
在美國最大的醫(yī)藥貿易商McKesson公司,對大數(shù)據(jù)的應用也已經(jīng)遠遠領先于大多數(shù)企業(yè),將先進的分析能力融合到每天處理200萬個訂單的供應鏈業(yè)務中,并且監(jiān)督超過80億美元的存貨。
對于在途存貨的管理,McKesson開發(fā)了一種供應鏈模型,它根據(jù)產品線、運輸費用甚至碳排放量而提供了極為準確的維護成本視圖。據(jù)公司流程改造副總裁Robert Gooby說,這些詳細信息使公司能夠更加真實地了解任意時間點的運營情況。
Gooby解釋說:“但是,大多數(shù)模型旨在簡化物理世界,而這個模型極為復雜,并且包含我們的現(xiàn)實世界的全部數(shù)據(jù)。它允許我們量化業(yè)務運作的根本性變化所產生的影響的細節(jié)。這個模型并不是一種簡化版。”
McKesson利用先進分析技術的另一個領域是對配送中心內的物理存貨配置進行模擬和自動化處理。評估政策和供應鏈變化的能力幫助公司增強了對客戶的響應能力,同時減少了流動資金。總體來講,McKesson的供應鏈轉型使公司節(jié)省了超過1億美元的流動資金。
同樣對大數(shù)據(jù)情有獨鐘的,還有中國移動集團山西有限公司,通過大數(shù)據(jù)分析,對企業(yè)運營的全業(yè)務進行針對性的監(jiān)控、預警、跟蹤。系統(tǒng)在第一時間自動捕捉市場變化,再以最快捷的方式推送給指定負責人,使他在最短時間內獲知市場行情。
“全面獲取業(yè)務信息非常重要,有時候甚至能顛覆常規(guī)分析思路下做出的結論。” 中國移動集團山西有限公司業(yè)務支撐系統(tǒng)部經(jīng)理王峰說。比如,一個客戶使用最新款的諾基亞手機,每月準時繳費、平均一年致電客服3次,使用WEP和彩信業(yè)務。如果按照傳統(tǒng)的數(shù)據(jù)分析,可能這是一位客戶滿意度非常高、流失概率非常低的客戶。事實上,當搜集了包括微博、社交網(wǎng)絡等新型來源的客戶數(shù)據(jù)之后,這位客戶的真實情況可能是這樣的:客戶在國外購買的這款手機,手機中的部分功能在國內無法使用,在某個固定地點手機經(jīng)常斷線,彩信無法使用——他的使用體驗極差,正在面臨流失風險。
“我們正在打破傳統(tǒng)數(shù)據(jù)源的邊界,更加注重社交媒體等新型數(shù)據(jù)來源。通過各種渠道獲取盡可能多的客戶反饋信息,并從這些數(shù)據(jù)中挖掘更多的價值。”王峰說。
社交網(wǎng)絡、移動互聯(lián)網(wǎng)、企業(yè)信息化在最近這幾年中都得到了迅猛的發(fā)展,不斷產生的海量數(shù)據(jù)將越來越影響企業(yè)從戰(zhàn)術到戰(zhàn)略制定的各個方面,這是一個巨大的挑戰(zhàn),當然更是機遇,因為在大數(shù)據(jù)的背后,將是IT廠商跨越到商業(yè)智能的絕佳機會。
IBM當年之所以完成從PC廠商開始向商業(yè)智能服務商的成功轉型,一個重要的原因就是其較早預見到了大數(shù)據(jù)的商業(yè)機遇并果斷布局?v觀IBM近5年10億美元以上級別的大手筆收購多與如何有效處理大數(shù)據(jù)有關。2007年,IBM花費20億美元收購了商務智能軟件供應商Congnos;2009年7月,IBM斥資12億美元收購SPSS軟件,這是一家集數(shù)據(jù)整理、分析功能于一身的統(tǒng)計分析軟件;2010年9月,IBM以17億美元的代價將數(shù)據(jù)庫分析供應商Netezza收之麾下——自2005年以來,IBM投資160億美元進行了30次與大數(shù)據(jù)有關的收購。這一系列布局,為IBM業(yè)績帶來了穩(wěn)定高速的增長。2012年,IBM股價突破200美元大關,累計漲幅超過9%,3年之內股價翻了3倍。
同樣在搶占大數(shù)據(jù)蛋糕份額時占據(jù)先機的還有甲骨文。面對越來越多的海量數(shù)據(jù)所帶來的商業(yè)潛力,甲骨文的策略是在2011年的OpenWorld大會上推出了Oracle大數(shù)據(jù)機和Exalytics商務智能服務器,構建自己的大數(shù)據(jù)平臺解決方案。除此之外,早在2008年,甲骨文就花費33億美元收購商業(yè)智能解決方案提供商海波龍(Hyperion),2009年以74億美元巨資鯨吞另一家IT巨頭SUN公司。
而在大數(shù)據(jù)實時分析的領域中,SAP也不甘人后。2011年SAP推出了HANA平臺以應對大數(shù)據(jù)實時分析的挑戰(zhàn)。和IBM、甲骨文這些對手一樣,SAP也一直沒有停止通過大手筆的收購在大數(shù)據(jù)領域進行戰(zhàn)略布局。2007年,SAP花費68億美元收購全球商業(yè)智能軟件霸主Business Object,2010年5月,SAP以58億美元的代價并購數(shù)據(jù)庫廠商Sybase。圍繞著大數(shù)據(jù)的這些大手筆的戰(zhàn)略布局也讓SAP收到了回報,2011年,SAP全年利潤翻番,達到34億歐元,造就了該公司40年歷史上最好的業(yè)績。
此外,EMC、Informatica、Taredata等公司,也都是大數(shù)據(jù)領域不可忽略的勢力。