據(jù)了解,在開始的階段,DataZoo也是為了解決易用性和兼容性的問題,自己內(nèi)部使用的工具,用于支持公司的業(yè)務(wù)應(yīng)用。在使用中,這些工具得到了合作伙伴以及用戶的好評,這也最終促使榮之聯(lián)下決心以大數(shù)據(jù)平臺產(chǎn)品的方式對外提供服務(wù)。
從技術(shù)上說,DataZoo具有Hadoop平臺結(jié)構(gòu)的能力,可以為分布式是數(shù)據(jù)分析服務(wù)提供支持。在這個基礎(chǔ)之上,提供了批處理、實時流處理、多維搜索、圖計算和數(shù)據(jù)挖掘等功能模塊。其中,不同的功能模塊解決不用的問題,有的針對排序,有的針對流數(shù)據(jù)處理,總之,希望在易用性方面為行業(yè)用戶提供更多的支持。
以多維檢索為例,前面說過,有些用戶只熟悉SQL,要求系統(tǒng)能夠支持SQL方式查詢,另外就是多維檢索的性能問題,目前DataZoo能夠支持億萬數(shù)據(jù)規(guī)模秒級的響應(yīng)速度,在沒有緩存支持的情況下,80% 左右的查詢能夠在3秒返回,這樣的能力在業(yè)界首屈一指,處于領(lǐng)先的水平。
這些功能模塊透過和行業(yè)應(yīng)用結(jié)合,積累了豐富的行業(yè)應(yīng)用模型,如駕駛行為模型、碰撞分析模型、推薦模型、用戶畫像、文本分析分詞和情感分析模型,這些模型在實際行業(yè)應(yīng)用中積累了大量的知識點,這些知識點最終將會成為最為寶貴的財富。
?小結(jié)
大數(shù)據(jù)和人們的預(yù)期還有很大的距離,這不完全是技術(shù)問題,類似電腦在普及階段被作為打字機使用,但這是一個好的開端,隨著技術(shù)水平的提升,技術(shù)效果將逐步顯現(xiàn)出來。從另外一個角度看,冬天也意味著春天并不遙遠,可以預(yù)計, 數(shù)據(jù)動物園春天并不遙遠。