據了解,在開始的階段,DataZoo也是為了解決易用性和兼容性的問題,自己內部使用的工具,用于支持公司的業(yè)務應用。在使用中,這些工具得到了合作伙伴以及用戶的好評,這也最終促使榮之聯下決心以大數據平臺產品的方式對外提供服務。
從技術上說,DataZoo具有Hadoop平臺結構的能力,可以為分布式是數據分析服務提供支持。在這個基礎之上,提供了批處理、實時流處理、多維搜索、圖計算和數據挖掘等功能模塊。其中,不同的功能模塊解決不用的問題,有的針對排序,有的針對流數據處理,總之,希望在易用性方面為行業(yè)用戶提供更多的支持。
以多維檢索為例,前面說過,有些用戶只熟悉SQL,要求系統(tǒng)能夠支持SQL方式查詢,另外就是多維檢索的性能問題,目前DataZoo能夠支持億萬數據規(guī)模秒級的響應速度,在沒有緩存支持的情況下,80% 左右的查詢能夠在3秒返回,這樣的能力在業(yè)界首屈一指,處于領先的水平。
這些功能模塊透過和行業(yè)應用結合,積累了豐富的行業(yè)應用模型,如駕駛行為模型、碰撞分析模型、推薦模型、用戶畫像、文本分析分詞和情感分析模型,這些模型在實際行業(yè)應用中積累了大量的知識點,這些知識點最終將會成為最為寶貴的財富。
?小結
大數據和人們的預期還有很大的距離,這不完全是技術問題,類似電腦在普及階段被作為打字機使用,但這是一個好的開端,隨著技術水平的提升,技術效果將逐步顯現出來。從另外一個角度看,冬天也意味著春天并不遙遠,可以預計, 數據動物園春天并不遙遠。