大數(shù)據(jù)也有“社交圈”?
劉杰 發(fā)表于:12年04月23日 09:29 [轉(zhuǎn)載] 至頂網(wǎng)
社交,無處不在,連大數(shù)據(jù)都有了自己的“社交圈”?
正在“大數(shù)據(jù)之旅”中有條不紊行進(jìn)的EMC,發(fā)布了一款類似于Facebook的大數(shù)據(jù)社交和協(xié)作工具——Greenplum Chorus,讓我們看到了它大數(shù)據(jù)戰(zhàn)略的第二個重要階段:大數(shù)據(jù)的社交化。這是什么意思?
事實(shí)上,EMC Greenplum在去年提出了針對大數(shù)據(jù)的“統(tǒng)一分析平臺”(Unified Analytics Platform)概念,其中包括三個重要元素:用于結(jié)構(gòu)化數(shù)據(jù)分析的MPP數(shù)據(jù)庫——Greenplum Database,針對企業(yè)級非結(jié)構(gòu)化數(shù)據(jù)的Hadoop平臺——Greenplum HD,第三個就是大數(shù)據(jù)社交平臺Greenplum Chorus。
最新發(fā)布的Greenplum Chorus被冠以“中國制造”的頭銜,是因?yàn)镃horus產(chǎn)品從想法產(chǎn)生、市場需求收集、產(chǎn)品基礎(chǔ)研究、后期測試和開發(fā),再到中國和全球的市場推廣,都是由中國團(tuán)隊(duì)主導(dǎo)的,而且“Chorus是全世界第一個基于協(xié)作分析的大數(shù)據(jù)平臺的協(xié)作分析平臺”,包括個人沙盒、數(shù)據(jù)發(fā)掘、協(xié)作分析、開放架構(gòu)這四個重要功能。
“Chorus”的中文意思是“合唱團(tuán)”,生動地說明Greenplum C
horus是一個統(tǒng)一協(xié)作的社交工具,不僅包括結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的處理,而且還有數(shù)據(jù)平臺管理員、數(shù)據(jù)庫管理員、數(shù)據(jù)庫學(xué)家、分析師、工程師等等這樣一個團(tuán)隊(duì)的協(xié)作與分工。
EMC“大數(shù)據(jù)之旅”三步曲
這也呼應(yīng)了EMC大數(shù)據(jù)三步曲的第二步——數(shù)據(jù)科學(xué)協(xié)作和自助服務(wù),也就是社交化的階段。大數(shù)據(jù)讓數(shù)據(jù)科學(xué)家與IT、業(yè)務(wù)部門之間的界面被打破,創(chuàng)造一個可以分享信息和數(shù)據(jù)分析結(jié)果的社交平臺,于是Greenplum Chorus應(yīng)需而生。
注意EMC在這里提出了一個新的角色概念——“數(shù)據(jù)科學(xué)家”,隨后這個話題也在筆者的微博上引起了熱烈的討論。在EMC看來,大數(shù)據(jù)的出現(xiàn)觸發(fā)了 IT角色的轉(zhuǎn)型,“數(shù)據(jù)科學(xué)家”的出現(xiàn)是一種必然,Ta應(yīng)該是“具備數(shù)學(xué)計算北京,懂得數(shù)據(jù)庫支持,擁有商業(yè)智能經(jīng)驗(yàn),了解企業(yè)業(yè)務(wù)”的人,是數(shù)據(jù)團(tuán)隊(duì)中的“尖兵”。
實(shí)際上現(xiàn)在EMC自己已經(jīng)擁有一批數(shù)據(jù)科學(xué)家,利用EMC的產(chǎn)品工具幫助客戶分析海量數(shù)據(jù)在醫(yī)療、衛(wèi)生、電信、氣象和海洋等領(lǐng)域的價值,讓數(shù)據(jù)煥發(fā)生命力。
如果說數(shù)據(jù)科學(xué)家、數(shù)據(jù)平臺管理員、業(yè)務(wù)智能分析師、業(yè)務(wù)線用戶正在形成一個大數(shù)據(jù)團(tuán)隊(duì),那么Greenplum Chorus就是讓這些角色發(fā)揮作用的舞臺,同時第三方或者合作伙伴也可以整合到這個開放的系統(tǒng)中
據(jù)EMC中國卓越研發(fā)集團(tuán)資深產(chǎn)品經(jīng)理莊富任介紹,Greenplum Chorus已經(jīng)開始在客戶那里進(jìn)行beta測試,每個星期研發(fā)團(tuán)隊(duì)都會根據(jù)beta客戶的需求反饋,跟進(jìn)提出一個新的版本。
采訪中,莊富任舉了一個電子商務(wù)beta客戶的例子,該客戶的數(shù)據(jù)庫已經(jīng)達(dá)到了5TB并且在不斷增長,高昂的成本使他們無法保存一些如登錄記錄和消費(fèi)習(xí)慣甚至是微博信息的非結(jié)構(gòu)化數(shù)據(jù)。在EMC的推薦下,這家電商客戶使用Hadoop作為基礎(chǔ)存儲架構(gòu),保存這些非結(jié)構(gòu)化數(shù)據(jù)的同時并將其轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),二者結(jié)合起來利用Greenplum Chorus在進(jìn)一步做數(shù)據(jù)分析得到最后的分析結(jié)果。
EMC看到了開放性平臺的重要性,尤其是對Greenplum Chorus來說,除了提供更廣的整合環(huán)境之外,能否納入第三方的數(shù)據(jù)也十分關(guān)鍵,因此EMC會在2012年下半年通過開源證書發(fā)布Greenplum Chorus源代碼。
EMC Greenplum數(shù)據(jù)計算事業(yè)部總經(jīng)理劉偉光表示:“Greenplum整個家族走的是面向開源技術(shù)發(fā)展的思路,Greenplum Chorus的發(fā)布降低了數(shù)據(jù)分析的門檻,讓更多人根據(jù)需求挖掘并分析數(shù)據(jù)。”
昨天的發(fā)布會上,EMC Greenplum Chorus研發(fā)團(tuán)隊(duì)在媒體前的集體亮相。EMC中國卓越研發(fā)集團(tuán)的增長很大一部分也是來自于大數(shù)據(jù),例如Greenplun在被收購的一年半時間內(nèi),整個卓越研發(fā)集團(tuán)在做大數(shù)據(jù)相關(guān)的技術(shù)研究、產(chǎn)品研發(fā)、測試以及市場推廣的團(tuán)隊(duì),加在一起已經(jīng)有超過一百名研發(fā)工程師在為大數(shù)據(jù)和大數(shù)據(jù)相關(guān)的工作努力工作
公司簡介 | 媒體優(yōu)勢 | 廣告服務(wù) | 客戶寄語 | DOIT歷程 | 誠聘英才 | 聯(lián)系我們 | 會員注冊 | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.