CDP (Cloudera Data Platform) 是一個面向IT、業(yè)務(wù)大數(shù)據(jù)平臺,可支持公有云平臺,也可構(gòu)建私有云平臺,付諸元數(shù)據(jù)管理、安全、加密等治理手段,可以實現(xiàn)混合云數(shù)據(jù)應(yīng)用,這也是為什么Cloudera自稱混合云服務(wù)提供商的原因。
需要稍加說明的是,這里的混合云不是針對IaaS,而是針對上層的數(shù)據(jù)創(chuàng)新應(yīng)用,不要混為一談。
對比數(shù)據(jù)中臺和智能湖倉
就像武林有宗派分別一樣,目前數(shù)據(jù)市場市場可以大致分為數(shù)據(jù)中臺、大數(shù)據(jù)、智能湖倉等生態(tài),每個生態(tài)都有自己的開發(fā)者擁躉粉絲。
與其他技術(shù)方案相比,大數(shù)據(jù)平臺有什么優(yōu)勢嗎?
劉隸放表示會:所謂數(shù)據(jù)中臺,其實就是一種數(shù)據(jù)治理,考慮到業(yè)務(wù)中臺,數(shù)據(jù)中臺可以做的事情,可能更高一些,業(yè)務(wù)中臺對應(yīng)數(shù)據(jù)中臺,數(shù)據(jù)中臺服務(wù)于業(yè)務(wù)中臺,大致是這樣的一種思想。
目前“數(shù)據(jù)治理”經(jīng)常是要一把手工程,從零開始,強調(diào)業(yè)務(wù)、數(shù)據(jù)要解耦,這是數(shù)據(jù)中臺的初衷!如今,CDP平臺上提供有源數(shù)據(jù)治理工具,有SDX組件能夠幫助數(shù)據(jù)治理,這是很好契合點。
對于智能湖倉,劉隸放表示:智能湖倉主要由數(shù)據(jù)湖、數(shù)據(jù)倉庫兩部分組成,其中,數(shù)據(jù)倉庫是把原來平臺的數(shù)據(jù)拿出來,經(jīng)過加工成為數(shù)據(jù)倉庫用的數(shù)據(jù)模型,數(shù)據(jù)會有一些轉(zhuǎn)換;相比,數(shù)據(jù)湖是把數(shù)據(jù)從外面“撈”進(jìn)來,呈現(xiàn)一種原生態(tài)形式的存在,如果能夠提供比較好的算力,就可以輸出數(shù)據(jù)分析的結(jié)果,雖然沒有像數(shù)據(jù)倉庫這樣,可以基于精簡模型輸出結(jié)果,但也可以忍受的時間內(nèi)。
從現(xiàn)有市場應(yīng)用的規(guī)模看,如果數(shù)據(jù)倉庫服務(wù)器的用量是數(shù)百臺,那么大數(shù)據(jù)分析平臺集群規(guī)模會達(dá)到數(shù)千臺,這意味著90%數(shù)據(jù)其實是在大數(shù)據(jù)平臺,幾乎是企業(yè)全量數(shù)據(jù),因此規(guī)模上的區(qū)分,會決定未來不同技術(shù)未來的走向。
小結(jié)
各種技術(shù)之間并不是涇渭分明的存在,而是一種你中有我,我中有你的現(xiàn)狀。從產(chǎn)品形態(tài)看,有開源產(chǎn)品形式,也有云服務(wù)的形式,并且產(chǎn)品和云服務(wù)也存在轉(zhuǎn)換,Cloudera可以服務(wù)混合云,公有云也可以進(jìn)行私有化部署,但是無論如何,他們都服務(wù)于同一個目標(biāo),數(shù)據(jù)創(chuàng)新。
不管黑貓白貓,抓住耗子就是好貓!