PowerCenter大數(shù)據(jù)版提供了一個創(chuàng)新且無需編碼的環(huán)境,確保企業(yè)圍繞諸如Hadoop等新型技術(shù),通過高速數(shù)據(jù)存入和提取、無編碼開發(fā)環(huán)境、虛擬數(shù)據(jù)機,以及在Hadoop上近乎通用的數(shù)據(jù)訪問和全面地提取、轉(zhuǎn)換和加載(ETL)來降低大數(shù)據(jù)項目的成本。

在近日的媒體見面會上,Informatica核心技術(shù)部資深產(chǎn)品管理總監(jiān)鄭瑋就大數(shù)據(jù)以及相關(guān)話題發(fā)表自己的看法。

BI依然保持旺盛需求

鄭瑋女士表示,BI經(jīng)歷幾年火熱發(fā)展以后,現(xiàn)在隨著大數(shù)據(jù)的出現(xiàn)企業(yè)對其依然保持著旺盛的需求。BI和ETL已經(jīng)形成了很好的競爭,以前BI是從數(shù)據(jù)倉庫中拿出數(shù)據(jù)來做分析,而現(xiàn)在,BI可以直接和Hadoop結(jié)合進行數(shù)據(jù)分析。

Hadoop和傳統(tǒng)數(shù)據(jù)庫配合使用

對于何時使用Hadoop,何時使用傳統(tǒng)數(shù)據(jù)庫,一直以來有一種傳統(tǒng)的說法:如果數(shù)據(jù)是非結(jié)構(gòu)的、半結(jié)構(gòu)的,就一定要使用Hadoop;如果是結(jié)構(gòu)的數(shù)據(jù),就要使用傳統(tǒng)數(shù)據(jù)庫。但是鄭瑋女士表示,其實兩種數(shù)據(jù)庫是可以交叉使用的。在使用的過程中,只需要考慮數(shù)據(jù)量,以及是否是新建項目。比如,很多客戶已經(jīng)花費大量費用建立了數(shù)據(jù)庫,而且具有良好的應(yīng)用效果,那么,就沒有必要換掉已經(jīng)使用的數(shù)據(jù)庫。如果是客戶要上馬新項目,就可以直接使用Hadoop。

硬件層面的數(shù)據(jù)分析

對于數(shù)據(jù)分析,現(xiàn)在不僅軟件在進步,硬件上面也在發(fā)展,現(xiàn)在有很多內(nèi)存的數(shù)據(jù)分析,對于那些沒有PB級別數(shù)據(jù)的企業(yè),可以選擇這種內(nèi)存的數(shù)據(jù)分析。Hadoop存放數(shù)據(jù)量很大,但數(shù)據(jù)是放在磁盤里的,數(shù)據(jù)分析速度會很慢,而把數(shù)據(jù)放到內(nèi)存去分析,速度將會非???,而且因為內(nèi)存相對來講價格低,所以還可以節(jié)約成本,現(xiàn)在很多公司喜歡用內(nèi)存作分析。

鄭瑋女士還表示,亞洲擁有自然的大數(shù)據(jù)問題,不僅是從人口,還是從地域方面來看,數(shù)據(jù)量都會很大,數(shù)據(jù)的復(fù)雜性也會很高。特別是在中國,各種各樣的大數(shù)據(jù)問題隨處可見,而且在中國大數(shù)據(jù)將會擁有更多的機會?;谶@種認(rèn)識,Informatica明年將會增加中國的銷售人員,并將更加關(guān)注中國市場。

分享到

hanrui

相關(guān)推薦