與IBM、EMC、富士通、Intel等先后推出Hadoop發(fā)行版不同,Vmware更專注于基礎(chǔ)架構(gòu)層面。在一場(chǎng)2000余人到場(chǎng)的VMware & EMC大數(shù)據(jù)云高峰論壇上,VMware公司大中華區(qū)總裁宋家瑜表示,云的平臺(tái)才是唯一能解決爆炸性大數(shù)據(jù)使用的需求,把關(guān)鍵應(yīng)用移到云平臺(tái)已經(jīng)是一個(gè)必然趨勢(shì)。
Vmware之道:從vHadoop到GemFire
在介紹數(shù)據(jù)管理技術(shù)《從數(shù)據(jù)庫(kù)到數(shù)據(jù)云 虛擬化與開源搭橋》五大趨勢(shì)之后,VMware全球高級(jí)副總裁范承工表示,傳統(tǒng)數(shù)據(jù)庫(kù)技術(shù)hold不住一些這樣的應(yīng)用:海量數(shù)據(jù)的需求,實(shí)時(shí)數(shù)據(jù)的需求,和靈活數(shù)據(jù)的需求。Vmware和EMC一道,致力于在vsphere云平臺(tái)之上提供面向這些應(yīng)用的整體解決方案。
Hadoop由于其低成本和高擴(kuò)展性的優(yōu)勢(shì),成為各大廠商處理海量數(shù)據(jù)的法寶,但虛擬基礎(chǔ)架構(gòu)云上的Hadoop,存在可靠性問題。根據(jù)阿帕奇Virtual Hadoop wiki文檔給出的結(jié)論,可以將Hadoop帶到云基礎(chǔ)架構(gòu)上,但物理和虛擬基礎(chǔ)設(shè)施之間的差異可能危及數(shù)據(jù)完整性和安全性。
現(xiàn)在,VMware開源項(xiàng)目Serengeti試圖改變這個(gè)問題。該項(xiàng)目將允許企業(yè)在云端和虛擬環(huán)境中,在 vSphere 上部署和管理Hadoop。
范承工介紹,Serengeti將Hadoop在虛擬基礎(chǔ)架構(gòu)的部署時(shí)間從很多天縮短到10分鐘,同時(shí)還能夠提高硬件的利用率,能夠滿足多租戶的需求,有更好的安全隔離,也有更好的伸縮性。Vmware還介紹,通過 vSphere,Hadoop應(yīng)用如果節(jié)點(diǎn)失敗能夠自動(dòng)重啟。