▲云時代的大數(shù)據(jù)——VMware&EMC大數(shù)據(jù)云高峰論壇現(xiàn)場
對于首次公開提出云計算和大數(shù)據(jù)的融合,VMware覺得是很“自然的一步”,“雖然大數(shù)據(jù)本身是以數(shù)據(jù)形式存在,但大數(shù)據(jù)時代真正的到來離不開云計算的促進作用。以前我們都談虛擬化、云計算,當虛擬化進入到各種各樣的商務應用的時候,對虛擬化或者對云計算的框架最核心的沖擊便是對大數(shù)據(jù)應用的需求,所以如何在虛擬架構(gòu)上優(yōu)化大數(shù)據(jù)應用是很自然的一步。” VMware 全球副總裁、中國研發(fā)中心總經(jīng)理李嚴冰在接受采訪時說道。
▲VMware 全球副總裁、中國研發(fā)中心總經(jīng)理李嚴冰
正在產(chǎn)生的大數(shù)據(jù)帶來五大變化
大數(shù)據(jù)無疑是今年最熱門的話題,那么何為大數(shù)據(jù)?可以說大數(shù)據(jù)離我們并不遙遠,正如VMware全球高級副總裁范承工所說:“你發(fā)的一個微博、上傳的一段視頻,都是大數(shù)據(jù)。”隨著這些數(shù)據(jù)的大量爆發(fā),要對這些數(shù)據(jù)進行實時的存儲和分析處理,無疑是一項嚴峻的挑戰(zhàn)。
大數(shù)據(jù)快速產(chǎn)生,對數(shù)據(jù)分析的時效性要求非但沒有降低,反而更加苛刻,因為大數(shù)據(jù)中往往蘊藏著大量“商業(yè)價值”,要挖掘大數(shù)據(jù)中的“商業(yè)價值”,傳統(tǒng)的數(shù)據(jù)庫已經(jīng)顯得捉襟見絀,VMware認為當前數(shù)據(jù)庫正在出現(xiàn)五大趨勢,“首先從傳統(tǒng)的CRUD(即Create、Read、Update、 Delete)到現(xiàn)在的CRAP(即Create、Replicate、Append、Process);二是由于各種混合云的出現(xiàn),數(shù)據(jù)與應用綁定,導致企業(yè)無法掌控;三是使用者正在發(fā)生變化,下一代的數(shù)據(jù)分析需要遵循實時、平民化與可視性;四是在虛擬環(huán)境中,如何讓數(shù)據(jù)庫與數(shù)據(jù)云并存,并實現(xiàn)自動化管理;五是開源數(shù)據(jù)庫漸流行。”
虛擬化結(jié)合Hadoop VMware破解大數(shù)據(jù)
說到大數(shù)據(jù)的處理,就不得不提Hadoop,Hadoop已被公認為為存儲和處理大數(shù)據(jù)的主流工具,但是Hadoop海量分布式運算只是針對物理設備來開發(fā)的,并基于物理機來運行,并沒有針對虛擬機運行的版本,VMware首次將Hadoop內(nèi)核的功能遷移到虛擬機上。
談到虛擬化與Hadoop結(jié)合的初衷,李嚴冰表示:“Hadoop在大數(shù)據(jù)領(lǐng)域應用的前景非常廣泛,VMware虛擬化軟件在全球數(shù)據(jù)中心的部署量已達到60%,當前的所有的云計算解決方案幾乎都是以虛擬技術(shù)為基礎的,因此需要從虛擬化的角度去看應用,并支持所有的應用,包括大數(shù)據(jù)應用,我們也會針對虛擬平臺做更多的優(yōu)化。”
“通常的Hadoop只針對物理機進行了優(yōu)化,類似于物理機,我們把同樣的技術(shù)直接搬到虛擬機上,針對虛擬機運行環(huán)境對Hadoop開源技術(shù)專門進行一些優(yōu)化,同時我們這一技術(shù)也直接貢獻給Hadoop社區(qū)” 李嚴冰說道。
值的一提的是這個項目是VMware中國研發(fā)團隊創(chuàng)立的,包括從前期的技術(shù)實踐到后期產(chǎn)品的誕生,都離不開VMware中國團隊,因此也保障了 VMware大數(shù)據(jù)處理方案在中國的落地,關(guān)于產(chǎn)品研發(fā)的最新進展,李嚴冰介紹:“這個項目歷經(jīng)了兩年研發(fā),現(xiàn)在我們覺得大數(shù)據(jù)處理的商機比較成熟了,通過幾個月的時間就把它進入了一個項目化、產(chǎn)品化的階段。”
結(jié)合了VMware在虛擬化方面的優(yōu)勢和EMC在數(shù)據(jù)庫方面的優(yōu)勢,VMware在統(tǒng)一的vSphere虛擬化架構(gòu)之上,提供GemFire實時處理、GreenPlum交互處理及Hadoop批處理三種模式,滿足用戶的海量、快速及靈活的大數(shù)據(jù)處理需求,并為開發(fā)者、數(shù)據(jù)分析師、數(shù)據(jù)科學家和商務用戶提供數(shù)據(jù)分析及可視化的數(shù)據(jù)展示。
“通過對比 Hadoop和物理環(huán)境和虛擬環(huán)境運行,差別是非常小的,現(xiàn)在能夠接近物理環(huán)境。”李嚴冰補充道。此外,VMware還公布了一個大數(shù)據(jù)分析平臺 UAP(Universal Analytics Platform),其中包括Greenplum database、Hadoop和Chorus分析軟件,可以幫助客戶同時分析處理結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)。
開源開放 降低虛擬化門檻
目前,很多企業(yè)內(nèi)部并沒有完全實施虛擬化,甚至對一些企業(yè)而言,虛擬化仍處于試水階段,如何讓更多的中小企業(yè)接受虛擬化成為VMware面臨的重要課題,開源則提供了一條不錯的途徑。
幾年前,還很難將VMware和開源軟件聯(lián)系在一起,如今VMware多個項目都和開源息息相關(guān),其中包括對大數(shù)據(jù)的處理,“我們今年六月份推出了一個 Hadoop的一個自動部署和管理工序,就是一個開源式的軟件。深入到廣泛的公司產(chǎn)品,在中間層除了大數(shù)據(jù)處理之外,還有一個平臺即服務層,其中 VMware的Cloud Foundry項目也是一個完全基于開源的和開放的平臺,所以VMware正在朝這一個方向走。”李嚴冰如是說。
同時李嚴冰透露,VMware產(chǎn)品在開源方向的努力也希望給市場傳達一個信息,那就是VMware產(chǎn)品不一定只有大型企業(yè)才用的起,VMware希望其產(chǎn)品可以遍地開花。
盡管目前優(yōu)化Hadoop的一些項目是針對VMware的平臺,但是李嚴冰強調(diào),VMware很多的產(chǎn)品對平臺是保持中立的,并可以運行在非虛擬化的環(huán)境中。“我們還是一個開放式的公司,如果將Hadoop針對VMware虛擬化的開源優(yōu)化成果用于其他平臺的虛擬環(huán)境,這也是有可能的,但是無疑 VMware之間不同的產(chǎn)品會有更多的兼容性和更好的性能方面的優(yōu)化。”
支持Hadopp本身還只是第一步,VMware將來還將提供一些運行、管理的工具。李嚴冰介紹:“現(xiàn)在我們已經(jīng)推出針對Hadoop的產(chǎn)品,無論是從哪個角度,我們都會考慮如何對Hadoop在虛擬環(huán)境進行部署,這是一個主要的方向。”
為了打造開放互聯(lián)的云,VMware提出混合異構(gòu)云的概念,“我們的理念是如果是企業(yè)的云都是基于VMware的基礎、VMware的API,很容易就聯(lián)系起來了。”李嚴冰解釋道。同時VMware也一直在推動針對這方面的產(chǎn)品優(yōu)化。“異構(gòu)云的趨勢已經(jīng)非常明顯,VMware一直在進行這方面的考量,也肯定要解決這方面的問題,從VMware公司的定位,我們在不同的層面之間做很松的耦合,并允許用戶有自己的選擇。”李嚴冰最后補充道。