英特爾亞太研發(fā)有限公司總經(jīng)理、軟件與服務(wù)事業(yè)部中國(guó)區(qū)總經(jīng)理何京翔博士

信息是二十一世紀(jì)的石油

何京翔表示,信息成為21世紀(jì)的石油,這確實(shí)是非常好的比喻。石油剛剛開采出來的時(shí)候,原油的價(jià)值并不是那么高。一百多年前,石油作為一種累贅,沒有人很好地利用起來,直到我們把石油變成化學(xué)品,變成汽油的時(shí)候才真正體現(xiàn)出價(jià)值。大數(shù)據(jù)同樣的,僅僅是存儲(chǔ)起來,而不利用起來并沒有價(jià)值,必須通過分析和處理才能體現(xiàn)它的價(jià)值。

在中國(guó)市場(chǎng)上,大數(shù)據(jù)哪些機(jī)遇?何京翔表示,中國(guó)市場(chǎng)上有很好的機(jī)遇。2012年6月的數(shù)據(jù)顯示,中國(guó)有將近3.9億的移動(dòng)客戶、5.3億的互聯(lián)網(wǎng)客戶,市場(chǎng)的推動(dòng)和政府的推動(dòng),在一個(gè)比較典型的智能城市的應(yīng)用中,每個(gè)季度就可能產(chǎn)生出200PB的視頻數(shù)據(jù),一個(gè)筆記本電腦假如是200G,就是一百萬個(gè)筆記本所能夠存儲(chǔ)的數(shù)據(jù),這就是200PB的概念。未來的醫(yī)療檔案也會(huì)產(chǎn)生海量的數(shù)據(jù)。所有這些數(shù)據(jù)不能用傳統(tǒng)方法處理,需要有新的思考、新的作為。

數(shù)據(jù)量、速度、多樣化、價(jià)值,這四個(gè)方面的特性決定了大數(shù)據(jù)和傳統(tǒng)數(shù)據(jù)時(shí)代有本質(zhì)的區(qū)別,因此需要新的方法解決問題。

它僅僅是個(gè)技術(shù)問題嗎?當(dāng)然不是。英特爾有一個(gè)非常好的傳統(tǒng)——把技術(shù)變成一種生態(tài)環(huán)境、變成一種解決方案的,變成真正能夠產(chǎn)生出商業(yè)價(jià)值的商業(yè)模式。所以英特爾在考慮大數(shù)據(jù)的時(shí)候,不僅是在新技術(shù)上有創(chuàng)新,同時(shí)在人員培訓(xùn)、生態(tài)系統(tǒng)的構(gòu)造以及最佳實(shí)踐,怎么樣提供大數(shù)據(jù)的解決案例方面有全盤的考慮。同時(shí)和商業(yè)伙伴合作,通過多贏的商業(yè)模式與大家一起把這個(gè)盤子做大。

英特爾大數(shù)據(jù)領(lǐng)域四大舉措

作為IT行業(yè)的領(lǐng)頭羊,英特爾在大數(shù)據(jù)方面有什么具體舉措呢?何京翔分享了英特爾在大數(shù)據(jù)領(lǐng)域所做的四個(gè)方面的工作。

首先,從英特爾產(chǎn)品線上,包括CPU、存儲(chǔ)、內(nèi)存的技術(shù),正在考慮怎么樣使得新一代的系統(tǒng)架構(gòu),以及數(shù)據(jù)中心的解決方案更適合大數(shù)據(jù)的要求。

另一方面,我們知道大數(shù)據(jù)不僅僅是在硬件上能夠有多少I/O、處理速度多快,更重要的是軟件,怎么提供優(yōu)化的軟件工具,提供優(yōu)化的中間件,包括Hadoop。

第三方面,構(gòu)造健康的生態(tài)系統(tǒng)。大數(shù)據(jù)時(shí)代因?yàn)閿?shù)據(jù)的性質(zhì)和過去完全不一樣,需要新的有ISV,以及不同行業(yè)的特定解決方案,所以構(gòu)建生態(tài)系統(tǒng)方面,特別是和中國(guó)的合作伙伴進(jìn)行合作方面,我們已經(jīng)有了很多有益的嘗試。

第四方面,大數(shù)據(jù)領(lǐng)域的投資。未來還要考慮,我們現(xiàn)在有英特爾投資,包括今年年初我們和直真科技的合作,它是一家電信集成商,合作的內(nèi)容就包括了大數(shù)據(jù),我們希望在中國(guó)市場(chǎng)通過投資的手段構(gòu)建我們的生態(tài)系統(tǒng)。

英特爾Hadoop發(fā)行版的特點(diǎn)

Hadoop的優(yōu)化方面,除了硬件系統(tǒng)的優(yōu)化,英特爾還在軟件方面,特別是Hadoop系統(tǒng)方面做了優(yōu)化。英特爾以開源為基礎(chǔ),在Hadoop系統(tǒng),包括Hbase、HDFS里面都做了增強(qiáng)和優(yōu)化,使得開源平臺(tái)在英特爾的硬件上的運(yùn)行效率得到顯著的提高。

此外,Hadoop如果只是開源的,在配置、安裝、報(bào)表的監(jiān)控和管理上都沒有很好的工具,這就會(huì)導(dǎo)致Hadoop的部署很方便,不適合企業(yè)和具體的行業(yè)應(yīng)用,為此英特爾專門做了Intel Hadoop Manager2.0,現(xiàn)在有了Hadoop的發(fā)行版。

圖 英特爾Hadoop Manager 2.0發(fā)行版 幫助企業(yè)進(jìn)行Hadoop的安裝、部署、監(jiān)控、警告和訪問控制

Hadoop發(fā)行版有什么特點(diǎn)呢?何京翔介紹道,Hadoop本身是批處理的方式來做的,這個(gè)發(fā)行版做了優(yōu)化,它的處理能力達(dá)到了接近于實(shí)時(shí)的。

所謂的實(shí)時(shí)系統(tǒng)是指能夠根據(jù)數(shù)據(jù)的反饋,用幾秒鐘反饋的系統(tǒng),這是實(shí)時(shí)控制系統(tǒng)。大部分?jǐn)?shù)據(jù)處理系統(tǒng)都是批處理系統(tǒng)或者非實(shí)時(shí)處理系統(tǒng),通過對(duì)Hadoop的優(yōu)化,可以把擬數(shù)據(jù)采集到數(shù)據(jù)處理縮短到近于實(shí)時(shí)處理,這是優(yōu)化的結(jié)果。

另一方面,Hadoop發(fā)行版還在英特爾的硬件上性能做了優(yōu)化,通過我們的優(yōu)化使得它在英特爾平臺(tái)上的性能會(huì)成倍增長(zhǎng)。

此外,Hadoop發(fā)行版還根據(jù)中國(guó)市場(chǎng)的應(yīng)用特點(diǎn)進(jìn)行了一些優(yōu)化。何京翔表示,通過和中國(guó)的一些客戶的合作,包括電信系統(tǒng)的、智能城市的、醫(yī)療的,我們進(jìn)行深入的合作,根據(jù)用戶的用戶,根據(jù)中國(guó)市場(chǎng)的應(yīng)用特點(diǎn)做了一些行業(yè)優(yōu)化。

英特爾大數(shù)據(jù)戰(zhàn)略:打造端到端的大數(shù)據(jù)解決方案

何京翔強(qiáng)調(diào),僅僅做到硬件的端到端的覆蓋,并不能自動(dòng)帶來我們對(duì)客戶的價(jià)值。所以英特爾在Hadoop這樣對(duì)數(shù)據(jù)挖掘、存儲(chǔ)、轉(zhuǎn)換、分析的軟件分析方面也做了相應(yīng)的工作,所以英特爾的定位是做大數(shù)據(jù)發(fā)掘中間件,并有自己的一套解決方案。

CPU產(chǎn)品方面,英特爾已經(jīng)真正做到了端到端的覆蓋。大數(shù)據(jù)的解決方案包括數(shù)據(jù)的采集、包括攝像頭、AVI、嵌入式的設(shè)備、傳統(tǒng)的筆記本電腦、PAD、智能手機(jī),這是傳統(tǒng)的或者已經(jīng)用的數(shù)據(jù)采集和數(shù)據(jù)傳輸?shù)脑O(shè)備,這些設(shè)備很多都用到了英特爾的處理器。在采集完之后,首先要經(jīng)過一層預(yù)處理,需要在邊緣服務(wù)器進(jìn)行一些處理,然后送到后臺(tái),預(yù)處理可以用Atom或者Xeon。然后把數(shù)據(jù)傳輸?shù)胶笈_(tái)數(shù)據(jù)中心,而數(shù)據(jù)中心的服務(wù)器,包括傳輸過程中的交換機(jī)、存儲(chǔ)都會(huì)用到英特爾的Xeon處理器。

軟件方面,英特爾通過Hadoop的軟件包能夠提供對(duì)平臺(tái)優(yōu)化過的軟件和服務(wù),并對(duì)分析工具和用戶界面上有面向不同行業(yè)的定制化的分析和解決方案。

在應(yīng)用層面,通過和合作伙伴的合作,也通過在硬件上的支持,比如說可視化上能夠做到更好的可視,展示大數(shù)據(jù)分析的結(jié)果。

在研發(fā)層面,英特爾對(duì)不同的行業(yè)有不同的基準(zhǔn)研究,對(duì)Hadoop在不同行業(yè)的應(yīng)用怎么進(jìn)行分析,怎么提高使用性能,英特爾專門有軟件院來進(jìn)行研究。

最后,英特爾軟件與服務(wù)部門合作共同構(gòu)建基于英特爾Hadoop的解決方案。

分享到

tangrong

相關(guān)推薦