Internet Research Group發(fā)布的調(diào)查數(shù)據(jù)顯示了未來(lái)數(shù)年中,Hadoop存儲(chǔ)與常規(guī)存儲(chǔ)方式的數(shù)據(jù)量對(duì)比

富有挑戰(zhàn)性的網(wǎng)絡(luò)容量

所有數(shù)據(jù)都需要捕捉、存儲(chǔ)、處理和分發(fā),而這一過(guò)程很有可能會(huì)堵塞網(wǎng)絡(luò)。在Hadoop的管理之下,每PB的大數(shù)據(jù)都需要0.5 Gbps的帶寬以進(jìn)行傳輸。

在Internet Research Group的報(bào)告中,涵蓋了如下主要趨勢(shì):

更便宜的存儲(chǔ)定價(jià)。傳統(tǒng)數(shù)據(jù)存儲(chǔ)的費(fèi)用是每GB 5美元,而在同樣容量下,Hadoop的成本是0.25美元。

增強(qiáng)的可擴(kuò)展性。 Hadoop使企業(yè)能夠用很少的成本為此前購(gòu)買(mǎi)的存儲(chǔ)添加額外的存儲(chǔ)空間。 Hadoop的可擴(kuò)展性,將會(huì)使得未來(lái)五年內(nèi)50%以上的數(shù)據(jù)都存儲(chǔ)在Hadoop環(huán)境中。

對(duì)未捕捉數(shù)據(jù)的分析。在大數(shù)據(jù)以外的領(lǐng)域,只有1%至5%的數(shù)據(jù)部署為用戶所分析。因此,大數(shù)據(jù)的存在價(jià)值正在于那些沒(méi)有經(jīng)過(guò)分析的市場(chǎng)。麥肯錫最 近報(bào)道了一個(gè)醫(yī)療保健行業(yè)的案例,這一機(jī)構(gòu)近期分析了95%的未捕獲的數(shù)據(jù),預(yù)計(jì)這些數(shù)據(jù)每年的價(jià)值約為300億美元。缺乏數(shù)據(jù)分析的一個(gè)反例是石油工 業(yè),某石油公司只使用其所產(chǎn)生信息的5%。

該報(bào)告認(rèn)為,用戶正在部署Hadoop集群來(lái)作為一個(gè)集中服務(wù),使獨(dú)立站點(diǎn)不用建立和運(yùn)行自己的設(shè)備,“越大越好”,這是未來(lái)處理批處理工作負(fù)載的一個(gè)方向。

因此,基于以上內(nèi)容,我們可以得出結(jié)論,Big Data必將引發(fā)Big Traffic(大流量),特別是在數(shù)據(jù)中心和數(shù)據(jù)中心之間。數(shù)據(jù)遷移,包括但不限于復(fù)制和同步,將成為特別重要的內(nèi)容。這正是由于Hadoop在企業(yè)存儲(chǔ)中的風(fēng)靡所引發(fā)的潮流。大流量的數(shù)據(jù)遷移服務(wù)能夠支持大數(shù)據(jù)分析,合規(guī)性要求,高可用性服務(wù)和安全服務(wù)。

分享到

wangzhen

相關(guān)推薦