相較于去年大談磁盤備份的優(yōu)點??可為企業(yè)節(jié)省搜索恢復(fù)近期文件的時間,進(jìn)而達(dá)到數(shù)據(jù)生命周期管理(ILM, Information Lifecycle Management)的希望;今年存儲廠商對于磁盤備份技術(shù)的看法顯然更為實際,在今年企業(yè)數(shù)據(jù)量首度超越存儲空間之際,包括了EMC和NetApp兩大存儲廠商,都提出重復(fù)數(shù)據(jù)刪除(Data De-duplication)技術(shù)的重要性,并表示其最大優(yōu)點,即在于縮減備份窗口時間以及節(jié)省后端的磁帶備份空間。
所謂的重復(fù)數(shù)據(jù)刪除技術(shù),就是指掃描生產(chǎn)數(shù)據(jù)服務(wù)器(production)磁盤數(shù)據(jù),判斷數(shù)據(jù)是否為“重復(fù)”或“冗余”。原理是以算法切割磁盤里的數(shù)據(jù)成為區(qū)塊(Block)或是區(qū)段(Segment),并為每一個分割單位求出一個特征值(unique ID),即可以代表此區(qū)塊的數(shù)據(jù)。
通過這個特征值,系統(tǒng)就可以比對硬盤中已有數(shù)據(jù)新寫入數(shù)據(jù)之間,是否具有相同之處。若是一致,即代表這筆數(shù)據(jù)為重復(fù)寫入,系統(tǒng)便只會為這份數(shù)據(jù)留下一個索引(index),而不會重復(fù)存儲占有磁盤空間。換言之只有特征值不同的數(shù)據(jù)才會被實際寫入硬盤。
有趣的是,由于重復(fù)數(shù)據(jù)刪除技術(shù)為新興技術(shù),因此提供這些技術(shù)的反而都不是業(yè)界的領(lǐng)先存儲廠商,而是諸如Asigra、Avamar、Data Domain與Rocksoft等這類新興公司。
不過通過收購Avamar,EMC也取得了這項技術(shù),并表示為該公司今年重點,EMC資深產(chǎn)品營銷經(jīng)理李百飛說。該公司指出,前者能將每日備份資料量減300倍,備份時間則可減少至十分之一。對于擁有5TB以上的備份數(shù)據(jù)量、集中在檔案等非結(jié)構(gòu)性數(shù)據(jù)的企業(yè)尤其適用。
Avamar強(qiáng)調(diào)的是全局性的重復(fù)數(shù)據(jù)刪除,也就是在數(shù)據(jù)產(chǎn)出時,即比對前者是否已經(jīng)存在備份磁盤中,僅備份差異部分。即使企業(yè)的遠(yuǎn)程辦公室的存儲數(shù)據(jù),也可以進(jìn)行對比。
“這對目前企業(yè)已經(jīng)有將近七成的數(shù)據(jù)并非存在數(shù)據(jù)中心的現(xiàn)況,特別適用,”李百飛說。
不過Avamar的價格比較昂貴,通常需要花費幾百萬。因此EMC目前針對的目標(biāo)用戶都是一些大型企業(yè)或機(jī)構(gòu),諸如醫(yī)療、IC設(shè)計業(yè)者。
NetApp也在日前宣布推出重復(fù)數(shù)據(jù)刪除技術(shù) ?NetApp A-SIS (Advanced-Single Instance Storage;不重復(fù)單元存儲系統(tǒng)),適用于其NetApp NearStore和FAS存儲系統(tǒng)。表示前者讓用戶能比傳統(tǒng)模式節(jié)省高達(dá)20倍的空間,而且隨著時間的推移可能達(dá)到更大的壓縮比。
“重復(fù)數(shù)據(jù)刪除技術(shù)能讓企業(yè)用戶正視到磁盤備份的價值所在,”NetApp資深技術(shù)顧問姜群說。他表示雖然磁盤價格已經(jīng)大幅下滑,但是由于成本仍和磁帶有一段差距,導(dǎo)致迄今部分企業(yè)用戶仍未大舉采用磁盤。數(shù)據(jù)重復(fù)刪除技術(shù)則能凸顯磁盤備份較磁帶備份的強(qiáng)項。