賽門鐵克估計,將重復數(shù)據(jù)刪除用于數(shù)據(jù)中心、虛擬環(huán)境以及遠程辦公室能夠降低日常備份帶寬500倍左右,降低備份的總存儲消耗量10到50倍。
重復數(shù)據(jù)刪除的技術(shù)特點
從根本上講,重復數(shù)據(jù)刪除能在子文件夾或攔截層級從所有的備份數(shù)據(jù)中查找出冗余備份數(shù)據(jù),從而幫助企業(yè)減少備份所需的存儲空間。
重復數(shù)據(jù)刪除的過程可以通過軟件或硬件兩種方式完成。通過軟件方式,企業(yè)使用者能夠在數(shù)據(jù)被發(fā)送到備份前刪除客戶端的重復數(shù)據(jù)這,節(jié)省帶寬和存儲。硬件方法則可讓企業(yè)使用者在數(shù)據(jù)被寫入目標磁盤位置前刪除重復數(shù)據(jù),大幅減少存儲占用。
提高存儲利用率
專家分析,與傳統(tǒng)磁帶備份相比,重復數(shù)據(jù)刪除可以使整體備份存儲利用率降低10到50倍。存儲優(yōu)化程度取決于數(shù)據(jù)類型、數(shù)據(jù)變更率以及保存時間。傳統(tǒng)辦公文件類型是優(yōu)化的主要對象,壓縮數(shù)據(jù)格式,例如音頻、視頻以及醫(yī)療影像等的優(yōu)化則相對較少。
降低帶寬
重復數(shù)據(jù)刪除技術(shù)可通過降低在不同站點之間傳送大量數(shù)據(jù)帶寬需求增強虛擬系統(tǒng)的災難恢復能力。
初始完整整形備份將全部數(shù)據(jù)通過網(wǎng)絡發(fā)送到備份應用后,備份應用會把這些數(shù)據(jù)導向存儲介質(zhì)資源(通常是能夠進行壓縮或重復數(shù)據(jù)刪除的磁帶或磁盤)。憑借客戶端重復數(shù)據(jù)刪除,安裝在系統(tǒng)上的代理能消除在網(wǎng)絡中移動的多余數(shù)據(jù)。一般來說,通過安裝了重復數(shù)據(jù)刪除的系統(tǒng)進行初始完整備份,所需帶寬要比原先少4倍左右。
傳統(tǒng)備份方法通常要求進行后繼完整備份,這就需要占用大量的帶寬。而客戶端重復數(shù)據(jù)刪除能夠降低后繼完整備份的帶寬需求,使其大小僅為原先的1%。
在增量備份中,由于重復數(shù)據(jù)刪除技術(shù)僅就發(fā)生變化或修改的文件進行備份(傳統(tǒng)整形備份對整個文件進行備份),因?qū)捓寐实奶岣哌_12倍左右。
與壓縮的區(qū)別
盡管這兩種技術(shù)都能夠減少備份數(shù)據(jù)的大小,但是這兩種方法的流程和結(jié)果卻有很大不同。壓縮只能夠降低需要處理的數(shù)據(jù)大小卻,而重復數(shù)據(jù)刪除則能夠覆蓋隱藏數(shù)據(jù),辨識不同目錄下的相同文件、數(shù)據(jù)變更并在子文件層級捕獲唯一不同的攔截,從而影響到存儲這些數(shù)據(jù)的空間。
重復數(shù)據(jù)刪除的部署與應用
重復數(shù)據(jù)刪除部署取決于用戶的企業(yè)環(huán)境和恢復需求?;谲浖闹貜蛿?shù)據(jù)刪除能夠降低帶寬消耗并優(yōu)化存儲利用率,適用于帶寬和生產(chǎn)力有限的企業(yè)環(huán)境,尤其是遠程站點、服務器分散的中型站點、或是虛擬服務器環(huán)境。如果備份流程中的帶寬限制問題不大,與數(shù)據(jù)中心環(huán)境的狀況相同,企業(yè)會更傾向于選擇部署基于目標的重復數(shù)據(jù)刪除系統(tǒng),因為這種方式需要對現(xiàn)有備份架構(gòu)做出的改變最少。
在部署方案上,企業(yè)用戶需要注意如下兩個方面。首先,并非所有類型的數(shù)據(jù)都適用于重復數(shù)據(jù)刪除,恢復點目標和恢復時間目標應當與數(shù)據(jù)保護方法相匹配,數(shù)據(jù)恢復要求應隨時間推移而變化。大量恢復點能夠更好地進行快照或持續(xù)數(shù)據(jù)保護,而高速恢復則能夠更好地進行快照或基于SAN的備份到高速磁盤上。其次,并非所有數(shù)據(jù)類型能夠進行重復數(shù)據(jù)刪除,尤其是音頻、圖片、或調(diào)查等壓縮過的文件格式。
企業(yè)考慮采用重復數(shù)據(jù)刪除技術(shù)的根本規(guī)則在于,將各種方案與恢復點目標以及恢復時間目標比對,根據(jù)收益和限制進行評估與篩選。
PureDisk 重復數(shù)據(jù)刪除技術(shù)
全新的 Veritas NetBackup 6.5平臺中體現(xiàn)了賽門鐵克的新一代數(shù)據(jù)保護理念,該平臺有助于應對管理挑戰(zhàn),能夠提供多種防護服務,跨越廣泛的操作系統(tǒng)、數(shù)據(jù)庫、應用程序和供應商存儲平臺,以端到端的方式對備份環(huán)境進行集中式管理并簡化最復雜備份環(huán)境的管理。與 NetBackup 相集成的NetBackup PureDisk是高度可伸縮的基于軟件的存儲系統(tǒng),核心正是靈活的重復數(shù)據(jù)刪除技術(shù),可提供強大功能。
PureDisk重復數(shù)據(jù)刪除技術(shù)可以部署到備份環(huán)境中的兩個不同環(huán)節(jié)。在備份流程的開始環(huán)節(jié),將 PureDisk 代理安裝在服務器,以部署該技術(shù);在備份流程末端,也就是當 NetBackup 介質(zhì)服務器將數(shù)據(jù)寫入磁盤時,無需使用代理就可以使用該技術(shù)。該技術(shù)可以將傳統(tǒng)基于網(wǎng)絡備份所占用的帶寬最多減少 500 倍,與基于磁帶的傳統(tǒng)備份方法相比,將備份存儲消耗減少 10 到 50 倍。將 PureDisk重復數(shù)據(jù)刪除技術(shù)集成到 NetBacku介質(zhì)服務器,可以減少與基于磁盤的數(shù)據(jù)保護相關的存儲成本支持靈活的災難恢復,減少備份映像的大小,并對將存儲在 PureDisk中的NetBackup數(shù)據(jù)復制到其他位置進行管理。NetBackup PureDisk的獨立解決方案使用基于客戶端的重復數(shù)據(jù)刪除技術(shù),為在遠程辦室、數(shù)據(jù)中心和虛擬環(huán)境中分布的數(shù)據(jù)提供帶寬使用率高、經(jīng)過優(yōu)化存儲的數(shù)據(jù)保護,與 NetBackup 相集成,將數(shù)據(jù)導出到磁帶并對PureDisk環(huán)境進行有效的備份。