EMC Avamar重復數(shù)據(jù)刪除機制
EMC中文支持論壇 發(fā)表于:13年07月03日 00:49 [來稿] DOIT.com.cn
Avamar在備份數(shù)據(jù)時,對于重復數(shù)據(jù)的判斷是具有高度邏輯性的。判斷流程大致如下:
1. Avamar客戶機遍歷要備份的所有目錄,并與本地文件緩存作比較來判斷是否要備份的所有文件已經(jīng)在本地文件緩存中有了。如果文件已經(jīng)在本地緩存中有了,說明該文件之前已經(jīng)被備份過,屬于重復數(shù)據(jù),那么Avamar就不會再備份它。
2. 如 果本地文件緩存中沒有找到相匹配的文件,該文件會被分成多個可變長度的數(shù)據(jù)塊。數(shù)據(jù)塊會先被壓縮,然后被哈希。哈希用于快速確定該數(shù)據(jù)塊是否之前已經(jīng)被存 儲過。客戶機會比較本地哈希緩存來確定是否該數(shù)據(jù)塊之前已經(jīng)被備份過。如果找到相匹配的數(shù)據(jù)塊,說明該數(shù)據(jù)塊之前已經(jīng)被備份過,屬于重復數(shù)據(jù),Avamar就不會再備份它。
3. 如果本地哈希緩存中沒有找到相匹配的數(shù)據(jù)塊,客戶機會將該數(shù)據(jù)塊哈希添加入本地哈希緩存從而更新本地哈希緩存,并且詢問Avamar服務器是否之前已經(jīng)備份過其他客戶機上的相同數(shù)據(jù)塊。如果Avamar服務器上已經(jīng)存有該數(shù)據(jù)塊哈希,則說明已經(jīng)備份過其他客戶機上的相同數(shù)據(jù)塊,該數(shù)據(jù)塊屬于重復數(shù)據(jù),不會被備份。
4. 如果Avamar服務器上沒有找到相匹配的數(shù)據(jù)哈希,客戶機會將該數(shù)據(jù)塊哈希和相應的數(shù)據(jù)發(fā)送給Avamar服務器。Avamar服務器會保存該數(shù)據(jù)塊哈希和相應的數(shù)據(jù)。
通過以上流程的層層過濾,最后真正被Avamar備份的數(shù)據(jù)量顯著減少了。這就是Avamar實現(xiàn)重復數(shù)據(jù)刪除的大致機制。