1. Avamar客戶機(jī)遍歷要備份的所有目錄,并與本地文件緩存作比較來判斷是否要備份的所有文件已經(jīng)在本地文件緩存中有了。如果文件已經(jīng)在本地緩存中有了,說明該文件之前已經(jīng)被備份過,屬于重復(fù)數(shù)據(jù),那么Avamar就不會再備份它。
2. 如 果本地文件緩存中沒有找到相匹配的文件,該文件會被分成多個可變長度的數(shù)據(jù)塊。數(shù)據(jù)塊會先被壓縮,然后被哈希。哈希用于快速確定該數(shù)據(jù)塊是否之前已經(jīng)被存 儲過??蛻魴C(jī)會比較本地哈希緩存來確定是否該數(shù)據(jù)塊之前已經(jīng)被備份過。如果找到相匹配的數(shù)據(jù)塊,說明該數(shù)據(jù)塊之前已經(jīng)被備份過,屬于重復(fù)數(shù)據(jù),Avamar就不會再備份它。
3. 如果本地哈希緩存中沒有找到相匹配的數(shù)據(jù)塊,客戶機(jī)會將該數(shù)據(jù)塊哈希添加入本地哈希緩存從而更新本地哈希緩存,并且詢問Avamar服務(wù)器是否之前已經(jīng)備份過其他客戶機(jī)上的相同數(shù)據(jù)塊。如果Avamar服務(wù)器上已經(jīng)存有該數(shù)據(jù)塊哈希,則說明已經(jīng)備份過其他客戶機(jī)上的相同數(shù)據(jù)塊,該數(shù)據(jù)塊屬于重復(fù)數(shù)據(jù),不會被備份。
4. 如果Avamar服務(wù)器上沒有找到相匹配的數(shù)據(jù)哈希,客戶機(jī)會將該數(shù)據(jù)塊哈希和相應(yīng)的數(shù)據(jù)發(fā)送給Avamar服務(wù)器。Avamar服務(wù)器會保存該數(shù)據(jù)塊哈希和相應(yīng)的數(shù)據(jù)。
通過以上流程的層層過濾,最后真正被Avamar備份的數(shù)據(jù)量顯著減少了。這就是Avamar實現(xiàn)重復(fù)數(shù)據(jù)刪除的大致機(jī)制。