這里談到的第四代重復(fù)數(shù)據(jù)刪除技術(shù),是在重新定義企業(yè)級去重規(guī)模,為滿足大規(guī)模去重需求,把一組DDB存儲組合成一個集合,分段對齊,來獲得最佳性能。這樣做,實際的結(jié)果是能線性增加存儲規(guī)模。這對企業(yè)級去重或全局去重設(shè)計至關(guān)重要。實際上,全局并行存儲就是下一代網(wǎng)格存儲,可是實現(xiàn)容量、吞吐率、并發(fā)性倍增,同時能把多個存儲整合到一個全局的邏輯存儲池中。
那么并行去重是如何工作的呢?如圖所示,客戶端根據(jù)GridStor存儲策略選擇DataMover (MA),發(fā)送數(shù)據(jù)到MA。DataMovver使用內(nèi)部算法來選擇哪個分區(qū)和來執(zhí)行簽名查找。如果所選的分區(qū)在其他MA上,就通過網(wǎng)絡(luò)上進行查找。其算法保證同一HASH值會到同一DDB中比對,如是2個DDB,根據(jù)奇偶區(qū)分;如是三個DDB,根據(jù)Mode/3結(jié)果。
如果數(shù)據(jù)已經(jīng)存在,在所選擇的分區(qū)中更新DDB,在MA訪問的裝載路徑上更新元數(shù)據(jù)。如果數(shù)據(jù)是新的,在所選擇的分區(qū)DDB中插入簽名,以及數(shù)據(jù)寫入MA能存取的裝載路徑。
在其他客戶端重復(fù)類似過程,利用GridStor選擇不同的DM,盡管簽名會出現(xiàn)在其他分區(qū),但數(shù)據(jù)始終由選擇的DM寫入。
作為用戶最為關(guān)心的如何挖掘出數(shù)據(jù)價值問題,Simpana10非常重視怎樣有效地使用數(shù)據(jù)信息,Simpana10提供給用戶的理念,就是在任何時間、任何地點都可以去查詢和使用這些信息。對此,Rick Theiler介紹說:“現(xiàn)在大部分人都有智能手機,都可以去下載CommVault的終端,放到智能手機里,只要你有這個權(quán)限,就可以去查找、讀取企業(yè)備份或歸檔的數(shù)據(jù),這樣員工的效率就提高了。”
有了這樣的新功能,可以讓用戶在使用時,本來要花幾個小時去查詢的信息,在幾秒鐘之內(nèi)就可以查找出來。另外,尤其是在美國、歐洲的醫(yī)療機械輻射信息,比如說像X光、核磁共振影像環(huán)境下,借助Simpana10還可以把這些數(shù)據(jù)開放給第三方查詢,自然將數(shù)據(jù)利用價值和數(shù)據(jù)利用的效率提升很高。
Simpana 10中最亮點:OnePass
在Simpana 10版本中,CommVault將備份、歸檔的效率提高了兩倍;另外,將管理成本、管理時間降低了50%;數(shù)據(jù)查詢、數(shù)據(jù)查找的效率提高至少25%。
OnePass是Simpana 10版本中一個獨特的功能。傳統(tǒng)數(shù)據(jù)管理方式將備份、歸檔和報告的流程孤立,其性能低,生產(chǎn)系統(tǒng)影響大。而SIMPANA ONEPASS大數(shù)據(jù)的解決方案合并了備份、歸檔和報告流程,消減數(shù)據(jù)管理窗口50%以上,性能獲得明顯提升。
CommVault中國區(qū)技術(shù)總監(jiān)蔡報永指出,“企業(yè)前端數(shù)據(jù)中, 80%以上大數(shù)據(jù)都是非結(jié)構(gòu)化文件和半結(jié)構(gòu)化的郵件等等信息,這些信息從系統(tǒng)前端要保護到后端時,大家通常會有幾個操作,第一需要做所有數(shù)據(jù)的保護,包括備份。另外,大家經(jīng)常說NAS系統(tǒng)不夠用了,這個時候就有一個歸檔的系統(tǒng)。比如現(xiàn)在我們有10個NAS,上面有10TB或15TB,但都不知道怎么分析。需要這三個功能,就是對數(shù)據(jù)做分析、歸檔和保護。”
Simpana 10中采用創(chuàng)新性的OnePass技術(shù),將這三個方面全部合并起來。將數(shù)據(jù)的分析、備份、歸檔全部合并在一個操作里面,一次性完成數(shù)據(jù)的分析、歸檔和備份的功能,這樣就可以減少數(shù)據(jù)管理的時間窗口、以及減少網(wǎng)絡(luò)帶寬差不多50%以上,對后端存儲容量的要求也減少非常多。為此,Simpana 10版本OnePass技術(shù),從原來支持文件系統(tǒng)擴展到對郵件系統(tǒng)、NAS系統(tǒng)的支持。
Simpana 10四大獨到之處
或許你和筆者一樣,只要提起Simpana 10就想和之前的Simpana 9.0版本對比一下。Simpana 10與9.0相比確實有著比較大的突破性的地方。蔡報永將Simpana 10獨到之處歸納為四個方面。
首先是技術(shù)的領(lǐng)軍性。如CommVault與一些廠商有密切合作,提供快速恢復(fù)功能。
其次是企業(yè)的擴展性,可以從兩個方面來分析,一是并行去重能力,使得它后端的去重能力成倍增長。當(dāng)用戶有四個MA支持時,是原來四倍的后端的存儲容量,可以達到360TB。另外,對數(shù)據(jù)做了更精細的智能索引功能,使得在查找時更為方便。
再次就是在運行維護操作方面,Simpana 10版本智能化的Workflow流程管理工具,使得在傳統(tǒng)數(shù)據(jù)管理領(lǐng)域里面,需要有些人工干預(yù)的地方,能夠做到更自動化、更流程化。
當(dāng)然所有的數(shù)據(jù)存在ContentStore里面,就需要更主動地去發(fā)掘數(shù)據(jù)。在Simpana 10版本里面,不需要外部人員去幫忙,用戶可以進行自助服務(wù)。當(dāng)不同的用戶數(shù)據(jù)共享時,他們的數(shù)據(jù)共享也設(shè)置在自助式服務(wù)中很重要的地方。ContentStore還有一個很重要的方式,對于傳統(tǒng)數(shù)據(jù)恢復(fù),必須要從介質(zhì)里移動到生產(chǎn)系統(tǒng)里,然后這樣的備份數(shù)據(jù)才可以被訪問。而在Simpana 10版本上,數(shù)據(jù)是在ContentStore里面,不需要做數(shù)據(jù)恢復(fù)移動的動作,直接可以提供給前端的生產(chǎn)系統(tǒng)轉(zhuǎn)載起來,就可以訪問ContentStore內(nèi)的內(nèi)容,當(dāng)然這是只讀訪問,不是可寫訪問。
再者,為了和第三方應(yīng)用有很好集成,CommVault提供了API,比如說對醫(yī)療影像數(shù)據(jù)做自動化查找的功能,提供了一個開放式接口,無論是從哪一家廠商,GE或西門子系統(tǒng),集中到ContentStore并在前端設(shè)置一個開放式平臺后,在應(yīng)用軟件里就可以做到只需要根據(jù)病人姓名、檢查日期等信息便可查找到不同醫(yī)院、不同系統(tǒng)里統(tǒng)一的病人數(shù)據(jù),病人不需要重復(fù)檢查。
當(dāng)然,為了做好這四個方面,目前CommVault將服務(wù)體系分為三個類。一是顧問服務(wù),比如說有些企業(yè)對自己的數(shù)據(jù)管理模式或者說管理策略并不了解時,CommVault專家可以幫助用戶做一個數(shù)據(jù)管理的評估服務(wù),看看用戶的數(shù)據(jù)策略設(shè)計、流程設(shè)計是否合理,企業(yè)管理的成熟度是否達到行業(yè)標準要求,這是一個純粹的咨詢服務(wù)。
二是在專業(yè)服務(wù)領(lǐng)域,主要是圍繞產(chǎn)品,幫助用戶去做架構(gòu)設(shè)計,實施以及運維的服務(wù)。在這個領(lǐng)域,主要是由CommVault中國的專業(yè)服務(wù)團隊提供。當(dāng)用戶使用CommVault系統(tǒng)時,還有教育服務(wù)和信息支持服務(wù)。針對Simpana 10版本特別提供Simpana軟件升級服務(wù),也包括實現(xiàn)Workflow工作流、去重、OnePass方面,可以幫助用戶做一些優(yōu)化、管理的工作
三是數(shù)據(jù)化的技術(shù)評估服務(wù),基于這個評估服務(wù),可以幫助用戶將數(shù)據(jù)管理的模型補充得更完整。