左起:CommVault全球產(chǎn)品總監(jiān)梅力宏,CommVault全球CEO Robert Hammer和CommVault中國區(qū)總經(jīng)理徐永興


    在1998年,CommVault完全放棄其前代產(chǎn)品,希望重新開發(fā)更適應(yīng)市場需要的統(tǒng)一數(shù)據(jù)管理平臺之時(shí),面臨艱難的選擇。在Hammer看來,當(dāng)年的選擇從某種意義上與重新創(chuàng)業(yè)并無不同,但又不完全相同。相同的都是從頭開始,雖然有了準(zhǔn)確的目標(biāo),但這個(gè)目標(biāo)在當(dāng)時(shí)市場來說是前所未有的,能否成功以及用戶是否認(rèn)可都未曾知曉。不同的時(shí),因?yàn)橛兄暗幕A(chǔ),加上Hammer準(zhǔn)備充足的資金,有足夠的時(shí)間去從頭開始。自1998年至2004年間,公司始終處于虧損狀態(tài)。但2005年開始已經(jīng)收支平衡,并看到贏利的希望。通過其為上市而提交的S-1申請表格可以看出,截至2005年3月31日的上一財(cái)年CommVault凈利潤48萬美元。從2005年4月1日至12月31日這九個(gè)月,CommVault凈賺900萬美元,總收入8100萬美元,2004年同期收入為5900萬美元。而截至今年3月的財(cái)年中,CommVault總收入1.095億美元,凈利潤510萬美元。
  
    這些數(shù)字不僅僅證明CommVault的目標(biāo)正確,也表明統(tǒng)一的數(shù)據(jù)管理平臺是用戶迫切需要的。ESG在2005年對目前的備份和恢復(fù)方案進(jìn)行了調(diào)查和分析,問題最多的前5項(xiàng)表明都與時(shí)間有關(guān),66%的人認(rèn)為“備份時(shí)間太長”,49%的人認(rèn)為恢復(fù)時(shí)間太長。這么多的數(shù)據(jù),來自哪里?非結(jié)構(gòu)化數(shù)據(jù)(未存儲在數(shù)據(jù)庫中的大量文件和電子郵件)是這種增長的最主要因素,占組織在線存儲數(shù)據(jù)量的70%到80% 。此類數(shù)據(jù)的增多是大量書面存檔的日常轉(zhuǎn)換。同時(shí),數(shù)據(jù)文件的有意副本也加劇了數(shù)據(jù)量的增長。重要數(shù)據(jù)例行復(fù)制到多個(gè)位置以防止所有類型的災(zāi)難。例如,在數(shù)據(jù)挖掘領(lǐng)域,通常為了運(yùn)行商務(wù)智能查詢而復(fù)制巨大的數(shù)據(jù)庫。應(yīng)用程序開發(fā)和測試過程中也會有意地創(chuàng)建大型數(shù)據(jù)庫的大量臨時(shí)副本。在全球,重要數(shù)據(jù)例行復(fù)制到多個(gè)位置以防止所有類型的損失。



    CommVault統(tǒng)一的數(shù)據(jù)管理體系則將界面與底層架構(gòu)統(tǒng)一,以一個(gè)統(tǒng)一的平臺實(shí)現(xiàn)多種數(shù)據(jù)管理操作,從而節(jié)省用戶的總體成本開銷。由于共享底層的架構(gòu),很多源代碼各功能模塊都可以共享(比如數(shù)據(jù)的傳輸,對于備份、歸檔、快照、遷移等操作都要用到),所以可以大大節(jié)省開發(fā)資源,避免不必要的重復(fù)勞動,只要在相關(guān)功能方面開發(fā)新的代碼即可,在保證統(tǒng)一性的同時(shí),加快了新功能模塊的開發(fā)進(jìn)度?!敖y(tǒng)一、整合”這可以說是CommVault產(chǎn)品體系的核心架構(gòu),不同的數(shù)據(jù)管理模塊構(gòu)建于一個(gè)公用技術(shù)引擎(CTE,Common Technology Engine)之上,它們之間通過數(shù)據(jù)可分類與內(nèi)容可搜索機(jī)制((Data Classification and Content Search Enabler)相聯(lián),并統(tǒng)一受控于智能操作平臺(Intelligent Operations Management),而所能提供的功能模塊包括了備份/恢復(fù)、快速恢復(fù)、持續(xù)數(shù)據(jù)復(fù)制(保護(hù))、數(shù)據(jù)遷移、數(shù)據(jù)歸檔、存儲資源管理等。
  
    在談到CommVault所獨(dú)有的索引文件技術(shù)時(shí),其產(chǎn)品管理總監(jiān)梅立宏舉了實(shí)際的例子,某個(gè)人將一個(gè)文件發(fā)送給15位同事時(shí)產(chǎn)生的副本數(shù):收件人將文件保存到個(gè)人系統(tǒng)之后,可能還復(fù)制一次文件作為備份,按規(guī)定第二次復(fù)制,第三次復(fù)制用于災(zāi)難恢復(fù)。這樣,將單個(gè)文件發(fā)送給15個(gè)人可能產(chǎn)生60個(gè)文件副本:15個(gè)有意副本和另外45個(gè)無意副本。個(gè)人在共享文件時(shí)無意中創(chuàng)建數(shù)不盡的數(shù)據(jù)文件副本,使問題更加復(fù)雜。
  
    而讓CommVault驕傲的地方恰恰在此,文件備份時(shí)會建立兩套索引,一個(gè)是一級備份數(shù)據(jù)的索引,記錄了備份數(shù)據(jù)的關(guān)鍵信息;另一個(gè)是二級備份索引,記錄著索引的信息。一級索引分布在各備份服務(wù)器上,使用C-TRIEVE數(shù)據(jù)庫進(jìn)行檢索,二級索引則相當(dāng)于一級索引的索引,使用微軟SQL數(shù)據(jù)庫進(jìn)行檢索。這其中,二級索引的數(shù)據(jù)將一直累加,而一級索引相當(dāng)于一個(gè)索引的緩存(Cache),為了保證索引的效率,其內(nèi)建的索引條目將被限制在一定數(shù)量,當(dāng)超過這一數(shù)量,將把最不常用的索引信息刪除,日后若需要尋找相關(guān)的數(shù)據(jù),可從二級索引庫中進(jìn)行查詢。
  
    采用分布式關(guān)系式結(jié)構(gòu)而非傳統(tǒng)的目錄式索引結(jié)構(gòu),可大大提高檢索的效率,而且它還將數(shù)據(jù)的索引與數(shù)據(jù)一起保存到備份介質(zhì)中(比如磁帶、光盤等),也就是說,即使一級索引與二級索引都被破壞了,用戶還可以從備份介質(zhì)中找到索引信息,雖然恢復(fù)的速度要比一、二級索引還在時(shí)慢,但這種設(shè)計(jì)使得數(shù)據(jù)可恢復(fù)性大提高。而且由于這種機(jī)制使得索引的精細(xì)度可以大大提高,從而可以細(xì)化恢復(fù)的顆粒度,使精確而快速的定點(diǎn)恢復(fù)數(shù)據(jù)成為了可能。
  
    CommVault采用兩級索引模式,是因?yàn)镃ommVault相信,一切的數(shù)據(jù)備份、保護(hù)操作都是為了在需要使用數(shù)據(jù)的時(shí)候,能夠快速恢復(fù)。而在恢復(fù)管理中,有效的索引無疑是一大利器。CommVault的分布式索引方案,使快速檢索和快速恢復(fù)成為可能。
  
    CommVault數(shù)據(jù)管理的不同之處在于,其不僅僅是對存儲設(shè)備固有功能的調(diào)用,而是創(chuàng)建了一個(gè)統(tǒng)一的服務(wù)平臺來建立和調(diào)用CommVault的功能。CommVault提供了一個(gè)具有集成能力的通用技術(shù)引擎CTE來跨越三個(gè)層面的數(shù)據(jù)管理:恢復(fù)管理、數(shù)據(jù)保護(hù)和歸檔管理。這種獨(dú)特的能力具有節(jié)省費(fèi)用、使用方便的優(yōu)勢。CommVault的QiNetix是包含所有上述功能的統(tǒng)一軟件產(chǎn)品,是統(tǒng)一的源代碼,在一個(gè)GUI用戶界面下就能管理數(shù)據(jù)恢復(fù)、保護(hù)和歸檔,具有統(tǒng)一的索引,只要一個(gè)策略就能完成數(shù)據(jù)在不同存儲層之間的傳輸。

分享到

多易

相關(guān)推薦