DELL DR4000
但這并未意味著DELL DR4000就毫無潛力可挖。就DR4000自身而言,重復(fù)數(shù)據(jù)刪除技術(shù)是其核心(與大多數(shù)D2D磁盤備份系統(tǒng)一樣,DR4000也是采用的標(biāo)準(zhǔn)X86架構(gòu)服務(wù)器為硬件平臺),其集成的Ocarina技術(shù)到底有什么優(yōu)勢,能夠?yàn)镈R4000帶來哪些優(yōu)勢?DR4000在戴爾的D2D磁盤備份系統(tǒng)產(chǎn)品線中又占有什么地位?DR4000除了是D2D磁盤備份系統(tǒng)之外,還蘊(yùn)藏著哪些戴爾對Ocarina和DR產(chǎn)品線的期待?
為解答這些問題,在DR4000正式在中國發(fā)布之前,DOSTOR采訪了戴爾亞太及日本地區(qū)產(chǎn)品市場部高級產(chǎn)品經(jīng)理林佑聲和戴爾大中華區(qū)消費(fèi)及中小企業(yè)市場部高級產(chǎn)品經(jīng)理馬軼霏,了解了戴爾推出DR4000的臺前幕后。
戴爾涉足D2D:DR4000初覽
作為一款D2D磁盤備份系統(tǒng),重復(fù)數(shù)據(jù)刪除技術(shù)是DR4000的標(biāo)配:DR4000的有效存儲容量共有35TB、70TB和130TB三種,支持在線重復(fù)數(shù)據(jù)刪除(inline deduplication)和壓縮、重刪數(shù)據(jù)復(fù)制(deduplicated replication)、高級數(shù)據(jù)保護(hù)和不中斷部署,當(dāng)然,與主流備份軟件應(yīng)用的認(rèn)證已經(jīng)基本都通過了。
而作為戴爾第一款D2D磁盤備份系統(tǒng),戴爾給出的DR4000禮包當(dāng)然不僅僅是這些,據(jù)林佑聲表示,DR4000中提供了完整的、無所不含的軟件許可模式——“值得一提的是,DR4000的軟件模式跟EqualLogic一樣,買了硬件設(shè)備以后,里面的軟件,OMC的功能、升級的功能都是全部包含的。”(事實(shí)上,在戴爾英文官網(wǎng)上,DR4000的正式名稱是:Dell DR4000 deduplication and compression backup appliance,Appliance顯然頗有深意。)
林佑聲表示,戴爾為DR4000提供了與EqualLogic相同的“軟硬件打包”的產(chǎn)品形態(tài)。戴爾支持客戶在無需支付額外許可費(fèi)用的前提下充分利用DR4000當(dāng)前及未來的所有產(chǎn)品功能,進(jìn)而隨著時間的推移逐步降低存儲成本。
PowerEdge R510是DR4000的硬件基礎(chǔ),作為一款支持英特爾至強(qiáng)5500處理器的雙插槽2U服務(wù)器,R510最大提供32GB內(nèi)存,能夠?yàn)镈R4000的在線重復(fù)數(shù)據(jù)刪除(inline deduplication)提供強(qiáng)勁的性能,而林佑聲表示,DR4000雖然目前沒有發(fā)布橫向擴(kuò)展的功能,但是在未來,DR4000的升級很可能將包括橫向擴(kuò)展的能力——當(dāng)然,我們也不能夠排除DR4000未來推出更高端型號的可能,從DELL EqualLogic的4100產(chǎn)品線和6100產(chǎn)品線的發(fā)布情況來看,未來的產(chǎn)品被稱作DR6000的可能性極大。
DR4000的基本硬件規(guī)格
作為一款D2D磁盤備份系統(tǒng),其核心當(dāng)然是備份與恢復(fù)功能,當(dāng)然,基于IP連接的DR4000同樣可以支持遠(yuǎn)程備份恢復(fù)和災(zāi)難恢復(fù)等功能,我們都知道,壓縮和重復(fù)數(shù)據(jù)刪除都是減小備份數(shù)據(jù)集的有效技術(shù),因此結(jié)合了重復(fù)數(shù)據(jù)刪除技術(shù)的D2D磁盤備份系統(tǒng)是企業(yè)數(shù)據(jù)備份與恢復(fù)的良好載體。
據(jù)戴爾方面表示,DR4000擁有15:1的重復(fù)數(shù)據(jù)刪除比率,但林佑聲也表示,正如業(yè)界所普遍認(rèn)可的,重復(fù)數(shù)據(jù)刪除比率是一個比較彈性的話題,自然還是與需要重刪的數(shù)據(jù)有關(guān),但他表示,由于Ocarina的強(qiáng)勁技術(shù),“DR4000的效果要比很多人想象的好”——這部分內(nèi)容我們會在后面看到,現(xiàn)在還是繼續(xù)看看DR4000本身。
林佑聲表示,戴爾對于DR4000的功能,除了在中小企業(yè)和大型企業(yè)遠(yuǎn)程辦公室進(jìn)行數(shù)據(jù)備份與恢復(fù),由于戴爾為DR4000的完全套裝的許可授權(quán)中提供了遠(yuǎn)程復(fù)制軟件,因此“支持三臺DR4000設(shè)備的同步與數(shù)據(jù)的復(fù)制”,而且三臺設(shè)備之間的復(fù)制與同步都是可以“遠(yuǎn)程實(shí)現(xiàn)的”。戴爾大中華區(qū)消費(fèi)及中小企業(yè)市場部高級產(chǎn)品經(jīng)理馬軼霏認(rèn)為,DR4000的遠(yuǎn)程同步與數(shù)據(jù)復(fù)制功能的提供,讓DR4000不僅限于辦公室或數(shù)據(jù)中心內(nèi)的應(yīng)用,而是可以實(shí)現(xiàn)“B2B2C”——Business(業(yè)務(wù)部門或遠(yuǎn)程辦公室) to Business to Center(數(shù)據(jù)中心)——的功能,從而滿足多地中心和分中心的數(shù)據(jù)保護(hù)。不過,由于DR4000只是初始版本,還只能支持三臺設(shè)備,據(jù)林佑聲講,未來幾個季度,戴爾“還會有容量和功能上的更新”。
從競爭角度來看,DataDomain的DD160有一個標(biāo)準(zhǔn)的40TB邏輯容量,而DD620提供83TB的邏輯容量。在Boost的幫助下,利用Symantec的OST來用媒介服務(wù)器預(yù)先處理備份數(shù)據(jù)流,160的數(shù)據(jù)吞吐率為1.1TB/小時,如果不用Boost的話,速率是667GB/小時。620使用Boost的話,速度可以達(dá)到2.4TB/小時,如果不使用Boost的話,速度是1.1TB/小時。所有的軟件功能已經(jīng)包含在基礎(chǔ)價格內(nèi)。
Quantum的DXi4500針對的是中小企業(yè)客戶,它在NAS(網(wǎng)絡(luò)附加存儲)和賽門鐵克OpenStorage(OST)上的重復(fù)數(shù)據(jù)刪除速度都可以達(dá)到1.4TB/小時。DXi4510擁有2TB容量,而DXi4601的容量在4TB與12TB之間。
戴爾DR4000的速度比沒有使用Boost的DD160更快,速度相當(dāng)于使用Boost的DD160和未使用Boost的DD620。DR4000沒有DXi5400那么快,不過它的基礎(chǔ)容量比4510更大,相當(dāng)于4601產(chǎn)品。
總的來說,戴爾將不斷擴(kuò)展DR4000產(chǎn)品(或是產(chǎn)品家族)的范圍,提高速度和容量,覆蓋規(guī)模更大的企業(yè)的要求,而且毫無疑問的是,支持遠(yuǎn)程辦公室和分支辦公室。此外,進(jìn)一步的功能將通過固件升級來添加,這樣現(xiàn)有用戶就不用進(jìn)行跳躍式升級來獲得額外功能。
DR4000及其后續(xù)產(chǎn)品在整合災(zāi)難恢復(fù)、無需重建的數(shù)據(jù)遷移、WAN(廣域網(wǎng))優(yōu)化功能上也應(yīng)該會有更多建樹,以及多到1的復(fù)制功能也不需用戶花費(fèi)很高的費(fèi)用。DR4000還將有更多的ISV和合作伙伴整合,我們并不排除DR4000在Appliance方向上的進(jìn)一步發(fā)展。
DR4000的靈魂:Ocarina重復(fù)數(shù)據(jù)刪除
重復(fù)數(shù)據(jù)刪除技術(shù)是D2D磁盤備份系統(tǒng)的靈魂所在,這一技術(shù)剛剛推出的時候,被認(rèn)為主流是后處理技術(shù)——限于當(dāng)時的處理器性能——這也無可非議,而在線處理(inline)被認(rèn)為只屬于大中型企業(yè)或是具有一定規(guī)模和高性能的系統(tǒng)的用戶,但隨著多核處理器性能的不斷攀升,無論是DataDomain還是昆騰都開始涉足中小企業(yè)及遠(yuǎn)程辦公室的D2D重復(fù)數(shù)據(jù)刪除磁盤備份系統(tǒng)。
這一技術(shù)的實(shí)現(xiàn)原理無需多言——對于大多數(shù)企業(yè)來說重刪原理并不是那么重要——但DR4000在線處理(inline)的方式很顯然更適合中小型企業(yè):后處理方式仍然需要至少等同于多次全備份的存儲容量,而在線處理卻可以有更小的基礎(chǔ)容量可以選擇。而對于在線處理可能造成的網(wǎng)絡(luò)負(fù)載壓力瞬時過大的問題,對于DR4000所覆蓋的用戶群體來說或許并不存在,畢竟其面對的用戶的數(shù)據(jù)量不大,以太網(wǎng)的網(wǎng)絡(luò)速度也能夠達(dá)到10Gb,同時,磁盤備份系統(tǒng)多核處理器的在線處理性能也能夠達(dá)到很高的水平。
對于戴爾的DR4000來說,在重復(fù)數(shù)據(jù)刪除技術(shù)領(lǐng)域最大的用戶疑問或許是這樣的:戴爾的重刪技術(shù)和DataDomain、昆騰有什么不同(在線處理技術(shù)上DataDomain和昆騰采用的技術(shù)是相同)?戴爾又能夠在看起來業(yè)已成熟的重復(fù)數(shù)據(jù)刪除技術(shù)上有什么新的花樣?
回答這個問題,核心就在于Ocarina,它是戴爾DR4000的重復(fù)數(shù)據(jù)刪除技術(shù)的靈魂,也是DR4000的靈魂,未來或許也會成為戴爾存儲的靈魂。
Ocarina成立于2007年,戴爾于2010年7月將其收歸旗下,在收購時,Ocarina公司CEO Murli Thirumale表示:“Ocarina是不同的,是遠(yuǎn)遠(yuǎn)領(lǐng)先于其他供應(yīng)商的。”林佑聲表示,Ocarina最大的特點(diǎn),是“其對非結(jié)構(gòu)化數(shù)據(jù)的處理能力。”
“我們非常希望從非結(jié)構(gòu)化數(shù)據(jù)方面,能夠提供給用戶更優(yōu)秀的產(chǎn)品,比如說我們基于EqualLogic的FS7500和PowerVault NX3500,Ocarina也是如此,都是面向非結(jié)構(gòu)化數(shù)據(jù)的橫向擴(kuò)展架構(gòu)的產(chǎn)品。”林佑聲表示,Ocarina最大的特點(diǎn),是對非結(jié)構(gòu)化數(shù)據(jù)——不僅僅是文檔和郵件——而是對于視頻、圖像和WEB上的非結(jié)構(gòu)化文檔,“都會提供不同處理方式下的壓縮以及重復(fù)數(shù)據(jù)刪除的能力”,因此可以幫助用戶達(dá)到更好的非結(jié)構(gòu)化數(shù)據(jù)的數(shù)據(jù)保護(hù)需求。
Ocarina的重點(diǎn)在于對非結(jié)構(gòu)化數(shù)據(jù),尤其是視頻和圖像的處理能力,這對于戴爾正在將結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),塊存儲和文件存儲系統(tǒng)整合形成流動數(shù)據(jù)解決方案,在流動數(shù)據(jù)、大數(shù)據(jù)、互聯(lián)網(wǎng)市場上獲得優(yōu)勢至關(guān)重要——總的來說,重復(fù)數(shù)據(jù)刪除在絕大多數(shù)情況下,都是面向塊數(shù)據(jù)——結(jié)構(gòu)化數(shù)據(jù)的,非結(jié)構(gòu)化數(shù)據(jù)則主要是文件級的重復(fù)數(shù)據(jù)刪除,而Ocarina正在突破這一界限。
雖然有關(guān)Ocarina技術(shù)的相關(guān)資料較少,但從公開獲得的資料來看,Ocarina技術(shù)具有內(nèi)容識別(content-aware)功能,因此它在處理JPEG文件方面特別有效,除此以外,Ocarina主要面向3個類型的數(shù)據(jù):
•Microsoft Office files (Powerpoint, Word, Excel)
•Images and Video (JPEG, MPEG, tiff, GIF, PNG,)
•Compound Documents (email, html, web pages, PDF, ZIP, RAR, TAR)
據(jù)Ocarina一位工程師向DOSTOR介紹,Ocarina能夠“對給出的文件以結(jié)構(gòu)化的理解并使用100種不同算法來去處理”,而如果這一文件類型對于Ocarina是全新的,Ocarina會去推斷信息的結(jié)構(gòu)和內(nèi)容性質(zhì),選擇最有效的數(shù)據(jù)壓縮或是重刪算法。
而在被收購以前,Ocarina的數(shù)據(jù)精簡技術(shù)被稱為“Ocarina ECOsystem數(shù)據(jù)處理系統(tǒng)”,核心的組成部分不僅包括內(nèi)容感知的數(shù)據(jù)壓縮與重復(fù)數(shù)據(jù)刪除算法,還包括為需要壓縮和重刪的數(shù)據(jù)制定最優(yōu)運(yùn)行時間效率的神經(jīng)網(wǎng)絡(luò)模型。據(jù)上述工程師表示,Ocarina的設(shè)計初衷是“將數(shù)據(jù)作為一產(chǎn)品來消費(fèi),重復(fù)數(shù)據(jù)刪除的磁盤備份系統(tǒng)是有關(guān)數(shù)據(jù)的消費(fèi)方式,而不是存儲方式。”即,DR4000的重點(diǎn)在于對數(shù)據(jù)的處理,而不是保存。也就是說,戴爾肯定為DR4000選擇了一個合理重刪比,而非過度重刪和壓縮——雖然所需要的磁盤容量大幅減少——但重刪數(shù)據(jù)在需要恢復(fù)時容易因此而出現(xiàn)的重建數(shù)據(jù)時間過長的問題。
戴爾流動數(shù)據(jù)架構(gòu)重要一環(huán):D2D磁盤備份
DR4000除了以最簡單的方式使用——作為一個中間的D2D短期備份區(qū)域,從DR4000的名稱上,實(shí)際上我們還能看出“DR”兩字所代表的是Data Replication或是Disaster Recovery,據(jù)馬軼霏表示,戴爾確實(shí)對DR4000有兩方面的考慮:一是Data Replication,DR4000有足夠的性能——在某些應(yīng)用環(huán)境下——可能做數(shù)據(jù)復(fù)制甚至是當(dāng)作二級存儲使用;二是災(zāi)難恢復(fù)Disaster Recovery,這一功能與數(shù)據(jù)復(fù)制都是對現(xiàn)有戴爾流動數(shù)據(jù)解決方案的有益補(bǔ)充,讓其擁有了遠(yuǎn)程數(shù)據(jù)復(fù)制和災(zāi)難恢復(fù)的能力——企業(yè)不可能租用昂貴的光纖鏈路,DR4000基于IP技術(shù)通過以太網(wǎng)實(shí)現(xiàn)了更低成本的遠(yuǎn)程災(zāi)備。
而無論是否局限在備份存儲系統(tǒng)上,文件級重復(fù)數(shù)據(jù)刪除技術(shù)都是非常成熟的,但是塊級重復(fù)數(shù)據(jù)刪除,尤其是在線快存儲系統(tǒng)的重復(fù)數(shù)據(jù)刪除,其實(shí)還走在起步階段。而戴爾一直宣稱將會在在線主存儲系統(tǒng)上使用重復(fù)數(shù)據(jù)刪除系統(tǒng)。
DR4000管理界面
對于戴爾來說,在整個流動數(shù)據(jù)解決方案架構(gòu)中,實(shí)現(xiàn)統(tǒng)一化的塊重復(fù)數(shù)據(jù)刪除是困難的。
不同的戴爾存儲平臺上的數(shù)據(jù)模塊的大小是不同的。在EqualLogic系統(tǒng)中,一個數(shù)據(jù)塊的大小是15MB,而在Compellent系統(tǒng)中,數(shù)據(jù)模塊的大小是不確定的。64位StorageCenter O/S將在模塊水平上跟蹤數(shù)據(jù)。一個數(shù)據(jù)塊并非一個完整的文件,存儲操作系統(tǒng)從原則上可以查出哪些文件是由哪些塊組成的。將文件分割存儲在磁盤中會增加數(shù)據(jù)的碎片程度。主存儲器的塊級重復(fù)數(shù)據(jù)刪除功能必須能夠解決這個問題。當(dāng)然,塊越大,在其中發(fā)現(xiàn)重復(fù)數(shù)據(jù)的概率越高。
正如我們所知,你會從頁面上讀取數(shù)據(jù),對數(shù)據(jù)進(jìn)行重復(fù)數(shù)據(jù)刪除處理,然后將數(shù)據(jù)作為一個連續(xù)的數(shù)據(jù)流重新寫回磁盤,而一旦新的重復(fù)數(shù)據(jù)刪除檢測算法和空間恢復(fù)算法被開發(fā)出來,戴爾就可以將它整合到EqualLogic 和Compellent的操作系統(tǒng)之中。這樣一來,戴爾不僅在全系列存儲系統(tǒng)上實(shí)現(xiàn)了重復(fù)數(shù)據(jù)刪除,在某種意義上,當(dāng)數(shù)據(jù)進(jìn)入類似DR4000這樣的D2D磁盤備份系統(tǒng)之后,戴爾也統(tǒng)一了其多個主存儲系統(tǒng)后端備份恢復(fù)數(shù)據(jù)的結(jié)構(gòu)。
這對于戴爾來說——如果以上想法得到實(shí)現(xiàn)——將會是顯著受益的:戴爾現(xiàn)在擁有復(fù)雜且全面的產(chǎn)品線,而戴爾存儲的核心價值觀就是“流動數(shù)據(jù)”——數(shù)據(jù)只有被更格式化的、標(biāo)準(zhǔn)化的存儲起來,才有可能順暢的流動起來,而DR4000及其后續(xù)產(chǎn)品則完成了這一工作:讓數(shù)據(jù)統(tǒng)一化、格式化和標(biāo)準(zhǔn)化,增強(qiáng)了戴爾流動數(shù)據(jù)架構(gòu)的價值。
而據(jù)戴爾的工程師介紹,在2011年發(fā)布的戴爾流動數(shù)據(jù)規(guī)劃中,實(shí)際上已經(jīng)包含了重復(fù)數(shù)據(jù)刪除技術(shù)和戴爾可擴(kuò)展文件系統(tǒng),并且會考慮應(yīng)用在各個環(huán)節(jié)上,以及不同的設(shè)備上,也就是說,戴爾不僅會擴(kuò)大統(tǒng)一存儲和文件存儲的產(chǎn)品線,同樣會將重復(fù)數(shù)據(jù)刪除加入到主存儲等其他區(qū)域,更重要的是重復(fù)數(shù)據(jù)刪除對數(shù)據(jù)的“格式化”作用將在戴爾得到體現(xiàn)——無論是私有云、公有云還是傳統(tǒng)的數(shù)據(jù)中心,重復(fù)數(shù)據(jù)刪除之后的數(shù)據(jù),未來甚至有可能在不同的存儲系統(tǒng)之間彼此互相傳輸。
馬軼霏表示,戴爾已經(jīng)看到,具有重復(fù)數(shù)據(jù)刪除技術(shù)的D2D磁盤備份系統(tǒng),能夠提供更好可訪問性和可靠性以及“規(guī)范化的格式”,更理想的是對數(shù)據(jù)增長有帶來的成本增長所控制。因此,戴爾會在流動數(shù)據(jù)一環(huán)中逐步加強(qiáng)這一部分的實(shí)力:“現(xiàn)在DR4000的發(fā)布只是這個產(chǎn)品系列的第一個產(chǎn)品,也是一個重復(fù)數(shù)據(jù)刪除市場的入門級產(chǎn)品,但是使用的技術(shù)和算法是先進(jìn)的,和未來我們將要推出的更高端產(chǎn)品一樣的。這樣的技術(shù)我們要逐步加載到整個系統(tǒng)的各個環(huán)節(jié),我們的愿景是客戶今后能夠以重復(fù)數(shù)據(jù)刪除之后的文件格式通過文件存儲系統(tǒng)接口直接傳送到云端。”