以下為現(xiàn)場實(shí)錄:

今天這個會議我會先從數(shù)據(jù)保護(hù)這個角度來講,為什么呢?因?yàn)槲矣X得這幾年是IT去做演進(jìn)或者是變革時期一個非常關(guān)鍵的階段,在IT的演進(jìn)和變革當(dāng)中,數(shù)據(jù)顯得非常的重要,怎么能夠把你的數(shù)據(jù)在這種變化的階段,以一種新的方式,一種低成本、高效率的方式把它保護(hù)起來,使你沒有后顧之憂去發(fā)展你的業(yè)務(wù)的時候,那這個解決方案顯得尤為重要,所以我們今天這個CIO活動開場就由我來講一下,新一代的數(shù)據(jù)保護(hù)的解決方案。

我在講數(shù)據(jù)保護(hù)解決方案之前,大家可以先來看一看數(shù)據(jù)中心的演變的趨勢。之前,我們傳統(tǒng)的數(shù)據(jù)中心都是以物理環(huán)境,或者物理級的組合搭建物理中心,虛擬化應(yīng)用的產(chǎn)生,讓大家意識到我要怎么樣去做資源的整合,去做虛擬化的部署。這種虛擬化的部署里面,可能又發(fā)展到說我們要用標(biāo)準(zhǔn)化的部署的方式來應(yīng)對這種資源的整合。然后,后一步,可能就是從虛擬化到云計算,我相等可能目前有很多的企業(yè),或者是組織都已經(jīng)在考慮到云計算。那云計算帶來一個對IT的最大的影響是什么呢?就是意味著我們從一個技術(shù)支持的部門,再轉(zhuǎn)向一種服務(wù)部門。在新的從支持部門向服務(wù)部門去轉(zhuǎn)化和演進(jìn)的過程當(dāng)中,對你現(xiàn)有的IT的架構(gòu),IT的存儲架構(gòu),或者你的部署,或者說你的要求,都在改變,有可能你需要這種瞬間的響應(yīng),你要考慮你的成本,因?yàn)槌杀緵Q定你的服務(wù)水平和服務(wù)利潤的非常重要的方面。另外一個方面,就是你如何面對IT轉(zhuǎn)向面向服務(wù)過程當(dāng)中出現(xiàn)的不可預(yù)測性,相應(yīng)的,我們就會有不同的技術(shù),或者是不同的方案,來幫助大家去應(yīng)對。最后,大家要是發(fā)展到共有云,所有私有云,現(xiàn)在大家談的比較多的。在現(xiàn)有的演進(jìn)的趨勢里面,作為IT的決策者,大家在考慮什么?關(guān)心什么?在想什么?我接下來會給大家分享一下我們有一個叫ESG的企業(yè)戰(zhàn)略調(diào)查機(jī)構(gòu)給大家做的調(diào)查數(shù)據(jù)和分析在這種演進(jìn)的過程當(dāng)中,他去拜訪了國外的600多個企業(yè)的IT決策者,大家可以做以下這些選項(xiàng),可以選三項(xiàng),從三項(xiàng)里面,他就問,在你未來12—18個月之間,你對貴公司的IT發(fā)展決策,哪三個因素是影響最大的?根據(jù)這個調(diào)查結(jié)果我們可以看到,42%的IT的決策者選擇了成本削減的舉措。另外還有33%的決策者選擇的是業(yè)務(wù)流程的改進(jìn)舉措。還有相應(yīng)的就是在安全和風(fēng)險管理類的業(yè)務(wù)措施的舉措??梢钥吹剑瑥倪@個調(diào)查里面我們會發(fā)現(xiàn),很多的CIO都在考慮什么?成本,第一考慮組織成本,第二就是改進(jìn)。從這個調(diào)查的反饋里面也可以看到,當(dāng)前我們數(shù)據(jù)中心也在面臨一些挑戰(zhàn),第一個挑戰(zhàn)是來自于數(shù)據(jù)的快速的增長,數(shù)據(jù)快速的增長肯定會帶來你成本的無限制的增加,會面臨很多的決策者去面臨成本的壓力和怎么去解決。另外,這種數(shù)據(jù)的快速增長,就導(dǎo)致你的系統(tǒng)要有一個非常好的系統(tǒng)性能去應(yīng)對和處理這些數(shù)據(jù),我們還要考慮一些關(guān)于這種擴(kuò)展性的,我是不是就可以小規(guī)模起步,通過非常低成本的投入,通過先進(jìn)的架構(gòu),按我的需要做模樣和性能同步的提升,在可擴(kuò)展性上,也可以幫我降低一些成本,應(yīng)對以后未來不可預(yù)測要發(fā)生的這些事情呢?這些可能都是我們目前數(shù)據(jù)中心面對的一些挑戰(zhàn)。還有一些就是我們的網(wǎng)絡(luò)資源啊,包括我們對于數(shù)據(jù)生命周期的保護(hù),我產(chǎn)生這么多的數(shù)據(jù),哪些數(shù)據(jù)我需要把它放在我們比較昂貴的,需要快速響應(yīng)的主存上,有那些數(shù)據(jù)可以放在二級存儲上,是不是有些數(shù)據(jù)可以考慮資源備份的解決方案。對于高達(dá)幾十年的數(shù)據(jù)保留,我是不是可以考慮磁帶,做磁帶的存放。所有這些數(shù)據(jù),也是降低用戶成本的一種手段。

提到第一個挑戰(zhàn),數(shù)據(jù)中心的數(shù)據(jù)量的增長,但是這種增長到底是一個什么樣的比例呢?這個ESG也去訪問了一些企業(yè)IT的決策者,他發(fā)現(xiàn),每年大概有42%的人選的是每年數(shù)據(jù)量的增長是在11%—20%,還有是選擇每年超過40%的有30%的人去選擇。從這個方面可以看到什么呢?數(shù)據(jù)量的快速的增長,是每一個企業(yè)或者大多數(shù)的企業(yè)都不得不去面對的一個問題,要去解決的一個問題。相應(yīng)的就是,我們存儲開支該怎么辦?他就做另外一個調(diào)查,在你未來12—18個月之內(nèi),你的企業(yè)或者公司在下列哪些數(shù)據(jù)存儲的領(lǐng)域進(jìn)行重點(diǎn)投資呢?第一個選擇有36%的人是選擇的是備份和恢復(fù)的解決方案,要進(jìn)行重點(diǎn)的投資,第二個,有24%的人選擇了異地災(zāi)難恢復(fù)的數(shù)據(jù)復(fù)制解決方案,另外還有23%的人考慮購買新的SAN存儲系統(tǒng),有18%的人考慮投資數(shù)據(jù)削減技術(shù)。從這個上面可以看到,我們第一個作為IT的決策者,考慮是怎么樣把數(shù)據(jù)有效地去做備份和恢復(fù)。另外一個需要關(guān)注的是18%的人會考慮使用數(shù)據(jù)縮減技術(shù),也就是我們今天討論的數(shù)據(jù)刪除的技術(shù)。

談到數(shù)據(jù)保護(hù),他們又做了另外一個調(diào)查,在做數(shù)據(jù)保護(hù)里面,這個領(lǐng)域之內(nèi),貴公司現(xiàn)在面臨的主要的難題有哪些呢?有13%的決策者選擇了如何去滿足數(shù)據(jù)保護(hù)的容量要求,這很關(guān)鍵,因?yàn)槭裁?因?yàn)閿?shù)據(jù)的快速的增長,對備份來講帶來的壓力會更大,為什么呢?因?yàn)榇蠹叶贾?,備份?shí)際上它的數(shù)據(jù)量是冰山下的非常龐大的一角,你可能看到你的主存的數(shù)據(jù)只是冰山上冒出來的小山,但是備份是藏在海水里面非常龐大的一塊,可能是五倍,可能十倍于原來主存的數(shù)據(jù),所以你數(shù)據(jù)量快速的激增,帶來最讓大家頭疼的問題,就是我的備份該怎么做?我的數(shù)據(jù)這么大的容量,我采取什么樣的解決方案,在我能夠承受的成本范圍之內(nèi)做備份。另外,這么大的數(shù)據(jù),我怎么能夠在我的備份窗口內(nèi)完成備份?而相應(yīng)的,因?yàn)槲覙I(yè)務(wù)的需要,我需要恢復(fù)的時間還在不斷的去縮小我要很快地把它恢復(fù)過來,這些都是IT決策者比較頭疼的問題。另外一個,有7%的人在考慮什么?不能接受數(shù)據(jù)丟失和宕機(jī)時間。這是我第一次看到在調(diào)查里面出現(xiàn)的這個要求,因?yàn)閭鹘y(tǒng)的數(shù)據(jù)備份領(lǐng)域之內(nèi),大家都認(rèn)為備份是離線的數(shù)據(jù)保護(hù),這樣對宕機(jī)的時間要求就不會那么苛刻,如果停機(jī),大不了備份做不成,過一會重啟再做就行了,但是在新的數(shù)據(jù)中心或者IT架構(gòu)演變的過程中,大家對數(shù)據(jù)備份的宕機(jī)時間和它的可靠性,也提出了非常高的要求。

在這里面我們可以看到,根據(jù)剛才對IT決策者的幾個調(diào)查,發(fā)現(xiàn)大家在擔(dān)心什么?成本,對數(shù)據(jù)保護(hù)方案呢?容量節(jié)省。那如何去應(yīng)對呢?你可以看到,我們現(xiàn)在越來越多的重復(fù)數(shù)據(jù)刪除技術(shù)的應(yīng)用在我們的備份系統(tǒng)里面、備份軟件里面、備份的硬件設(shè)備里面,在不斷地會看到,怎么能看到呢?舉一個比較簡單的例子,你可以看到,在目前主流的存儲廠商里面,或者服務(wù)器廠商里面,大家所有的備份系統(tǒng)里面的磁盤備份系統(tǒng),一定都備份了重復(fù)數(shù)據(jù)刪除功能,已經(jīng)是標(biāo)準(zhǔn)的行業(yè)都必須要具備的功能。但是可能大家部署這種重復(fù)數(shù)據(jù)刪除的方式和實(shí)現(xiàn)的方式會有些不同,我待會兒會給大家做一個詳細(xì)的介紹。那什么是重復(fù)數(shù)據(jù)刪除呢?是真的把數(shù)據(jù)刪掉了嗎?不是,它只是把備份過來的數(shù)據(jù)拆分成不同的塊,拆成塊以后,我在里面做比對,我只保存一個,另外那些領(lǐng)域的塊的東西我放在地圖里面,我可以找到它,通過這種方式,我可以實(shí)現(xiàn)容量的節(jié)省。因?yàn)閭浞莸牟呗院蛡浞莸谋Wo(hù)的機(jī)制,從它的備份策略上可以看到,我今天可能常見的備份策略,我每周做一次全備份,每天做一次增量。也就是說我今天的數(shù)據(jù)明天要備、后天要備,大后天還要備,我備份至少三個月、半年、一年,甚至更長,你自己就可想而知,這里面重復(fù)的數(shù)據(jù)量有多大,通過重復(fù)數(shù)據(jù)刪除技術(shù),你可以感受到里面的冗余的數(shù)據(jù)塊,我可以知道這個東西在這兒,這就是重復(fù)技術(shù)刪除原理。在業(yè)內(nèi)比較標(biāo)準(zhǔn)的重復(fù)數(shù)據(jù)刪除的有效率是多少?20倍,是怎么來的?我們按照通常的備份策略,每周做一次全備份,每天做一次增量,連續(xù)八周下來去做,保留這個數(shù)據(jù)保存的周期,可以保存六周,它就可以實(shí)現(xiàn)20:1的重復(fù)數(shù)據(jù)刪除的效率,這是一個業(yè)界都認(rèn)為比較標(biāo)準(zhǔn)的重復(fù)數(shù)據(jù)刪除的算法。

所以說在另外一個調(diào)查里面,IT使用者在考慮重復(fù)數(shù)數(shù)據(jù)刪除作為主要的因素考慮的時候,你認(rèn)為重復(fù)數(shù)據(jù)刪除的方案應(yīng)該具備哪些因素對你來說是最重要的?發(fā)現(xiàn)又是成本,解決方案的成本,45%的人選擇解決方案的成本,37%的決策者選擇的是怎么樣能夠非常容易地部署它,并且使用它,33%的人選擇了我怎么樣能夠把它的備份和恢復(fù)的性能的影響,這是我考慮的一個很重要的因素。另外一個,就是28%的人選擇了對備份流程現(xiàn)有的整合。

我們可以看到,目前因?yàn)槊恳患叶加凶约旱闹貜?fù)數(shù)據(jù)刪除的技術(shù),目前市場上有幾種主流的技術(shù),我大概做了一個總結(jié),第一種是備份軟件,就是我把重復(fù)數(shù)據(jù)刪除的技術(shù)和功能部署在備份軟件上,通過備份軟件做備份的時候,從備份軟件的角度我就開始做重復(fù)數(shù)據(jù)刪除。第二種是VTL,就是虛擬帶庫,我傳統(tǒng)的虛擬帶庫里面,除了做虛擬帶庫,又加了額外的重復(fù)數(shù)據(jù)刪除的功能。還有網(wǎng)關(guān)的應(yīng)用,我給你一個重復(fù)數(shù)據(jù)刪除的網(wǎng)關(guān),你下面隨便你使用一個我要求,或者一個標(biāo)準(zhǔn)化的磁盤備份設(shè)備,你把它掛上去,你就可以做重復(fù)數(shù)據(jù)刪除了。另外一種,就是我給你提供一種非常靈活的部署的方式,但是也是在設(shè)備端,你可以基于一種NAS的方式去做重復(fù)數(shù)據(jù)刪除,也可以是VTL的數(shù)據(jù)做重復(fù)數(shù)據(jù)刪除,這是目前主流的四種重復(fù)數(shù)據(jù)刪除的方式。

哪種方式最好呢?老實(shí)說,我覺得沒有絕對的最好,因?yàn)檫@四種方式每一種方式都有各自的優(yōu)缺點(diǎn),關(guān)鍵是說這四種方式里面,對你的環(huán)境來講,對你的需求來講,哪種方式會更適合你,那我們接下來可以看一下,這四種方式,或者說從部署的方式做重復(fù)數(shù)據(jù)刪除,消除的時間上,或者各種方式上,那么它的優(yōu)缺點(diǎn)在什么地方?大家也可以對號入座一下,如果你采用重復(fù)數(shù)據(jù)刪除系統(tǒng)的話,這些優(yōu)缺點(diǎn)是不是也要考慮?哪種對你來講更重要,更有決策性。

第一,我們首先看重復(fù)數(shù)據(jù)刪除部署的方式,就是你在哪里做重復(fù)數(shù)據(jù)刪除?第一個,應(yīng)用源端,你的服務(wù)器,你應(yīng)用的服務(wù)器,比如你一臺文件的服務(wù)器,你數(shù)據(jù)的服務(wù)器,就意味著什么呢?從所有的備份源端出來的數(shù)據(jù),就是經(jīng)過重復(fù)數(shù)據(jù)刪除的。第二種就是在被備份的起始端,我可以把重復(fù)數(shù)據(jù)備份在備份服務(wù)器上,我所有經(jīng)備份服務(wù)器讀出來的數(shù)據(jù),都是經(jīng)過備份服務(wù)器刪除的。還有一種,我不想在備份源端或者備份服務(wù)器端有任何的改變,或者任何性能的影響,是不是直接給我一個設(shè)備,這臺備份數(shù)據(jù)上就具備了重復(fù)數(shù)據(jù)刪除功能,我們把這個叫做目標(biāo)端的重復(fù)數(shù)據(jù)刪除。我今天把備份數(shù)據(jù)刪除備份在源端呢?經(jīng)過最開始的地方,就可以把重復(fù)數(shù)據(jù)刪除了,帶來的好處,第一個,重復(fù)數(shù)據(jù)刪除的效率很高,另外,備份窗口會節(jié)省。因?yàn)槟銖脑炊松弦呀?jīng)判別出來這個數(shù)據(jù)已經(jīng)開始把它做了一個壓縮,或者做了數(shù)據(jù)縮減,就出來,所以你備份到經(jīng)過網(wǎng)絡(luò)上的窗口都會變短,對你帶寬的要求,對你時間窗口的要求都會降低,這是備份源端的消除。不好的地方在哪呢?它有限制,你怎么去辨別說我一天過來的備份服務(wù)器上的數(shù)據(jù)有這么多,如果我今天應(yīng)用源端上有一個非常龐大的系統(tǒng),我每天都要去掃描它,看它有沒有重復(fù)的進(jìn)來,你掃描的時間一定會變得很長,所以在這種環(huán)境里面,大家更傾向于在一些小規(guī)模部署的時候,一臺服務(wù)器上的數(shù)據(jù)量,或者數(shù)據(jù)庫不要太大,你可以選擇這個方式。但是如果你的服務(wù)器上的數(shù)據(jù)額很高的話,我勸你不要選擇。但是在一些遠(yuǎn)程分支機(jī)構(gòu)里面,你的數(shù)據(jù)量很小,也不是很大,你采用這種方式,我只需要部署一個重復(fù)數(shù)據(jù)刪除的源端在上面,就可以實(shí)現(xiàn)源端節(jié)省數(shù)據(jù),這是一個非常經(jīng)濟(jì)的解決方案,來解決你的問題。

另外一種方式,我今天說我不想在我的備份服務(wù)器源端做任何的重復(fù)數(shù)據(jù)刪除,做一些可能會增大我服務(wù)器性能負(fù)荷的一些事情,我是不是可以把它備份在備份服務(wù)器端呢?也可以,你可以把它備份在備份服務(wù)器端,從這里出來的數(shù)據(jù),再把它備份到后面的設(shè)備上去。這種方式呢,目前來講,能夠做到這種方式的廠家并不是很多,HP可以做到。還有一種,就是用戶說了,我這樣吧,我真的不想在我所有前端的備份的服務(wù)器上、應(yīng)用源上做任何的可能會增加我性能、增加我負(fù)荷的事情,你給我一個設(shè)備,這個設(shè)備自己去做重復(fù)數(shù)據(jù)刪除,也可以實(shí)現(xiàn)容量的節(jié)省,也可以實(shí)現(xiàn)低帶寬、異地的自動化的災(zāi)難恢復(fù),這種最好的選擇就是把它提供一個重復(fù)數(shù)據(jù)刪除功能的備份的目標(biāo)設(shè)備,這一部分是基本上每一個硬件廠商都會去提供的。HP、IBM,還有其他的做備份服務(wù)器的。備份服務(wù)器部署在目標(biāo)端的一大好處,所有的前端刪除工作全由這臺服務(wù)器里刪,不會影響你的架構(gòu),而且對你的備份設(shè)備有更高的要求,你的可靠性怎么樣,你的恢復(fù)性能是否能夠應(yīng)付我這么大的數(shù)據(jù)量,提出的要求可能會更高。

這是剛討論完在什么位置刪,各有各的好處,另外,什么時候開始刪?是我數(shù)據(jù)還沒有寫入磁盤的時候,還是我把所有的數(shù)據(jù)都接到磁盤上以后再刪呢?這里面就分為兩種技術(shù),如果是說我們在行業(yè)里面去定義它的話,如果說我的數(shù)據(jù)在寫磁盤之前就已經(jīng)刪除過的話,這種刪除我們叫做連線的重復(fù)數(shù)據(jù)刪除,或者叫在線的重復(fù)數(shù)據(jù)刪除,這是一種。另外一種,如果我把這個數(shù)據(jù)已經(jīng)寫入到我的磁盤之后,備份系統(tǒng)之后,我再去做刪除的話,這叫什么?叫后期處理的重復(fù)數(shù)據(jù)刪除。我們看一看這兩種重復(fù)數(shù)據(jù)刪除技術(shù)的特性,如果你采用連線的重復(fù)數(shù)據(jù)刪除,你會怎么樣?它的過程會非常簡單,所有的數(shù)據(jù)進(jìn)來的時候,就像有一個大漏斗,就是我先在上面有個過濾器,我把很多有益的數(shù)據(jù)塊過濾到唯一的,寫到磁盤上,這樣寫入的數(shù)據(jù)就非常少。這種好處是這個流程非常簡單,對用戶來說,你不需要有任何的操作,因?yàn)橹貜?fù)數(shù)據(jù)刪除這件事情不需要你來掌控,所有的事情都是這臺設(shè)備自己自動完成了,我接觸到這個數(shù)據(jù)之后,我就可以立即進(jìn)行復(fù)制,因?yàn)槲疫M(jìn)來的數(shù)據(jù)都做過重復(fù)數(shù)據(jù)刪除了,所以我馬上可以進(jìn)行復(fù)制。另外就是我所有的數(shù)據(jù)寫在磁盤上了,非常簡單,都是已經(jīng)進(jìn)行重復(fù)數(shù)據(jù)刪除過的唯一的數(shù)據(jù)塊和地圖,我恢復(fù)的時候,只要依據(jù)這個地圖,就可以把數(shù)據(jù)全部重新組裝回來,非常簡單,但是有可能在恢復(fù)的時候影響你的性能,因?yàn)橛幸粋€組裝,找尋數(shù)據(jù)塊和組裝的過程。

我們再看一下后期處理,就是寫到磁盤備份系統(tǒng)以后再做重復(fù)數(shù)據(jù)刪除,這種情況下很明顯,你先寫進(jìn)磁盤,再從磁盤上把這個數(shù)據(jù)找到,再做重復(fù)數(shù)據(jù)刪除的動作,再把它存下來,又有I/O的發(fā)生,你會發(fā)現(xiàn)你的重復(fù)數(shù)據(jù)刪除變的很復(fù)雜,因?yàn)檫€有一個把數(shù)據(jù)接收下來的流程,還有一個流程做重復(fù)數(shù)據(jù)刪除去寫的流程,之后這些工作都做完之后,還要復(fù)制到遠(yuǎn)程去,這里面規(guī)劃很重要,用戶需要根據(jù)自己窗口的特點(diǎn),怎么樣備份、去除,還有復(fù)制的三個窗口之間,能夠很好地隔離開而不影響,這個對用戶來講,管理難度就加大。它的好處也有好處,因?yàn)槭裁?因?yàn)樗诖疟P系統(tǒng)上有一個完整的數(shù)據(jù)本,就是一個全本放在那兒,我先把數(shù)據(jù)全部都備份下來了,然后我再刪,所以我有一個完全的數(shù)據(jù)副本在上面,如果我恢復(fù)的時候,如果正好你今天恢復(fù)的數(shù)據(jù)正好是昨天備份的,這個數(shù)據(jù)馬上就抓過來,不用再做數(shù)據(jù)重組,這是它的好處。但是它的成本相對比較貴,管理更復(fù)雜,越來越多的廠商在放棄這種技術(shù),轉(zhuǎn)而把重復(fù)數(shù)據(jù)刪除采用了連線的方式去做,比如說像HP、IMM、MC,重復(fù)數(shù)據(jù)刪除的方式都采用這種方式。

在談到刪除的時候,還有一個,因?yàn)樾阅芎苤匾?,恢?fù)的時候因?yàn)槟阋堰@個數(shù)據(jù)重組,根據(jù)地圖重組,抓回來的這個過程,你備份的時候需要把這個數(shù)據(jù)塊打散,再去比對,再選唯一的,這里面的性能就是非常關(guān)鍵的因素,在重復(fù)數(shù)據(jù)刪除的目前的解決方案里面,我們又可以看到兩種,一種是單節(jié)點(diǎn)的重復(fù)數(shù)據(jù)刪除解決方案,一種是多節(jié)點(diǎn),什么是單節(jié)點(diǎn)的,就是第一代的重復(fù)數(shù)據(jù)刪除的特點(diǎn),他處理重復(fù)數(shù)據(jù)刪除工作的時候,只有一個控制器來做處理。這樣的話,你升級的時候就是一個很大的問題,要不你采用一種網(wǎng)關(guān)的方式,我就不管你后面到底配什么樣的磁盤,我就給你一個網(wǎng)關(guān),你后面的磁盤表現(xiàn)的性能跟我沒關(guān)系,你愛怎么做怎么做,對客戶不負(fù)責(zé)任。還有一種,我向你賣這臺設(shè)備的時候,我已經(jīng)針對控制節(jié)點(diǎn)所能夠處理的磁盤I/O,或者所能控制的磁盤限制能力,就已經(jīng)限制好你的磁盤能夠最大擴(kuò)展到多少啊!可能我在一個小規(guī)模的節(jié)點(diǎn)里面,內(nèi)存啊,CPU啊,或者什么比較少一些,相應(yīng)能夠掛的磁盤的空間也比較少,如果頭的控制能力大一些的時候,我就把后面給你配一個大一點(diǎn)的磁盤就能做了,這樣的話,對用戶來講,實(shí)際上是一件很不公平的事情。怎么講呢?如果我是小規(guī)模的應(yīng)用,這種方式是無可厚非的,絕對可以做,我也推薦去做,因?yàn)槌杀颈容^偏移,但是如果在數(shù)據(jù)中心級的應(yīng)用,每個用戶都面臨一種轉(zhuǎn)型,就是從傳統(tǒng)的IT支持部門逐漸向IT服務(wù)角色轉(zhuǎn)換的時候,這種對以后未來不可預(yù)知性,或者未來數(shù)據(jù)量增長很大,我為了考慮到兩三年這種可能會發(fā)生的事情,我必須要在今天去投入的時候就要買一個非常昂貴的時候,哪怕這個設(shè)備今天只是存了40個T的數(shù)據(jù),但是我為此可能會為以后200T、300T的性能投資這個設(shè)備,我這個投入值得嗎?但是如果不投入的話,可能明年這個設(shè)備就已經(jīng)不能用了,我必須要新購設(shè)備。這就是單節(jié)點(diǎn)的時候,給用戶造成很大的困惑。

相應(yīng)在用戶面臨的挑戰(zhàn)這種情況下,就對應(yīng)的有一種叫多節(jié)點(diǎn)的重復(fù)數(shù)據(jù)刪除技術(shù)的產(chǎn)生,首先我可以把多個節(jié)點(diǎn),也就是多個控制器的重復(fù)數(shù)據(jù)刪除的系統(tǒng)做一個整體的系統(tǒng)做管理,對用戶來講還是一臺設(shè)備。但是我多節(jié)點(diǎn)的架構(gòu),它可以更多的去線性做數(shù)據(jù)量的吞吐和重復(fù)數(shù)據(jù)刪除的工作,和容量的拓展,簡單來講就是橫向擴(kuò)展。就是我可以通過多控制器的架構(gòu),從小規(guī)模起步,隨著未來兩年或者三年,或者你不可預(yù)測數(shù)據(jù)會漲到什么程度,我先從小規(guī)模,幾十個TB起,隨著數(shù)據(jù)增長到200T的時候,我配備200個空間,但是我不會配備相應(yīng)的空間我會把處理200T的數(shù)據(jù)的性能給你。這樣用戶就可以非常放心的從目前小規(guī)模的配置起步,然后以后隨著你容量拓展的同時,也幫你提升性能,同時還可以做到附帶均衡。這就是單節(jié)點(diǎn)和多節(jié)點(diǎn)技術(shù)的對比,實(shí)際上這也是第一代重復(fù)數(shù)據(jù)刪除和第二代重復(fù)數(shù)據(jù)刪除之間的非常大的區(qū)別。

所以在采用傳統(tǒng)的重復(fù)數(shù)據(jù)刪除技術(shù),第一代,大概是在北美市場1999年或者2000年初的時候就已經(jīng)產(chǎn)生的技術(shù),但是直到現(xiàn)在,大多數(shù)廠商依然在用這種重復(fù)數(shù)據(jù)刪除第一代的技術(shù),這種第一代的技術(shù),數(shù)據(jù)效率會非常低下,因?yàn)椴捎脝慰刂破鞯募軜?gòu),恢復(fù)的時候可能要從若干個數(shù)據(jù)塊里面去做地圖匹配,也沒有一些更好的優(yōu)化,那你的恢復(fù)性能,通常在第一段的恢復(fù)性能是一個最大的挑戰(zhàn),所以你經(jīng)??吹胶芏鄰S家發(fā)布一些白皮書,或者一些數(shù)據(jù)的彩頁的時候,你只能看到數(shù)據(jù)恢復(fù)不知道是多少。還有,第一代技術(shù)兼容性非常差,大家可以看到,我們重復(fù)數(shù)據(jù)刪除部署的方式,可以備份在備份目標(biāo)段,應(yīng)用服務(wù)其段,在第一代中,這三種地方的部署方式是不兼容的,也就是說很多第一代的技術(shù),我在備份源端采用的是一種重復(fù)數(shù)據(jù)刪除的技術(shù),在目標(biāo)端采用的是另外一種。你說有沒有一種方式把備份源端的數(shù)據(jù)傳到數(shù)據(jù)中心去呢,目標(biāo)端上的設(shè)備?對不起,不能做,因?yàn)閮煞N技術(shù)不一樣,你必須怎么做呢?你把備份服務(wù)端的數(shù)據(jù)恢復(fù)過來,還原,我再幫你把它送到數(shù)據(jù)中心,你再做重復(fù)數(shù)據(jù)刪除。這樣的話,你就對你的系統(tǒng)管理的效率非常差,而且你數(shù)據(jù)之間交換的時候必須有一個數(shù)據(jù)再重組、再還原的過程,帶來一個最大的問題,網(wǎng)絡(luò)帶寬的要求會非常高。

現(xiàn)在在北美的一個市場上,大家在講重復(fù)數(shù)據(jù)刪除的時候,就已經(jīng)在講的是第二代重復(fù)數(shù)據(jù)刪除技術(shù)了,那第二代重復(fù)數(shù)據(jù)刪除技術(shù),就是下一代重復(fù)數(shù)據(jù)刪除技術(shù),它要解決的問題就是第一代重復(fù)數(shù)據(jù)刪除所面臨的這些拓展性受限制啊,技術(shù)不兼容的問題啊,部署方式非常的僵硬啊,所以在第二代的重復(fù)數(shù)據(jù)刪除里面,我們大家都可以看到,它具備以下幾個特征:第一,橫向擴(kuò)展。橫向擴(kuò)展簡單來講,就是你的容量和性能可以同時去進(jìn)行擴(kuò)展,所以說你的初始的投入就可以從非常便宜又經(jīng)濟(jì)的方式做投入,但是也有未來你不可預(yù)測的數(shù)據(jù)的快速的增長啊,你需要大量的去處理的這個性能。第二,你重刪系統(tǒng)所具備的高性能。因?yàn)槟愕臄?shù)據(jù)增長量很快,我本身去做備份這件事情,也要花費(fèi)我很多的服務(wù)器啊,以及網(wǎng)絡(luò)帶寬的占用啊,已經(jīng)負(fù)荷很大了,你在備份這件事情上要再多一層,再做重復(fù)數(shù)據(jù)刪除,所以性能往往是使重復(fù)數(shù)據(jù)刪除技術(shù)面臨非常大的挑戰(zhàn)。所以在第二代重復(fù)數(shù)據(jù)刪除技術(shù)里面,就要考慮性性能的提升和擴(kuò)展性上,給了非常好的解決的辦法。第三個,可攜帶的重復(fù)數(shù)據(jù)刪除的引擎。什么叫可攜帶,很簡單,就是重復(fù)數(shù)據(jù)刪除引擎非常容易部署,這就是一個引擎,可以部署在一個備份軟件里面,備份在應(yīng)用服務(wù)器的源端,也可以備份在目標(biāo)設(shè)備上,完成重復(fù)數(shù)據(jù)刪除這件事情,這也是第二代重復(fù)數(shù)據(jù)刪除技術(shù)要去做的。

另外,全域名的重復(fù)數(shù)據(jù)刪除,包括你部署方式的選擇,還有非常關(guān)鍵的,所有這些東西,你會發(fā)現(xiàn)第二代重復(fù)數(shù)據(jù)刪除在把你重復(fù)數(shù)據(jù)刪除這個領(lǐng)域不斷擴(kuò)大,規(guī)模不斷擴(kuò)大,在大規(guī)模的重復(fù)數(shù)據(jù)刪除的IT架構(gòu)下面,你怎么樣做到統(tǒng)一的、自動化的透明的方式,對用戶來講也非常重要,這就是2.0第二代重復(fù)數(shù)據(jù)刪除技術(shù)所要具備的特點(diǎn)。那是不是還有第三代?有,但是現(xiàn)在還沒有開始,我先講一下第三代的技術(shù)要走到什么程度,就是云。

我今天要給大家講一下惠普的重復(fù)數(shù)據(jù)刪除在數(shù)據(jù)領(lǐng)域保護(hù)里面的應(yīng)用和惠普在數(shù)據(jù)保護(hù)里面針對重復(fù)數(shù)據(jù)刪除的戰(zhàn)略。我們的重復(fù)數(shù)據(jù)刪除叫什么名字呢?叫StoreOnce,顧名思義,只存一次,很好地詮釋了重復(fù)數(shù)據(jù)刪除的定義,不是刪除,而是只存一次。惠普的StoreOnce有哪些特性呢?它是因?yàn)橐槍υ趺慈?yīng)對第一代傳統(tǒng)的重復(fù)數(shù)據(jù)刪除遭遇的瓶頸,它為了解決它而應(yīng)運(yùn)而生。第一代的問題剛才也提到過,就是因?yàn)楫a(chǎn)品無序地去做擴(kuò)張,因?yàn)槟愕募軜?gòu)很僵硬,我只能做的是加設(shè)備,加設(shè)備,你技術(shù)不兼容性,就導(dǎo)致在你的IT架構(gòu)里面存在很多的獨(dú)立的重復(fù)數(shù)據(jù)刪除的孤島,我可能在虛擬化里面有一個孤島,在遠(yuǎn)程辦公室里面又有一個孤島,在數(shù)據(jù)中心又有一個孤島,這三個孤島之間怎么做通訊,對不起,沒有答案。所以說它就到了一個結(jié)果,就是你的擴(kuò)展性很差,性能很差,而且最可怕的是單控制器的重復(fù)數(shù)據(jù)刪除帶來的這種風(fēng)險,一旦你在做備份的時候,這一個單節(jié)點(diǎn)發(fā)生的故障以后,你的備份作業(yè)就會停掉。如果在一些小規(guī)模的應(yīng)用里面,我覺得這個也是OK的,因?yàn)閺膩矶际秋L(fēng)險跟你的成本之間是互相要去平衡的。但是在數(shù)據(jù)中心的關(guān)鍵級的應(yīng)用里面,高可用性是用戶非常關(guān)注的特點(diǎn),你不能想象,在一個大型的數(shù)據(jù)中心里面,你今天做備份的時候,停機(jī)了,你第二天來的時候,發(fā)現(xiàn)昨天的備份沒有做,主存系統(tǒng)發(fā)生了問題,數(shù)據(jù)從哪來,怎么恢復(fù),沒有人知道,這是非常大的災(zāi)難。

所以我們惠普的StoreOnce作為第二代重復(fù)數(shù)據(jù)刪除技術(shù),它首先實(shí)現(xiàn)了第一個,一個重復(fù)數(shù)據(jù)刪除引擎,就是說我無論部署在我的應(yīng)用服務(wù)器源端,還是我的備份服務(wù)器端,還是目標(biāo)端的服務(wù)器上,只有一個引擎,就是StoreOnce,通過StoreOnce,我們就可以在任何位置實(shí)現(xiàn)重復(fù)數(shù)據(jù)刪除,而且去做數(shù)據(jù)塊在幾個不同的重復(fù)數(shù)據(jù)刪除的領(lǐng)域當(dāng)中去做數(shù)據(jù)塊的移動,就是只刪一次,數(shù)據(jù)塊在整個保護(hù)當(dāng)中也只流動一個。同時,它還提供了一種中央的管理方式,就是所有的重復(fù)數(shù)據(jù)刪除的設(shè)備,或者你的架構(gòu),都可以在一個管理界面里面去看得到,包括你的復(fù)制。另外一個非常重要的一點(diǎn),就是它實(shí)現(xiàn)了橫向擴(kuò)展的性能和容量,第二代重復(fù)數(shù)據(jù)刪除,StoreOnce,尤其是StoreOnce2.0,采用了面向未來設(shè)備的重復(fù)機(jī)構(gòu),我可以從小規(guī)模部署起步,在你容量拓展的同時,提升你的性能,而且非常重要的一點(diǎn),這是行業(yè)目前唯一一個可以做到的,高可用性。我采用橫向擴(kuò)展的架構(gòu)呢,所以我總共配了四對八個控制器,最高,但是作為一個最初始的配置,送到用戶現(xiàn)場的時候,我面向數(shù)據(jù)中心這一塊應(yīng)用的時候,也是雙節(jié)點(diǎn)的控制器。在雙節(jié)點(diǎn)的控制器之間,如果說你在備份工作的時候,因?yàn)榉N種原因,可能一個控制節(jié)點(diǎn)發(fā)生了問題,我另外一個控制節(jié)點(diǎn)自動把任務(wù)切過來,自動接管備份工作,所以你的備份業(yè)務(wù)是不會停機(jī)的,所以在面向應(yīng)用數(shù)據(jù)中心應(yīng)用的時候,不用擔(dān)心故障,這是StoreOnce2.0的好處。

我們具體來看一下,我說了這么多,好像你剛才說的也沒有橫向擴(kuò)展啊,性能很好啊,到底有沒有一個指標(biāo)啊?給大家一個概念,目前來講,我們StoreOnce支持B200在Catalyst的支持下,我們可以實(shí)現(xiàn)每小時高達(dá)100TB的備份性能,這是目前性能最高的,只有StoreOnce可以做到,每小時100個TB。如果我們考慮到前端什么都不用管,在備份服務(wù)器上,都不要部署任何的軟件的話,那你這臺設(shè)備,本機(jī)的性能能做到多少呢?一臺我們面向數(shù)據(jù)中心級的的話,每小時可以做到40個TB,就是純粹的單臺設(shè)備的性能可以達(dá)到40個TB,這也是目前業(yè)內(nèi)最快的。我剛才提到,第一代重復(fù)數(shù)據(jù)刪除里面有一個非常重要的問題,就是它的恢復(fù)性能很低下,在第二代,StoreOnce第二代重復(fù)刪除技術(shù)里面,在這上面做了非常大的提升,我們通過惠普實(shí)驗(yàn)室的創(chuàng)新的算法和一些索引結(jié)構(gòu)上的調(diào)優(yōu),所以我的恢復(fù)性能也可以做到跟我的備份性能相等,就是可以做到每小時40TB,這也是目前業(yè)界最快的一臺做數(shù)據(jù)的重復(fù)備份設(shè)備。它還有一個非常大的,就是它是目前行業(yè)內(nèi)首款,也是一個獨(dú)有的高可用的特點(diǎn),它可以做到數(shù)據(jù)之間的故障節(jié)點(diǎn)的切換,自動的切換,沒有單點(diǎn)故障。這種業(yè)務(wù)影響呢,我們可以說一個大家比較容易感受的好處,如果你之前采用第一代重復(fù)數(shù)據(jù)刪除里面,就是業(yè)界最快的一款備份的設(shè)備,第一代的,StoreOnce2.0跟它的性能相比的話,我們每天可以在備份窗口上為你節(jié)省六個小時,這六個小時你可以拿來做應(yīng)用,6個小時什么概念?我們正常的情況下每天是8小時的備份窗口,你通過采用StoreOnce2.0,就可以幫你節(jié)省6個小時,你可以看到,這種性能上的提升和進(jìn)步有多么大!

第二個,StoreOnce的特點(diǎn)就是靈活。首先,它可以實(shí)現(xiàn)任意位置的重復(fù)與消重,應(yīng)用服務(wù)段、備份服務(wù)器和目標(biāo)端,什么位置都可以。從災(zāi)備的考慮,因?yàn)楹芏嗫蛻裘鎸Ψㄒ?guī)遵從,尤其金融業(yè)的客戶,我看到很多政府類的客戶,也受到國家法規(guī)遵從的要求,必須有兩點(diǎn)災(zāi)備,異地災(zāi)備,在異地災(zāi)備里面,我們可以從數(shù)據(jù)中心到多個災(zāi)備站點(diǎn),這多個災(zāi)備站點(diǎn)里面的副本都是同步的。而且我們數(shù)據(jù)保護(hù)的策略應(yīng)該非常的靈活,你可以在任何時間,任意的位置去刪除,或者是去把它給并機(jī)到你已經(jīng)過期的數(shù)據(jù)。

另外一個就是簡化。我們通過按需付費(fèi)的橫向擴(kuò)展,從小容量開始,同步增加容量和性能。可以使你的數(shù)據(jù)中心擯棄傳統(tǒng)的叉車式升級的困境。而這所有的工作,我們可以通過備份臺實(shí)現(xiàn),聯(lián)合重復(fù)數(shù)據(jù)刪除,就是一個重復(fù)數(shù)據(jù)刪除,唯一的重復(fù)數(shù)據(jù)刪除的算法,僅在你的整個企業(yè)的IT架構(gòu)里面移動消重的數(shù)據(jù),只存一次,移動來的都是唯一的更新的數(shù)據(jù)塊。我們從數(shù)據(jù)中心,可以管理到遠(yuǎn)程站點(diǎn)的所有的數(shù)據(jù)保護(hù)。對我們面向數(shù)據(jù)中心級的B6200來講,它可以支持384個遠(yuǎn)程站點(diǎn)的數(shù)據(jù),這個目前來講,也只有惠普StoreOnce可以做到,可以你可以看到,越來越多的全球的大企業(yè),在把惠普StoreOnce作為他們數(shù)據(jù)保護(hù)和數(shù)據(jù)存設(shè)備,這也是一個很重要的原因。

這是目前來講HPStoreOnce產(chǎn)品家族線涵蓋點(diǎn)非常全面,這個成本也是從小到大,我們可以把StoreOnce部署在我們的備份軟件里面,實(shí)現(xiàn)應(yīng)用源端的重復(fù)數(shù)據(jù)消重,也可以備份在備份服務(wù)器端,部署在DP上,我們也一樣可以做到。在一些ROBO的環(huán)境里面,如果用戶既需要本地的用戶保護(hù),又想把數(shù)據(jù)復(fù)制到數(shù)據(jù)中心,我們有StoreOnce2500小規(guī)模、小配置的作為本地的數(shù)據(jù)備份。面對中小型企業(yè),或者小型數(shù)據(jù)中心的時候,我們會有StoreOnce41XX系統(tǒng)的產(chǎn)品,面對一些數(shù)據(jù)中心和稍微大的企業(yè)的話,我們有StoreOnce43XX的產(chǎn)品來幫助大家去解決這個問題,相對來講,它的成本也會比較便宜。最右邊這一款,很高的話,這個是我們專門為大型的數(shù)據(jù)中心去設(shè)計,去滿足這種關(guān)鍵業(yè)務(wù)系統(tǒng)備份的磁盤備份設(shè)備,StoreOnceB6200,它可以每小時達(dá)到100個TB每小時業(yè)界最快的性能,同時也是行業(yè)內(nèi)第一款可以做到自動化的磁盤設(shè)備。所以說HP為大家提供了一個非常完整的,從軟件到硬件,從低成本到高成本,從滿足現(xiàn)在的和滿足未來的所有的這些數(shù)據(jù)保護(hù)的方案,我們已經(jīng)全部都涵蓋了,基本上你可以在HP找到你想要的東西。

這張圖是我們StoreOnce,是我們面向大型企業(yè)的數(shù)據(jù)中心,面向關(guān)鍵應(yīng)用系統(tǒng)的一塊備份設(shè)備,有業(yè)界最快的備份和恢復(fù)性能,為用戶可以提供端到端的數(shù)據(jù)保護(hù),而它的備份的容量可以高達(dá)768TB,這是重刪之后的,而且它有靈活的部署的方式。這么大的設(shè)備,還有包括所有的StoreOnce的設(shè)備,在IT架構(gòu)里面,我們都可以通過單一的控制臺來做其中的管理,它的備份速度可以實(shí)現(xiàn)每小時100TB,恢復(fù)每小時400TB,它有高達(dá)75%的性價比,所以如果你們采購StoreOnce這種設(shè)備的話,相信對大家現(xiàn)在、未來,還有成本上的節(jié)省,都會給大家一個非常好的解決方案,也是別人無可替代的。

這是一個我們事例,你可以看到,在這邊,如果有一個節(jié)點(diǎn)壞掉的話,另外一個節(jié)點(diǎn)會自動接管。為什么會這么強(qiáng)大呢?我經(jīng)常去跟用戶講B6200,我講StoreOnce,用戶第一反應(yīng)就是你們怎么比別人強(qiáng)這么多呢,你們是不是有虛構(gòu)的嫌疑?我說我剛才講的所有的指標(biāo),都是在惠普上標(biāo)準(zhǔn)的官方網(wǎng)站上可以看得到的。它為什么能夠?qū)崿F(xiàn)這么卓越的性能和特性呢?首先,這個技術(shù)是由HP實(shí)驗(yàn)室自己去創(chuàng)新的,不是我們收購,或者是我們?nèi)EM別人的,這是HP自己研發(fā)的一款產(chǎn)品。在這里,大概有涉及到了HP的專利技術(shù)有高達(dá)50多個專利技術(shù),就是在重復(fù)數(shù)據(jù)刪除里面有50多個,這是很驚人的。因?yàn)槲覀儚牡诙_始起步,基于第一代之上,有50多個專利,你可以看到,有非常大的改進(jìn)。包括我們技術(shù)索引的架構(gòu),可以節(jié)省內(nèi)存和IO的需求,也就是說你做重復(fù)數(shù)據(jù)刪除的時候,你重復(fù)數(shù)據(jù)刪除的性能可能要依托于I/O的性能,今天在實(shí)現(xiàn)同等性能之下,我可以比競爭對手采用更少的內(nèi)存,采用更少的磁盤I/O,所以說我的性價比可以實(shí)現(xiàn)競爭對手的75%,這也是很重要的一個原因。另外就是它的快速恢復(fù)。

剛才講了一些行業(yè)的數(shù)據(jù)保護(hù)方面的一些趨勢,一些比較泛泛的行業(yè)內(nèi)大家去看,真的如果是采用了HP的數(shù)據(jù)保護(hù)的解決方案,對用戶的業(yè)務(wù)來講,對你的數(shù)據(jù)保護(hù)的數(shù)據(jù)來講,能夠解決哪些問題呢?我們先來看一下,現(xiàn)在數(shù)據(jù)保護(hù)方面面臨的幾個主要的挑戰(zhàn),數(shù)據(jù)快速的增長,帶來了很多的問題,第一個,你的數(shù)據(jù)備份窗口是不是八個小時窗口,你可以在八個小時窗口可以完成備份,第二個,你的業(yè)務(wù)部門在不斷向你提出更高的RPO的需求,你是不是能夠在他的要求的范圍內(nèi)快速把數(shù)據(jù)恢復(fù),相應(yīng)他業(yè)務(wù)的需要。第三個,我們商業(yè)的規(guī)模在不斷擴(kuò)大,尤其可以看到,中國的企業(yè)更多的在國外設(shè)置分支機(jī)構(gòu)和廠,這些分支機(jī)構(gòu)和遠(yuǎn)程辦公室的數(shù)據(jù)怎么保護(hù),怎么上收上來,這個問題怎么解決?另外一個,災(zāi)難恢復(fù)的工作怎么做?因?yàn)樵絹碓蕉嗟姆ㄒ?guī),行業(yè)的要求,包括上市公司硬性的規(guī)定,金融行業(yè)強(qiáng)制的數(shù)據(jù)保護(hù)的要求,你在這種情況下,怎么做你的災(zāi)備,這些都是我們數(shù)據(jù)保護(hù)面臨的四個主要的挑戰(zhàn)。

所以我們又回到EST的調(diào)查里面,在2012IT投資優(yōu)先級排序里面,IT決策者又一次把關(guān)注點(diǎn)在數(shù)據(jù)保護(hù)上,因?yàn)榇蠹揖褪菙?shù)據(jù)增長和IT投入上做一個最佳的平衡點(diǎn),你怎么樣節(jié)省IT成本的前提下,能夠應(yīng)對你的數(shù)據(jù)的大量的增長?所以你可以看到,在六個最受關(guān)注項(xiàng)里面,有四個都是跟數(shù)據(jù)保護(hù)有關(guān)的,改善災(zāi)難恢復(fù),管理數(shù)據(jù)增長,增強(qiáng)信息的安全,改進(jìn)業(yè)務(wù)連續(xù)性和災(zāi)難恢復(fù)。通過HP新一代數(shù)據(jù)保護(hù)解決方案,我們可以幫助用戶滿足備份窗口,滿足40%的數(shù)據(jù)增長,還有用于管理的數(shù)據(jù)保護(hù)的員工的人數(shù)卻沒有增加,而你的IT是持平,或者很多的部門是在不斷的下降。StoreOnce通過它無以倫比的備份速度,縮短你的備份窗口每天高達(dá)6小時。

這邊有一個StoreOnce的成功案例,這是一個大學(xué)的成功案例,它采用了右邊的是用戶的評語,我就不再多講了。大家可以看一下幾個關(guān)注點(diǎn),通過使用StoreOnce,他的備份的性能、備份速度比之前快了10倍,它服務(wù)器的停機(jī)時間減少了80%,它需要備份的容量節(jié)省到1/15,也就是說在我們做調(diào)查的時候,他的重復(fù)數(shù)據(jù)刪除的效率應(yīng)該是在15倍左右。而對他來講,他的服務(wù)器的增長已經(jīng)增長了5倍,但是他相應(yīng)的IT管理人員只有兩個人就可以管理這些服務(wù)器增長造成的數(shù)據(jù)的處理和日常的管理工作。所以說這樣IT人員就可以多了2.5倍的時間不是做維護(hù),而是做一些IT的戰(zhàn)略的計劃。

通過StoreOnce,我們可以去幫助用戶滿足快速恢復(fù)的服務(wù)級別的協(xié)議,就是快速恢復(fù)的SLA,因?yàn)橄到y(tǒng)規(guī)模在不斷擴(kuò)大,所以更多的數(shù)據(jù)需要在很短的時間內(nèi)做恢復(fù),而一個很可笑的事情是什么呢?大多數(shù)目前的備份廠商不注重恢復(fù),只會給你講我備份能夠做到多快,我可以把你的備份怎么樣,所有的焦點(diǎn)都集中在備份上,很少有人講我的恢復(fù)是什么,我的恢復(fù)能做到什么,我可以幫助怎么樣優(yōu)化你的恢復(fù)的流程,很少有人這樣講。StoreOnce提供了非??焖俚幕謴?fù)的速度,我們?nèi)€的產(chǎn)品,基本上恢復(fù)速度和備份速度是非常接近的,在B6200里面,你可以看到,恢復(fù)速度和備份速度是一樣的,所以可以高達(dá)40TB/小時的速度恢復(fù)數(shù)據(jù)。只有HP公開了恢復(fù)性能,其他都沒有公開恢復(fù)性能,我們彩頁上都是備份性能可以做到多少,恢復(fù)性能可以做到,兩個指標(biāo)在上面。我們HP可以提供節(jié)點(diǎn)自動重啟的功能,確保你的恢復(fù)一定可以做,另外我們有單點(diǎn)故障,確保你的系統(tǒng)一直在可用的狀況下。所以我們和我們最接近的競爭對手相比,他的優(yōu)勢也高達(dá)75%。

這是比較看重恢復(fù)的用戶的案例,這是一個包裝公司,通過它使用StoreOnce的時候,它恢復(fù)它一些圖形設(shè)計的數(shù)據(jù),它說它以前必須先恢復(fù)一個完整的備份和所有的增量備份,這個大概要花費(fèi)多長時間呢?一周的時間,才可以把這個設(shè)備恢復(fù)到可用的狀況,用StoreOnce備份的時候,將這個數(shù)據(jù)回回數(shù)據(jù)中心的時候,恢復(fù)只需要幾分鐘,減少了12倍,數(shù)據(jù)恢復(fù)提高了5恩倍,這樣給圖形設(shè)計工程師每個月增加20個小時的生產(chǎn)力,減少了容量的采購,而且也不需要部署額外的系統(tǒng)增加容量,部署在StoreOnce上面就可以做容量的擴(kuò)展,所以很好地幫助優(yōu)化存儲的成本。

第三個,也是一直以來在數(shù)據(jù)保護(hù)領(lǐng)域大家都面臨的問題,就是災(zāi)難恢復(fù)的問題。講這個之前,我不知道在座各位的災(zāi)難恢復(fù)目前是怎么去做的。我之前一直在賣備份,備份實(shí)際磁帶技術(shù)已經(jīng)用了很多年了,幾十年了,在一些大量的金融機(jī)構(gòu)里面,采用災(zāi)難恢復(fù)的要求,都是通過磁帶運(yùn)輸?shù)姆绞饺プ龅?,就是把這個磁帶在本地備份完,然后通過人工方式把它運(yùn)輸?shù)疆惖厝?,這樣的話,我就保證我的數(shù)據(jù)有兩地的存放,可以應(yīng)對我這種政策性強(qiáng)制的要求。在這種情況下,就帶來兩個問題,第一個,你可能在運(yùn)輸?shù)倪^程當(dāng)中造成你的數(shù)據(jù)丟失,這個我想在花旗銀行啊,還有美國銀行里面,經(jīng)常隔兩年會看到這種案例,在運(yùn)輸過程丟失了,大量的信用卡的數(shù)據(jù)被暴露了,帶來什么什么樣的損失,這個實(shí)際上就是一些傳統(tǒng)的用磁帶性數(shù)據(jù)災(zāi)難恢復(fù)的時候面臨的問題。有些就說,為什么不通過一種自動化復(fù)制的方式,把磁帶的方式復(fù)制到異地去呢?是技術(shù)不可行嗎?技術(shù)是可行的,備份軟件都支持,為什么不采用呢?就是它的備份軟件帶寬要求過高。要求30到40TB,如果要一個網(wǎng)絡(luò)帶寬傳輸?shù)脑?,你算一算要多長時間,而且一定有要求,你通過傳統(tǒng)的以太網(wǎng)傳輸?shù)脑?,這項(xiàng)工作是根本不可能實(shí)現(xiàn)的,所以你看到,很多的傳統(tǒng)的災(zāi)難恢復(fù)的策略,還都是采用運(yùn)輸磁帶的方式。

通過StoreOnce重復(fù)刪除的技術(shù),我們可以幫助用戶解決傳統(tǒng)的問題,它可以基于低帶寬,就是基本上可以用現(xiàn)有的以太網(wǎng)的帶寬就完成數(shù)據(jù)復(fù)制,為什么呢?因?yàn)槲覀兊臄?shù)據(jù)復(fù)制是基于重復(fù)性刪除的,我每天在網(wǎng)絡(luò)上去復(fù)制的數(shù)據(jù),并不是說真正把每天產(chǎn)生的幾十個TB的數(shù)據(jù)全部復(fù)制到對方去,而是只傳輸唯一的改變的數(shù)據(jù)塊,部署的時候,可能在本地有一個已經(jīng)經(jīng)過處理的磁盤的部署方式,在異地有一個災(zāi)備設(shè)備去做,我只部署兩臺設(shè)備之間的差異量,這樣的話,每天要傳的數(shù)據(jù)很少,至少會減少10倍左右,所以你會看到,大量的StoreOnce的災(zāi)難恢復(fù)的解決方案,都是基于已有的網(wǎng)絡(luò)的以太網(wǎng)的帶寬,4M、6M、10M,就可以幫助解決異地災(zāi)難恢復(fù)的問題。

這里面又有一個異地災(zāi)難恢復(fù)的廣告公司的成功案例,他現(xiàn)在每天只需要花幾分鐘管理這個流程,而在過去,可能要需要一天的時間。對于遠(yuǎn)程分支機(jī)構(gòu)的保護(hù),實(shí)際上遠(yuǎn)程分支機(jī)構(gòu)是我們最近通過調(diào)查,包括ESG的調(diào)查,會發(fā)現(xiàn),越來越多的企業(yè)當(dāng)中的數(shù)據(jù)都產(chǎn)生在從遠(yuǎn)程分支機(jī)構(gòu)產(chǎn)生,有高達(dá)50%,甚至我以前看過一個調(diào)查,高達(dá)80%的數(shù)據(jù)都是分支機(jī)構(gòu)產(chǎn)生的。但是在分支機(jī)構(gòu)產(chǎn)生大量的數(shù)據(jù),實(shí)際有一個很大的問題,大家都知道,在分支機(jī)構(gòu)里面的IT的部署是非常少的,所以他沒有辦法提供專業(yè)的IT保護(hù),所以說造成你備份啊,或者你做災(zāi)難恢復(fù)的副本都不可靠,而且經(jīng)常備份操作是沒有辦法成功的,而且你也沒有辦法去檢查他。

通過StoreOnce這種解決方案,我們就可以為復(fù)制機(jī)構(gòu)提供非常強(qiáng)大的保護(hù),大家看這個圖就比較簡單,這個圖的左側(cè)就是分支機(jī)構(gòu)的數(shù)據(jù)或者部署方式,可以由大型的,中型的或者小型的,你可以通過這種方式,你可能只需要部署一個StoreOnce軟件,部署在服務(wù)器上,走低帶寬的方式,就可以部署到數(shù)據(jù)中心的大型的設(shè)備上。在這兩種方式下面,你都可以發(fā)現(xiàn)在本地不用部署硬件設(shè)備,就只部署一個軟件就可以了。如果他說我需要本地的數(shù)據(jù)保護(hù)我就可能怎么樣呢?它通過本地部署一臺可以重復(fù)利用刪除的數(shù)據(jù),把它部署在這個設(shè)備上,經(jīng)過重復(fù)數(shù)據(jù)山刪除之后,把它復(fù)制到數(shù)據(jù)中心來。所以你可以通過StoreOnce的解決方案,幫助客戶應(yīng)對各種需求的遠(yuǎn)程數(shù)據(jù)的保護(hù),通過這一個解決方案,全部都涵蓋掉了,所以說它非常的經(jīng)濟(jì)。

這是一個在國外的ROBO的案例,在瑞士、愛爾蘭、法國、捷克、西班牙,他們的帶寬最寬的才10M而已,通過這個帶寬,在他們國家部署一臺ROBO的設(shè)備,把它全部復(fù)制到在英國的數(shù)據(jù)中心去,英國部署兩臺StoreOnce備份系統(tǒng)。對于長期的,可能高達(dá)數(shù)十年十年的數(shù)據(jù)備份,把它規(guī)整到我們硬件的磁帶庫里面,這是一個非常典型的ROBO的案例。

所以通過數(shù)據(jù)保護(hù),HP可以幫你去節(jié)省時間和金錢。我覺得這個經(jīng)常會是一句空話,因?yàn)槲覀兘?jīng)常會說,省錢省時間,可能大大小小的廣告都有,但是,我相信通過我剛才給大家的對于我們StoreOnce新一代數(shù)據(jù)保護(hù)方案的介紹,你就會知道,我們的時間和金錢的節(jié)省,都有非常多的事實(shí)和數(shù)據(jù)去做支撐。

在這邊,想給大家講一下,我講這么多新一代的數(shù)據(jù)保護(hù),全是在講磁盤的數(shù)據(jù)保護(hù)的解決方案,大家是不是會有一個問題,那是不是意味著磁帶就消亡了?是不是磁帶真的就不需要了?答案肯定是不是的,那只是說不可避免的是說,磁帶在你整個數(shù)據(jù)保護(hù)的架構(gòu)里面,能夠起到的作用在逐漸的被削弱,你會看到,大量的主要的磁盤備份工作在開始由磁盤來承擔(dān),但是磁帶庫,或者磁帶這種解決方案,依然在你的數(shù)據(jù)中心里面是不可替代的一個解決方案。

分享到

wangguang

相關(guān)推薦