西瓜哥 發(fā)表于:13年09月04日 12:02 [原創(chuàng)] DOIT.com.cn
存儲(chǔ)在線專(zhuān)欄文章:之前,西瓜哥已經(jīng)介紹了所有的高端存儲(chǔ)產(chǎn)品,包括EMC Symmetrix、HDS VSP、IBM DS8000、IBM XIV、HP 3PAR和富士通DS8700等。今天起我們發(fā)表西瓜哥寫(xiě)的關(guān)于高端存儲(chǔ)的技術(shù)原理,首先介紹下《高端存儲(chǔ)快照實(shí)現(xiàn)原理解讀》。
我個(gè)人認(rèn)為對(duì)于高端存儲(chǔ)來(lái)說(shuō),RIAD和快照是所有上層應(yīng)用的基礎(chǔ)。前面我在切西瓜刀法中說(shuō)過(guò),RAID和后面的分層和瘦分配關(guān)系很大,有一個(gè)好的RAID基礎(chǔ),如采用RAID 2.0塊虛擬化技術(shù),上層的動(dòng)態(tài)分層和精簡(jiǎn)配置應(yīng)用實(shí)現(xiàn)就會(huì)更加靈活和高效。同樣,快照技術(shù)是災(zāi)備的基礎(chǔ),在LUN的復(fù)制、遷移、數(shù)據(jù)的本地備份、遠(yuǎn)程復(fù)制等等都需要用到快照技術(shù)的支持。因此,陳列的一切增值功能的底層基礎(chǔ)都是RAID和快照。
存儲(chǔ)快照技術(shù):SNIA(StorageNetworking Industry Association)對(duì)快照(Snapshot)的定義是:關(guān)于指定數(shù)據(jù)集合的一個(gè)完全可用拷貝,該拷貝包括相應(yīng)數(shù)據(jù)在某個(gè)時(shí)間點(diǎn)(拷貝開(kāi)始的時(shí)間點(diǎn))的映像?煺湛梢允瞧渌硎镜臄(shù)據(jù)的一個(gè)副本,也可以是數(shù)據(jù)的一個(gè)復(fù)制品。
講快照實(shí)現(xiàn)原理之前,我們先給大家講業(yè)界一個(gè)IT人士丁老師給我們講的一個(gè)小故事。丁老師是我非常敬佩的產(chǎn)品銷(xiāo)售人員,現(xiàn)在也在銷(xiāo)售高端存儲(chǔ)產(chǎn)品。一天,丁老師去和客戶(hù)交流高端存儲(chǔ),在噴了半天講完產(chǎn)品后,精彩的場(chǎng)景發(fā)生了:
笑話(huà)聽(tīng)罷,我們來(lái)講講高端存儲(chǔ)快照實(shí)現(xiàn)的兩種技術(shù)。
目前實(shí)現(xiàn)快照一般有兩種方法,傳統(tǒng)的存儲(chǔ)快照技術(shù)COW(Copy-On-Write)和現(xiàn)在漸漸流行的基于寫(xiě)重定向的存儲(chǔ)快照技術(shù)ROW(Redirect-On-Write)。
3PAR采用COW技術(shù),我們用它舉例來(lái)看一下實(shí)現(xiàn)原理:
大家看到,快照創(chuàng)建的以后,如果有對(duì)原卷的數(shù)據(jù)修改,修改的數(shù)據(jù)第一次被修改的時(shí)候就把數(shù)據(jù)COPY到快照卷里,如圖中的D。只需要第一次修改的時(shí)候復(fù)制,因此有些書(shū)也把這種技術(shù)叫COFW(Copy-On-First-Write)。
而IBM XIV采用完全一種不同的技術(shù)ROW(Redirect-On-Write),我們來(lái)看一下XIV如何做的:
大家可以看到,ROW的不做復(fù)制,如果原卷有數(shù)據(jù)塊被修改,重新寫(xiě)到一個(gè)新的地方好了,原卷的修改一下數(shù)據(jù)塊指針,這個(gè)動(dòng)作非?,而快照卷不用做任何改變。
估計(jì)你馬上會(huì)問(wèn)我,那個(gè)技術(shù)好,我就知道為這么問(wèn),哈哈。
這又是一個(gè)藝術(shù)的問(wèn)題,為啥這也是一個(gè)藝術(shù)問(wèn)題,別急,聽(tīng)我說(shuō)。
COW最大的問(wèn)題是對(duì)寫(xiě)性能有影響。第一次修改原卷,需要復(fù)制數(shù)據(jù),因此需要多一次讀寫(xiě)的數(shù)據(jù)塊遷移過(guò)程。這個(gè)就比較要命,應(yīng)用需要等待時(shí)間比較長(zhǎng)。但原卷數(shù)據(jù)的布局沒(méi)有任何改變,因此對(duì)讀性能沒(méi)有任何影響。
ROW最大的問(wèn)題是對(duì)讀性能影響比較大。ROW寫(xiě)的時(shí)候性能基本沒(méi)有損耗,只是修改指針,實(shí)現(xiàn)效率很高。但多次讀寫(xiě)后,原卷的數(shù)據(jù)就分散到各個(gè)地方,對(duì)于連續(xù)讀寫(xiě)的性能不如COW。
由于這兩種實(shí)現(xiàn)機(jī)制不同,因此性能也不同,一般來(lái)說(shuō),ROW就像采用電子快門(mén)的照相機(jī),拍照的速度快,每分鐘得到的快照數(shù)就多;而COW就像采用機(jī)械快門(mén)的傳統(tǒng)相機(jī),快門(mén)的速度慢,系統(tǒng)支持的快照數(shù)一般都比較少。下表是我整理的各個(gè)廠商的高端存儲(chǔ)性能,大家對(duì)比一下就知道差別了。
你可能會(huì)問(wèn),怎么沒(méi)有HW HVS。我找了很多資料,都沒(méi)有找到HVS的快照的資料,但我曾經(jīng)看到一份華為中端存儲(chǔ)的資料,說(shuō)采用的也是COW技術(shù),性能和3PAR一樣256。因此,考慮到HVS也采用3PAR一樣的RAID 2.0技術(shù),因此,個(gè)人估計(jì)高端也一樣或者比中端高一些。因此,大家理解的時(shí)候可以等同3PAR好了。
COW是最傳統(tǒng)的實(shí)現(xiàn)方法,當(dāng)然,現(xiàn)在COW也有很多改進(jìn),比如采用異步COW,現(xiàn)在的高端存儲(chǔ)Cache都很大,如HVS最大支持3TB,因此可以先寫(xiě)到CACHE里面就回復(fù)主機(jī)寫(xiě)完了,這樣應(yīng)用就不用等待。等落盤(pán)的時(shí)候再觸發(fā)快照復(fù)制的動(dòng)作。還有,高端存儲(chǔ)一般是數(shù)據(jù)庫(kù)的應(yīng)用,這些應(yīng)用有一個(gè)特點(diǎn),就是寫(xiě)少讀多,一般是1:3到1:10。這個(gè)也比較容易理解,你銀行存了一筆錢(qián)(寫(xiě)),但可能經(jīng)常查詢(xún)余額(讀),就怕錢(qián)少了,哈哈。因此,COW這種方式在還是比較適合這種應(yīng)用的。
但現(xiàn)在的備份技術(shù)發(fā)展也對(duì)快照提出了更高的要求,用戶(hù)需要更快更多的快照來(lái)滿(mǎn)足RTO/RPO的要求。人總是很貪婪的。IBM XIV由于底層采用非常小的1M大小的CHUNK,因此,本來(lái)數(shù)據(jù)就全部打散的非常均勻了,因此高端存儲(chǔ)之父深知原來(lái)symmetrix的缺點(diǎn),讓XIV直接采用ROW技術(shù),個(gè)人感覺(jué)是一個(gè)亮點(diǎn)。因?yàn)镽OW的缺點(diǎn)是連續(xù)讀寫(xiě)比較慢,但XIV的CHUNK比較小,如果是大數(shù)據(jù)庫(kù)的讀寫(xiě),可以分散到很多個(gè)CHUNK里面,因此,讀寫(xiě)性能應(yīng)該影響不大。但3PAR的CHUNK是1G,太大了些,但設(shè)計(jì)的時(shí)候可以按照extend的粒度來(lái)打散,應(yīng)該問(wèn)題也不大。估計(jì)是10+年前,ROW的技術(shù)還沒(méi)有流行吧。而HW,估計(jì)也是由于延續(xù)使用了中端存儲(chǔ)的快照代碼,有了歷史的包袱,因此也沒(méi)有采用ROW技術(shù)。當(dāng)然XIV的ROW實(shí)現(xiàn)有一個(gè)問(wèn)題,因?yàn)樗臄?shù)據(jù)塊是1M大小,上面不在細(xì)分了,因此如果比較小的I/O,如每次只寫(xiě)8K,那么8K需要寫(xiě)到新的地方,原來(lái)的數(shù)據(jù)也要COPY過(guò)來(lái),ROW的優(yōu)勢(shì)就沒(méi)有了。
從XIV的實(shí)現(xiàn)機(jī)制看,我感覺(jué)不太適合數(shù)據(jù)庫(kù)應(yīng)用,如ORACLE目前缺省的I/O塊大小還是8K,這樣ROW的優(yōu)勢(shì)就發(fā)揮不出來(lái)了。
個(gè)人認(rèn)為,RAID 2.0和ROW是個(gè)絕配,雖然現(xiàn)在3PAR和HW在快照性能這塊已經(jīng)強(qiáng)于很多傳統(tǒng)的高端存儲(chǔ)廠商,但如果采用ROW將會(huì)給用戶(hù)帶來(lái)更大的價(jià)值。當(dāng)然,我建議廠商實(shí)現(xiàn)的時(shí)候能克服XIV的缺陷,可以依據(jù)Grain的粒度來(lái)做最好,但這樣可能管理的開(kāi)銷(xiāo)會(huì)變大,這又是一個(gè)藝術(shù)的問(wèn)題,還是由廠商去回答吧,我這等屌絲也就是唧歪一下罷了。
總之,個(gè)人認(rèn)為ROW應(yīng)該是快照的發(fā)展方向,據(jù)說(shuō)EMC的中端支持COW的同時(shí)也支持ROW了。
公司簡(jiǎn)介 | 媒體優(yōu)勢(shì) | 廣告服務(wù) | 客戶(hù)寄語(yǔ) | DOIT歷程 | 誠(chéng)聘英才 | 聯(lián)系我們 | 會(huì)員注冊(cè) | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.