鵬云網(wǎng)絡(luò)創(chuàng)始人陳靚博士
原AWS核心架構(gòu)師、S3、Glacier存儲(chǔ)項(xiàng)目團(tuán)隊(duì)負(fù)責(zé)人,華裔科學(xué)家陳靚先生表示:傳統(tǒng)企業(yè)應(yīng)用上云,在存儲(chǔ)方面需要解決:
1)可用性與可靠性,這是用戶最為關(guān)心的問題,當(dāng)節(jié)點(diǎn)或磁盤故障時(shí),業(yè)務(wù)不停,數(shù)據(jù)不丟是必須的。但限于crush機(jī)制,Ceph系統(tǒng)在節(jié)點(diǎn)當(dāng)機(jī)時(shí)會(huì)造成IO中斷,前端業(yè)務(wù)會(huì)受到一定影響。
2)性能。Ceph基于對(duì)象存儲(chǔ),IO延遲長(zhǎng),而傳統(tǒng)業(yè)務(wù)系統(tǒng)對(duì)IO延遲比較敏感。
3)應(yīng)提供豐富的企業(yè)級(jí)存儲(chǔ)服務(wù)功能,例如,快照/克隆技術(shù)提供快速數(shù)據(jù)恢復(fù)、以及多用途數(shù)據(jù)副本等能力;在線遷移能夠根據(jù)實(shí)際需求為業(yè)務(wù)系統(tǒng)調(diào)整存儲(chǔ)資源配置;QoS功能在多業(yè)務(wù)系統(tǒng)復(fù)雜環(huán)境下充分保證關(guān)鍵業(yè)務(wù)系統(tǒng)的存儲(chǔ)性能供給。
以上這些問題,用戶都可以在產(chǎn)品測(cè)試過程中進(jìn)行實(shí)際的驗(yàn)證和考察,眼見為實(shí)。
ZettaStor和原生塊存儲(chǔ)
作為原AWS核心架構(gòu)師、S3、Glacier存儲(chǔ)項(xiàng)目團(tuán)隊(duì)負(fù)責(zé)人,陳靚先生非常了解對(duì)象存儲(chǔ)應(yīng)對(duì)塊數(shù)據(jù)需求的不足。
機(jī)緣巧合,2012年,陳靚應(yīng)南京市政府的感召歸國(guó)創(chuàng)業(yè),創(chuàng)辦了南京鵬云網(wǎng)絡(luò)科技有限公司,并推出了從最底層開始研發(fā)的ZettaStor DBS軟件定義分布式存儲(chǔ)系統(tǒng),提出了原生塊存儲(chǔ)的概念。
它是以裸設(shè)備方式直接管理底層硬盤,并整合成為塊存儲(chǔ)資源供上層應(yīng)用來訪問使用,由于并不存在對(duì)象存儲(chǔ)的中間轉(zhuǎn)換過程,因此能夠?qū)崿F(xiàn)低延遲的高I/O訪問效率。
考慮到傳統(tǒng)企業(yè)級(jí)應(yīng)用對(duì)于功能的需求,ZettaStor DBS還提供了自動(dòng)精簡(jiǎn)配置、快照/克隆、分級(jí)存儲(chǔ)、數(shù)據(jù)復(fù)制和遷移、SSD緩存加速、QoS管理、訪問控制、多路徑冗余等完整的功能。ZettaStor DBS所具有的機(jī)房多級(jí)容災(zāi)、故障域隔離、雙活容災(zāi)解決方案可以很好滿足企業(yè)級(jí)用戶業(yè)務(wù)的需求。
ZettaStor DBS以標(biāo)準(zhǔn)的iSCSI/SCSI協(xié)議和私有的LBD協(xié)議對(duì)外提供存儲(chǔ)服務(wù),并可以通過對(duì)接Cinder API、標(biāo)準(zhǔn)REST接口,可以為OpenStack等云計(jì)算管理平臺(tái)的統(tǒng)一管理提供技術(shù)支持!
ZettaStor DBS產(chǎn)品架構(gòu)圖
測(cè)試中的 “貓膩”
談到原生塊存儲(chǔ),陳靚表示:其實(shí)概念并不重要。在擔(dān)任AWS核心架構(gòu)師期間,其內(nèi)部很少談?wù)摳拍?,更多是專注在要解決哪些技術(shù)問題。用戶應(yīng)該更加專注需要解決的問題,而不應(yīng)該盲從于概念、標(biāo)準(zhǔn)或者趨勢(shì)。其實(shí),關(guān)注問題不同,著眼點(diǎn)也不同。
對(duì)于原生塊存儲(chǔ)、非原生塊存儲(chǔ),測(cè)試和驗(yàn)證將是一個(gè)非常重要的方法。但是在測(cè)試過程中,也應(yīng)該結(jié)合實(shí)際,謹(jǐn)防被一些“貓膩”手段所蒙蔽。
以可靠性測(cè)試為例,重點(diǎn)要考察的是:當(dāng)集群中磁盤或節(jié)點(diǎn)發(fā)生故障時(shí),數(shù)據(jù)會(huì)不會(huì)丟失?業(yè)務(wù)會(huì)不會(huì)中斷?中斷的時(shí)長(zhǎng)是多少?
很多SDS的容錯(cuò)域都是提前配置好的。以3副本9個(gè)節(jié)點(diǎn)為例,通常會(huì)配置3個(gè)容錯(cuò)域A\B\C、每個(gè)容錯(cuò)域各3個(gè)節(jié)點(diǎn),每個(gè)容錯(cuò)域保存獨(dú)立的副本數(shù)據(jù)。例如當(dāng)以一個(gè)容錯(cuò)域A的3臺(tái)機(jī)器都故障時(shí),還有兩2個(gè)副本存在,數(shù)據(jù)不會(huì)丟失,業(yè)務(wù)照常運(yùn)行,這就是通常所說的能容忍1/3節(jié)點(diǎn)宕機(jī)。這樣的要求大多數(shù)廠家都能做到,但如果同時(shí)B域或者C域也有機(jī)器down機(jī)呢?
這就是測(cè)試中,用戶需要仔細(xì)考察和驗(yàn)證的。
再以性能測(cè)試為例,SSD緩存對(duì)性能測(cè)試有很大的影響,特別在小數(shù)據(jù)量時(shí),看不出來系統(tǒng)的差異,但在實(shí)際中,當(dāng)數(shù)據(jù)量、負(fù)載加大,SSD存在被穿透的可能,這時(shí)數(shù)據(jù)就需要落盤(寫到硬盤),這個(gè)時(shí)候良莠不齊,高低立判。這就是為什么很多以ceph為基礎(chǔ)二次開發(fā)的系統(tǒng)把SSD緩存做為標(biāo)配的原因,因?yàn)橐坏]有SSD加速性能會(huì)變得很差。
當(dāng)系統(tǒng)發(fā)生磁盤/節(jié)點(diǎn)故障,恢復(fù)數(shù)據(jù)是否會(huì)影響系統(tǒng)性能表現(xiàn)。以Ceph為例,其元數(shù)據(jù)管理和尋址采用的是Crush算法,在節(jié)點(diǎn)動(dòng)蕩時(shí),元數(shù)據(jù)(其實(shí)是ceph內(nèi)部保存的資源列表)發(fā)生變化,會(huì)導(dǎo)致大量的沒有必要的數(shù)據(jù)遷移,不僅導(dǎo)致網(wǎng)絡(luò)帶寬擁擠,嚴(yán)重時(shí)會(huì)導(dǎo)致業(yè)務(wù)系統(tǒng)訪問受影響。
小結(jié)
傳統(tǒng)企業(yè)沒有辦法和互聯(lián)網(wǎng)企業(yè)相比,無論IT管理模式,技術(shù)水平,還是發(fā)展階段,二者完全不同。所謂橘生淮南則為橘,生于淮北則為枳,無論對(duì)于互聯(lián)網(wǎng)企業(yè)、云計(jì)算服務(wù)商,還是對(duì)于傳統(tǒng)企業(yè)用戶,服務(wù)的對(duì)象,面臨場(chǎng)景不同,其選擇也就不同,切不可為商業(yè)化的宣傳所誤導(dǎo)!