圖1.N8500集群架構(gòu)示意圖
與傳統(tǒng)NAS設(shè)備不同,Oceanspace N8500集群NAS存儲(chǔ)系統(tǒng)采用Scale-out設(shè)計(jì),其結(jié)構(gòu)示意圖如圖1所示,前端NAS引擎由多個(gè)存儲(chǔ)專用服務(wù)器構(gòu)成,內(nèi)部通過專用心跳網(wǎng)絡(luò)互聯(lián);引擎通過FC-SAN與多套存儲(chǔ)單元相連。當(dāng)系統(tǒng)整體負(fù)載過大需要擴(kuò)展系統(tǒng)整體性能時(shí),可以再線橫向擴(kuò)展引擎和存儲(chǔ)單元。另外,Oceanspace N8500各引擎節(jié)點(diǎn)可以同時(shí)并發(fā)訪問同一文件系統(tǒng),不存在負(fù)載熱點(diǎn)問題。
全Active集群技術(shù)賦予N8500每個(gè)引擎節(jié)點(diǎn)“平等”
傳統(tǒng)NAS設(shè)備的不足加速了集群技術(shù)在NAS設(shè)備中的應(yīng)用。業(yè)界當(dāng)前主要使用兩種集群技術(shù),一是N+M共享存儲(chǔ)集群技術(shù),二是基于分布式文件系統(tǒng)的分布式存儲(chǔ)集群技術(shù)。
N+M共享存儲(chǔ)集群NAS系統(tǒng)架構(gòu)示意圖如圖2所示,多個(gè)引擎節(jié)點(diǎn)之間使用專用心跳鏈路通訊,N個(gè)節(jié)點(diǎn)對(duì)外提供NAS業(yè)務(wù),M個(gè)節(jié)點(diǎn)作為備用,允許系統(tǒng)中同時(shí)故障M個(gè)業(yè)務(wù)節(jié)點(diǎn)。N+M集群技術(shù)解決了傳統(tǒng)NAS設(shè)備擴(kuò)展性差的問題,但是單個(gè)文件文件系統(tǒng)仍然是與特定NAS節(jié)點(diǎn)綁定,容易存儲(chǔ)負(fù)荷熱點(diǎn)問題。
圖 2 N+1集群配置圖
基于分布式文件系統(tǒng)的集群存儲(chǔ)硬件組網(wǎng)比較簡(jiǎn)單,主要用存儲(chǔ)節(jié)點(diǎn)和元數(shù)據(jù)節(jié)點(diǎn)組成,節(jié)點(diǎn)之前使用10Gb以太網(wǎng)或者infiniband技術(shù)通訊。各存儲(chǔ)節(jié)點(diǎn)都有專用存儲(chǔ)空間互不共享。同一文件系統(tǒng)橫跨所有存儲(chǔ)節(jié)點(diǎn),所有節(jié)點(diǎn)并發(fā)對(duì)外提供服務(wù)?;诜植际轿募到y(tǒng)存儲(chǔ)系統(tǒng)解決了負(fù)荷熱點(diǎn)問題,但是如果某一存儲(chǔ)節(jié)點(diǎn)出現(xiàn)故障,該節(jié)點(diǎn)對(duì)應(yīng)的存儲(chǔ)空間就得不到利用。另外,由于使用分布式文件系統(tǒng)的原因,業(yè)務(wù)服務(wù)器訪問某一文件可能需要訪問多個(gè)存儲(chǔ)節(jié)點(diǎn),存在巨大的內(nèi)部開銷。
與上述兩種集群技術(shù)迥異,華為賽門鐵克Oceanspace N8500存儲(chǔ)系統(tǒng)采用全Active集群設(shè)計(jì),前端NAS引擎由2~16個(gè)存儲(chǔ)專用服務(wù)器構(gòu)成。首先,與N+M集群技術(shù)不一樣,Oceanspace N8500采用單一命名空間,所有集群節(jié)點(diǎn)可以并發(fā)方位同一文件系統(tǒng),不存在負(fù)荷熱點(diǎn)問題。Oceanspace N8500所有引擎節(jié)點(diǎn)互為備份,具有更高的系統(tǒng)可靠性。而與基于分布式文件系統(tǒng)存儲(chǔ)相比,Oceanspace N8500具有更高資源利用率;引擎節(jié)點(diǎn)內(nèi)部通訊使用千兆以太網(wǎng),具有低成本優(yōu)勢(shì)。所有引擎節(jié)點(diǎn)共享存儲(chǔ)空間,使得文件訪問無需訪問多個(gè)節(jié)點(diǎn),更高效快捷。
GAB、LLT協(xié)議架起N8500內(nèi)部通信的“高速公路”
高效的內(nèi)部通訊設(shè)計(jì)尤其讓Oceanspace N8500驚艷。Oceanspace N8500集群內(nèi)部通訊采用經(jīng)過市場(chǎng)檢驗(yàn)的VCS(Veritas Cluster Server)組件,采用高效的GAB (Group Membership Services/Atomic Broadcast) 和LLT (Low Latency Transport)通訊協(xié)議。圖 3大致介紹了引擎節(jié)點(diǎn)間的通信方式。
圖 3 N8500引擎節(jié)點(diǎn)間通訊示意圖
每個(gè)引擎節(jié)點(diǎn)都作為獨(dú)立單元運(yùn)行并在集群級(jí)別共享信息。在每個(gè)系統(tǒng)上,作為集群決策邏輯的高可用性后臺(tái)駐留程序 (HAD:High Available Demon) 維護(hù)著集群配置視圖。該后臺(tái)駐留程序作為重復(fù)狀態(tài)計(jì)算機(jī)運(yùn)行,這表示集群中的所有系統(tǒng)都具有同步的集群配置狀態(tài)。
GAB主要有兩項(xiàng)主要功能,一是提供可靠的集群通信,二是維護(hù)集群成員集。GAB提供Atomic Broadcast功能用以確保集群中的所有節(jié)點(diǎn)都會(huì)接收到所有的配置更改消息,或全部回滾到先前狀態(tài),這與數(shù)據(jù)庫原子提交非常相似。值得一提的是,Atomic Broadcast 消息并不是真的廣播消息,而是從發(fā)送端到每個(gè)接收端的一系列點(diǎn)對(duì)點(diǎn)單播消息。
LLT協(xié)議控制信息遠(yuǎn)少于IP協(xié)議控制信息,它是 IP 協(xié)議的一種高性能、低延遲替代協(xié)議。LLT 有兩項(xiàng)主要功能,一是各心跳鏈路上進(jìn)行流量負(fù)荷分擔(dān),二是心跳信息發(fā)送/接收。
通過上面的技術(shù)分析可以看出GAB/LLT協(xié)議組比TCP/IP協(xié)議更加高效,更適用于系統(tǒng)間多鏈路通訊,為各系統(tǒng)維護(hù)統(tǒng)一配置視圖。
從以上的對(duì)比分析,用戶不難看出Oceanspace N8500存儲(chǔ)系統(tǒng)性能卓越的奧秘了。硬件架構(gòu)的Scale-out設(shè)計(jì)使得系統(tǒng)各組件可以隨著客戶的性能需求進(jìn)行橫向擴(kuò)展。全Active集群軟件設(shè)計(jì),發(fā)揮了每個(gè)引擎節(jié)點(diǎn)的作用。節(jié)點(diǎn)間的負(fù)荷分擔(dān)控制,使得不存在全局熱點(diǎn)。GAB、LLT高效協(xié)議的使用,使得集群內(nèi)部通訊更高效、更可靠,降低內(nèi)部資源消耗。
圖 4華為賽門鐵克Oceanspace N8500 SPEC測(cè)試NFS曲線
綜上所述,Oceanspace N8500集群NAS存儲(chǔ)系統(tǒng)具有高性能、可擴(kuò)展性和可獲得性等特點(diǎn),能夠幫助客戶采用更低的運(yùn)營(yíng)成本,而獲得更高的性能。根據(jù)Oceanspace N8500產(chǎn)品資料介紹,在后端存儲(chǔ)單元不存在瓶頸的情況下,隨著引擎節(jié)點(diǎn)的增加性能呈近線性增長(zhǎng)。有數(shù)據(jù)為證,圖4即是根據(jù)相關(guān)數(shù)據(jù)整理的Oceanspace N8500在SPEC測(cè)試中NFS性能曲線圖。由圖中曲線可以看出隨著節(jié)點(diǎn)數(shù)的增加,系統(tǒng)性能確實(shí)呈近線性增加。