圖1 XVE的簡化架構(gòu)圖

高可靠性

XVE作為一款存儲操作系統(tǒng),高可靠性是設(shè)計的重中之重。為實現(xiàn)所有代碼的可控性,XVE重寫了通用操作系統(tǒng)的硬盤管理模塊,使之成為一個存儲專用的硬盤管理模塊。它直接和芯片驅(qū)動、硬盤交互,按照上層業(yè)務(wù)特點有針對性地處理硬盤的故障。并且,硬盤管理與華為自研的SSD硬盤相結(jié)合,最大化發(fā)揮SSD的性能優(yōu)勢,提高SSD的使用壽命和可靠性。

基于可靠的硬盤管理模塊,XVE針對RAID技術(shù)采用大膽創(chuàng)新,采用了業(yè)界先進的RAID2.0+技術(shù)。從所周知,RAID重構(gòu)過程中數(shù)據(jù)沒有可靠性保障,如果在重構(gòu)完成前再出現(xiàn)壞盤就將造成數(shù)據(jù)丟失,不可恢復(fù);所以對于一個存儲系統(tǒng)而言其可靠性的最重要標(biāo)志就是其RAID重構(gòu)時間越小越好。傳統(tǒng)硬盤重構(gòu)的瓶頸主要在目標(biāo)盤(熱備盤),因為所有成員盤將所有數(shù)據(jù)讀出后全部寫入到目標(biāo)盤,目標(biāo)盤寫帶寬就成了整個重構(gòu)速度的關(guān)鍵,以一塊2TB 7.2K rpm盤為例,重構(gòu)時平均寫入速度為30M/s左右,完成重構(gòu)時間長達18個小時。華為存儲RAID 2.0技術(shù)采用虛擬化RAID技術(shù),消除RAID的重構(gòu)性能瓶頸——當(dāng)一個物理硬盤故障時,同時更多的目標(biāo)硬盤參加重構(gòu),大大縮短重構(gòu)時間,從而提高了存儲系統(tǒng)的可靠性。同時XVE為了保證數(shù)據(jù)的一致性,XVE支持端到端的數(shù)據(jù)校驗,能夠監(jiān)測到任何偶然的數(shù)據(jù)錯誤,并自動修復(fù),從而保證了關(guān)鍵業(yè)務(wù)的數(shù)據(jù)一致性。

作為一款支持Scale-out多控的存儲OS,XVE設(shè)計了專用的集群管理系統(tǒng)。通過與自研硬件、驅(qū)動的緊密結(jié)合,最大化的提高了節(jié)點間故障切換時間。比如,典型情況下,如果一個控制器發(fā)生故障,該控制器的IO能在1秒之內(nèi)切換到另外一個控制器。

高性能

為了追求極致的性能,XVE對通用操作系統(tǒng)的線程調(diào)度、內(nèi)存管理等進行了優(yōu)化,使其更適合存儲處理大規(guī)模IO并發(fā)處理的特點。XVE采用統(tǒng)一的IO線程調(diào)度機制,最大化的減少線程切換帶來的時延開銷。內(nèi)存管理也繞開通用OS復(fù)雜的內(nèi)存管理機制,直接在底層實現(xiàn)專用高效的內(nèi)存管理機制。為了最大的利用節(jié)點間通信的性能,在底層實現(xiàn)了低時延高帶寬的通信模塊。為了保障系統(tǒng)端到端的QoS,線程調(diào)度、內(nèi)存管理和節(jié)點通信都擁有相應(yīng)的優(yōu)先級控制機制。以上機制都是XVE為存儲系統(tǒng)量身定做的,基于這些基礎(chǔ)框架,XVE擁有了一個高性能的基礎(chǔ)。

高效率

XVE作為一款面向海量數(shù)據(jù)、虛擬化環(huán)境的存儲OS,對于存儲資源實現(xiàn)高效管理和自動資源調(diào)配。它支持資源按需分配,數(shù)據(jù)被均勻分布到陣列內(nèi)所有的硬盤上,可以防止局部硬盤過熱,當(dāng)存儲池中的硬盤數(shù)量增加或減少,以及隨業(yè)務(wù)變化硬盤讀寫壓力發(fā)生變化后,系統(tǒng)通過IO記錄智能分析計算,并自動調(diào)節(jié)熱點Extent在同一類硬盤上的實際存儲位置以確保每一塊硬盤的壓力均衡,從而實現(xiàn)均衡硬盤磨損,有效降低故障率、延長硬盤壽命。同時,XVE還可以根據(jù)數(shù)據(jù)的訪問熱度在不同存儲介質(zhì)之間實現(xiàn)動態(tài)分級存儲,分級存儲實現(xiàn)自動監(jiān)控,分析出冷數(shù)據(jù)和熱數(shù)據(jù),將數(shù)據(jù)遷移至合適的存儲介質(zhì)。總而言之,XVE是一款針對存儲系統(tǒng)的特點,端到端優(yōu)化、端到端可控的存儲操作系統(tǒng)。

展望

“深淘灘,低作堰”是都江堰的治水名言,深淘灘是指河道要深淘,深淘的標(biāo)準(zhǔn)是古人在河底深處預(yù)埋的“臥鐵”。歲修淘灘要淘到臥鐵為止,才算恰到好處,才能保證灌區(qū)用水。正如XVE的采用底層虛擬化技術(shù),對創(chuàng)統(tǒng)RAID技術(shù)進行了深刻地創(chuàng)新,為系統(tǒng)的提供堅實可靠的基礎(chǔ)。低作堰就是說飛沙堰有一定高度,高了進水多,低了進水少,都不合適,自動調(diào)節(jié)流入成都平原的水量。正如XVE的智能資源管理,使得數(shù)據(jù)能自由的流動,隨需地擴展。“深淘灘,低作堰”看似平平常常、簡簡單單的,但卻是中國古代人民智慧的結(jié)晶,XVE將這個理念運用到設(shè)計中,并且安裝了XVE這顆存儲之心的中端、高端存儲產(chǎn)品已經(jīng)規(guī)模應(yīng)用,在市場上不斷取得客戶的認(rèn)可。相信有一天XVE會和華為存儲一道取得更大成功,成為國人自主創(chuàng)新的驕傲。

分享到

renxinbo

相關(guān)推薦