圖:UCloud塊存儲研發(fā)總監(jiān)彭晶鑫
想把容量做大并不是一件簡單的事兒,UCloud塊存儲研發(fā)總監(jiān)彭晶鑫解釋說,單盤容量變大的技術(shù)挑戰(zhàn)主要在于元數(shù)據(jù)管理,元數(shù)據(jù)的存儲和讀取效率是主要問題,2017年,UCloud塊存儲研發(fā)團(tuán)隊(duì)重新設(shè)計(jì)了元數(shù)據(jù)模型,大大減少了元數(shù)據(jù)的數(shù)據(jù)量,最終可以把單盤容量做到很大,于是才有了現(xiàn)在從32TB到100TB的單盤容量。
據(jù)悉,UCloud可提供兩種類型的云盤:一種是普通的云盤,用的是機(jī)械硬盤,另外一種是SSD云盤,普通云盤的IOPS大概是1000左右,時延大概是5-10ms之間,而SSD云盤的IOPS能輕松達(dá)到2.4萬,而且時延能降低到0.5-3ms左右。
不過,這樣的性能表現(xiàn)在一些場景下仍然是不夠用的,與物理機(jī)的NVMe固態(tài)盤所提供的動輒百萬IOPS的性能相比,仍有不少差距,如果云端性能僅限于此,那么,這樣的云顯然是不完整的,用戶需要性能更強(qiáng)的云盤。
百萬IOPS的RSSD
在UCloud的存儲產(chǎn)品家族中,RSSD是一款增強(qiáng)版的SSD云盤,IOPS能達(dá)到120萬,時延能降低到0.1ms,在128隊(duì)列壓測性能時,時延低至400us, 它是UCloud云服務(wù)產(chǎn)品能力的重要支撐,也是市面上極具競爭力的產(chǎn)品。
RSSD是一款塊存儲,頭文字“R”一語雙關(guān),R既可以代表Rapid,強(qiáng)調(diào)快的特性,高IOPS低延遲,因?yàn)檫@是一款基于企業(yè)級NVMe SSD打造的性能型云盤,“R”的另外一個含義是RDMA,因?yàn)樵趦?yōu)化過程中在RDMA層面做了很多創(chuàng)新。
本質(zhì)上,RSSD用的是企業(yè)級的NVMe SSD,所以,價格上相比原來基于SATA SSD的普通SSD云盤會貴出一截,NVMe SSD開放出了很多能力,所以也留出了很多優(yōu)化空間,不過,性能想進(jìn)一步提升其實(shí)面臨很多技術(shù)障礙。
在RSSD中,UCloud使用的并非標(biāo)準(zhǔn)的NVMe協(xié)議,但硬件本身并沒有太多定制化的成分,主要還是標(biāo)準(zhǔn)化的NVMe SSD。在一些實(shí)現(xiàn)上,為了優(yōu)化性能表現(xiàn)都采用了優(yōu)化過的私有協(xié)議,在發(fā)布會現(xiàn)場,彭晶鑫總結(jié)了4個技術(shù)方面的要點(diǎn)。
RSSD的軟硬協(xié)同設(shè)計(jì)帶來結(jié)果非常顯著,最終在128隊(duì)列時,4K IOPS達(dá)到了120萬。UCloud提供的實(shí)測數(shù)據(jù)顯示,在與一些友商的同類產(chǎn)品相比時,在IOPS和延遲方面,均有好幾倍的優(yōu)勢。
從技術(shù)實(shí)現(xiàn)的思路來看,每當(dāng)需要極致性能的時候,系統(tǒng)設(shè)計(jì)通常會選擇進(jìn)行offload,從系統(tǒng)層,到內(nèi)核層,到直接繞開CPU,通過極致的專有設(shè)計(jì)提升性能,這一思路在如今的許多創(chuàng)新架構(gòu)中都非常常見。
當(dāng)前,云盤性能進(jìn)一步提升的瓶頸主要還受限硬盤本身,如今隨著基于閃存的技術(shù)和創(chuàng)新的閃存存儲方案越來越多,優(yōu)化的空間還有很多。彭晶鑫表示,下一階段,將考慮采用一些基于Open-Channel協(xié)議的SSD,以及一些持久內(nèi)存等創(chuàng)新性的存儲方案,也就是說,還會進(jìn)一步努力降低延遲,提升IO體驗(yàn)。
性能以外,數(shù)據(jù)安全至關(guān)重要
性能以外,RSSD對應(yīng)有數(shù)據(jù)方舟來提供數(shù)據(jù)安全服務(wù),彭晶鑫介紹說,數(shù)據(jù)方舟是為UCloud 云主機(jī)磁盤提供連續(xù)數(shù)據(jù)保護(hù)的服務(wù),采用異構(gòu)解耦的方式將數(shù)據(jù)復(fù)制到另外一個集群,當(dāng)原有的集群受到影響時,備份集群沒有任何干擾,這是數(shù)據(jù)方舟方案的一大特點(diǎn)。
數(shù)據(jù)方舟可以記錄實(shí)時的IO流,可以恢復(fù)到一定時間段內(nèi)的任意一秒,比如當(dāng)用戶誤刪除操作之后,可以用數(shù)據(jù)方舟進(jìn)行恢復(fù)。彭晶鑫介紹說,數(shù)據(jù)方舟的應(yīng)用其實(shí)已經(jīng)非常普遍了,幾年前的勒索病毒橫行,數(shù)據(jù)被加密之后都不可用了,而UCloud的數(shù)據(jù)方舟能將數(shù)據(jù)恢復(fù)到中毒前的狀態(tài),還意外破解了勒索病毒。
從RSSD的優(yōu)化表現(xiàn)上,我們已經(jīng)看到UCloud在基礎(chǔ)設(shè)施層面的創(chuàng)新能力,相信未來還會看到UCloud團(tuán)隊(duì)在軟硬件協(xié)同領(lǐng)域有更多的探索,持續(xù)優(yōu)化產(chǎn)品性能。(文/朱朋博)