這三部分存儲空間承載的I/O并發(fā)流速并不一樣,每個I/O流的I/O模式也各不相同,如SU-1的臨時存儲一共有四個并發(fā)流,其中三個都是8KB,另外一個流是混合流,速率從4K到64K不等,同時I/O流下發(fā)到盡管分出來差不多45的空間里,每個I/O流真正訪問存儲池或者卷,其存儲空間的范圍也不一樣。
這些數(shù)據(jù)是捕捉了大量的workload后進行的一個系統(tǒng)統(tǒng)計分析,以嘗試能夠在實驗室環(huán)境里面進行復(fù)原。
測試流程分為預(yù)埋數(shù)據(jù)、預(yù)埋數(shù)據(jù)監(jiān)測以及數(shù)據(jù)收集,收集的各種性能數(shù)據(jù)涉及不同負載,時間可能長達到十幾個小時,負載壓力從百分之百滿載按十個百分點下降或上升,之后再進行數(shù)據(jù)驗證,檢測數(shù)據(jù)是否為當時定義的數(shù)據(jù)模式,最后進入系統(tǒng),這個時候會做一些控制器重啟,檢測可靠性等方面的能力。
全閃存最關(guān)注也是行業(yè)客戶尚未關(guān)注到的I/O規(guī)格指標有哪些?浪潮最后得出的結(jié)論如下:
一是響應(yīng)時間。
響應(yīng)時間分成兩類,一是百分之百滿負載壓力情況下,二是有選擇的、不等負載力度環(huán)境下進行復(fù)雜運算(這種狀態(tài)下客戶可以感知到性能、感知到響應(yīng)時間)。
二是延遲。
硬盤時代、響應(yīng)時間為毫秒級的時候,尾延遲并不重要,但如果平均延時在一毫秒的時候,突然蹦出數(shù)十毫秒的響應(yīng),可能就要出問題了,因為大家一直習(xí)慣了非??焖俚捻憫?yīng)。不管延遲是99%,99.999%,誤差都需要在5%這樣一個時間范圍內(nèi)。
1.全閃Workload對比:從行業(yè)中來,到行業(yè)中去
目前,浪潮存儲正嘗試把全閃存應(yīng)用最多的金融、通信以及AI等主流行業(yè)合作一起制訂相應(yīng)的行業(yè)標準。在金融行業(yè),浪潮存儲從2019年1月參與制訂全閃的技術(shù)規(guī)范測試規(guī)范,也了解到這些行業(yè)的頂級企業(yè)在集采和入圍采購環(huán)境下從混閃到全閃對workload的性能要求和規(guī)格變化,覆蓋控制器升級/故障性能,盤故障、RAID重建性能。對比發(fā)現(xiàn),通信和金融行業(yè)相對比較完善,AI在彈性能力和數(shù)據(jù)服務(wù)疊加領(lǐng)域還未涉及。
通過梳理后建立了三個緯度:
一是基準模式,包括業(yè)界熟知的I/O大小、隨機順序等;
二是彈性能力,如在客戶生產(chǎn)應(yīng)用的生命周期需要進行維護,包括綜合橫向的擴容、軟件的升級,在真正出現(xiàn)這樣那樣軟硬件的故障期間、恢復(fù)以后等的性能表現(xiàn);
三是數(shù)據(jù)服務(wù)疊加。
從這三個方面來看規(guī)格指標的定義,SPC-1的workload指標定義與行業(yè)客戶匯總起來的定義其實有偏差,各有長短,但是相對來說在基準測試模型方面,SPC的定義更系統(tǒng)、更完整。
2.全閃存儲性能 場景關(guān)鍵能力之重
為什么業(yè)界對全閃系統(tǒng)更關(guān)注性能和workload、如何獲取workload、如何存放存放workload,需要什么樣的工具?
另一家行業(yè)組織,全球網(wǎng)絡(luò)存儲工業(yè)協(xié)會(Storage Networking Industry Association,簡稱SNIA)十多年前專門運作了類似的技術(shù)工作組并發(fā)布了相應(yīng)的工具,不過業(yè)界參與的積極性還不夠高。
在浪潮存儲眼里,其實這是非常好的合作機會。
浪潮存儲正在與部分高校合作。在溝通中發(fā)現(xiàn),高等院校很希望接觸到生產(chǎn)環(huán)境的測試,“從那兒挖掘出一些廠商以為是礦但高校認為是金子的好東西來”。
為了評估抓獲workload存放產(chǎn)生負載,市場上已經(jīng)推出了十多個工具,受到國內(nèi)行業(yè)客戶青睞的是vdbench,作為開源產(chǎn)品,由于創(chuàng)作者已經(jīng)退休,所以該工具并沒有得到持續(xù)維護,也一樣存在有待于解決的問題。
無論是SPC還是IO500等專業(yè)工具以及商業(yè)工具、開源工具,除了體系梳理,將來也會存在變革的機會。
為什么要考慮全閃性能在場景存儲關(guān)鍵能力上所處的位置?Gartner從2016年到2019年《全閃關(guān)鍵能力(critical capabilities)報告》時間軸變化中,把全閃存存儲產(chǎn)品服務(wù)的IT應(yīng)用場景分為五大類:在線交易、服務(wù)器虛擬化、高性能計算、數(shù)據(jù)分析和VDI;這五大場景中,Gartner收集的是真實客戶使用IT基礎(chǔ)設(shè)施的體驗,以及從浪潮這樣的存儲廠商方面獲取的信息。
通過建立相應(yīng)的權(quán)重,可以看到性能在全閃的7項關(guān)鍵能力中在5大場景占據(jù)4個權(quán)重第一,其中虛擬桌面排名第二位,虛擬桌面存儲的不全是持久的數(shù)據(jù),也有一些虛擬機OS相關(guān)的臨時文件,這部分數(shù)據(jù)如果出現(xiàn)問題,產(chǎn)生的影響不大,畢竟VDI客戶關(guān)心的是數(shù)據(jù)的效率服務(wù),比如重刪、壓縮等,后者比重占20%~40%;高性能計算的比重從42%提升至44%、數(shù)據(jù)分析場景從25%提升至36%,在線交易場景由28%降為26%,其他場景無變化。
Gartner的《全閃關(guān)鍵能力報告》中表明,廠商和客戶應(yīng)用關(guān)注的重點都在性能方面,并且正在加大研發(fā)領(lǐng)域的投入;性能,也堪稱全閃存存儲關(guān)鍵的因素。
3.存儲負載與性能規(guī)格指標體系
依據(jù)各三方機構(gòu)、行業(yè)客戶的匯總信息,其建立的全閃存儲工作負載、規(guī)格指標等其實各有短長;廠商也有責任和義務(wù)幫助用戶明確workload要覆蓋哪些、哪些是主流的、哪些是場景所需要不同的路徑,同時也需要開發(fā)出自己能夠捕獲workload的測試工具,并在實驗室里面可以重放,每一個新產(chǎn)品、新技術(shù)上市之前要做好驗測,和一些場景結(jié)合定義方案。
浪潮存儲對性能矩陣進行了結(jié)構(gòu)化梳理,用一頁PPT來呈現(xiàn),組合了數(shù)千workload要素:一是基準,二是服務(wù)疊加,如快照、復(fù)制、雙活以及壓縮、重刪等,三是在應(yīng)用生命周期發(fā)生的擴容、升級、故障,維護等工作在遷移workload上面的性能指標。
最龐大的是基礎(chǔ)。PPT對IOPS、I/O Sizes、隨機順序、讀寫比例等業(yè)界熟知的概念進行更多抽象化梳理,從而展示了一個樹型的、從上往下,在橢圓形框中并行的選項,但真實生產(chǎn)應(yīng)用環(huán)境存儲負載遠遠不止一條路徑,可能下來后有8條、16條幾十條的路徑下來,需要收集大量的規(guī)格指標。
4.全閃存儲面臨性能瓶頸
全閃的性能,多好算好,是不是已經(jīng)足夠好,發(fā)展到了盡頭?
眾所周知,時下計算機、服務(wù)器、存儲、網(wǎng)絡(luò)設(shè)計,都是遵從上世紀40年代的馮諾依曼架構(gòu),其I/O處理能力有兩個基本的要求:容量按需增長、與計算處理一致的速度。在過去5年,CPU遠遠不及摩爾定律翻番的要求,人工智能GPU/NPU算力正在接棒CPU,延續(xù)高速增長摩爾定律,加劇存儲I/O性能問題嚴重性。
站在今天的角度看明天,存儲系統(tǒng)瓶頸已經(jīng)很明顯,NVMe(PCIeG3-G5)和DIMM成為SCM接口,并發(fā)效率極高,非易失性介質(zhì)正在進化到存儲級內(nèi)存,訪問速度的提升尤其是延遲的降低呈百倍級的變化,達到微秒級,而帶寬隨著PCIe的升級也是5至10倍的提升,曾經(jīng)的16G正在向25G、64G、100G這樣的高速存儲發(fā)展。
借用行業(yè)兩個經(jīng)典報告《Redrawing the boundaries of software and Fast Memory 》與《Hennessy and Patterson, Computer Architecture》的數(shù)據(jù)來展示從硬盤時代到SAS SSD,NVMe SSD到DIMM的SCM介質(zhì),軟件棧在延遲方面所占的權(quán)重越來越高,從不足1%到90%以上,即軟件棧的延時瓶頸;而CPU的性能過去5年僅有5%的增長,已經(jīng)成為IOPS的瓶頸。 (未完待續(xù))
【下期話題:存儲性能增長技術(shù)及浪潮存儲的創(chuàng)新實踐】