圖 1) 六節(jié)點 NetApp FAS6240 集群的 SPC-1 IOPS。
在本文中,我首先介紹 SPC-1 基準(zhǔn)測試,并將討論延遲的重要性。然后更為詳細地深入探究 NetApp 和其他供應(yīng)商近期競爭的結(jié)果,再比較一下基于磁盤與基于閃存的存儲。
SPC-1 基準(zhǔn)測試
存儲性能理事會 (SPC) 是存儲供應(yīng)商、集成商和學(xué)術(shù)機構(gòu)聯(lián)盟,旨在規(guī)定、標(biāo)準(zhǔn)化和促進存儲基準(zhǔn)測試。存儲性能理事會的 SPC-1 基準(zhǔn)測試是行業(yè)標(biāo)準(zhǔn)的、經(jīng)過審核且基于塊的嚴格基準(zhǔn)測試,用于衡量磁盤子系統(tǒng)對工作負載(由包括寫入、覆蓋、讀取后寫入、寫入后讀取、熱點以及隨機和順序操作在內(nèi)的 I/O 混合而成)的處理性能??傮w而言,因大約 60% 的工作負載是寫入操作,而使得這種基準(zhǔn)測試對于存儲系統(tǒng)極具挑戰(zhàn)性。I/O 大小不一,有大有小。
SPC-1 可能是模擬存儲系統(tǒng)對數(shù)據(jù)庫工作負載處理方式的最佳基準(zhǔn)測試。SPC 開發(fā)該基準(zhǔn)測試時,研究了各種應(yīng)用訪問存儲的方式,然后根據(jù)這些衡量數(shù)據(jù)模擬了工作負載。混合操作代表一類廣泛的應(yīng)用,大約占所有商業(yè)應(yīng)用的一半。
SPC-1 訪問模式會引發(fā)熱點,這在總工作負載中占據(jù)相當(dāng)大的比例。如果進行測試的存儲的自動存儲分層 (AST) 系統(tǒng)達到足夠的粒度和智能水平,則可能會將此類熱點部分緩存(如果緩存足夠大)或存儲到 SSD 中。
盡管沒有任何基準(zhǔn)測試是完美無缺的,但要衡量隨機塊 I/O 性能和比較供應(yīng)商之間的結(jié)果,SPC-1 或許是最佳標(biāo)準(zhǔn)化基準(zhǔn)測試。如果某個存儲系統(tǒng)在 SPC-1 基準(zhǔn)測試中表現(xiàn)良好,則該系統(tǒng)在面對不斷動態(tài)變化且難以處理的延遲敏感型工作負載(一般是數(shù)據(jù)庫應(yīng)用程序,尤其是 OLTP,還包括電子郵件和虛擬化)時,通常也能提供極高的性能。如果您有興趣了解這項基準(zhǔn)測試,則可閱讀該測試的完整規(guī)范。
SPC-1 不是吞吐量類型的基準(zhǔn)測試。要了解 Gb/秒測試的最佳結(jié)果,請查看其他資料。
解釋基準(zhǔn)測試結(jié)果
基準(zhǔn)測試的秘訣在于對結(jié)果的解釋。單單一個 IOPS 數(shù)字也許并不能完全說明問題。查看 SPC-1 報告時,您需要關(guān)注以下幾點:
可持續(xù)性。所有 SPC-1 基準(zhǔn)測試都要包含可持續(xù)性測試,并且該測試必須至少運行八個小時。理想的 IOPS 應(yīng)始終保持較高的水平且具有持久性。間隔期間性能不能下降,持續(xù)性測試時間越長越好。
每個驅(qū)動器的 IOPS。該指標(biāo)衡量存儲系統(tǒng)驅(qū)動底層硬件的效率如何,每個驅(qū)動器的 IOPS 為 500 的效率是每個驅(qū)動器的 IOPS 為 250 的兩倍。能夠更高效地使用驅(qū)動器意味著達到指定性能水平所需的驅(qū)動器較少,這樣可縮減成本與物理占用空間。
響應(yīng)時間(延遲)。SPC-1 中的響應(yīng)時間從應(yīng)用角度來衡量完成平均 I/O 事務(wù)所需的時間長度。響應(yīng)時間越短(響應(yīng)速度越快)越好。IOPS 較高而響應(yīng)時間較長的情況可能出現(xiàn)(但并不可取)。對于數(shù)據(jù)庫事務(wù),我們認為 10 毫秒的響應(yīng)時間是處理讀取操作時保持高性能的上限(如果超過 20 毫秒,Microsoft 等供應(yīng)商會認為數(shù)據(jù)庫"已中斷"),而寫入操作需要更快的響應(yīng),重做日志寫入操作需要近乎即時的響應(yīng)。
這些就是 NetApp 致力于實現(xiàn)低延遲結(jié)果的部分原因。有關(guān) IOPS 和延遲的更多信息,請查看我最近的博文。
每次操作成本。該指標(biāo)衡量每次操作必須花費多少美元。從根本上講,計算方法是使用系統(tǒng)總價除以得出的 SPC-1 IOPS。但請注意,有些供應(yīng)商報告的是折扣價,而另一些供應(yīng)商報告的是標(biāo)價,這樣可能會使結(jié)果出現(xiàn)偏差。
RAID 保護。將哪種類型的 RAID 保護用于測試?大多數(shù) SPC-1 結(jié)果使用鏡像(RAID 10 或 RAID 1+O)來消除奇偶校驗開銷。這實際上意味著,與采用單奇偶校驗或雙奇偶校驗 RAID 的相近可用容量比較,使用磁盤將支出更多成本。
需要的所有硬件。硬件配置的復(fù)雜程度如何?使用的是哪些類型的磁盤?這是您實際上可能會部署的系統(tǒng),還是專門為了取得較好的基準(zhǔn)測試結(jié)果而使用的系統(tǒng)?
NetApp SPC-1 結(jié)果
NetApp SPC-1 結(jié)果如上圖 1 中所示。我們使用的是一個由 6 個 FAS6240 節(jié)點(3 個高可用性對)構(gòu)成的集群,每個節(jié)點帶有一個 512 GB 的閃存模塊(FAS6240 標(biāo)配),總共使用了 432 個磁盤驅(qū)動器(450 GB 的 15K SAS 驅(qū)動器,每個控制器 72 個驅(qū)動器)。
閃存是 NetApp 虛擬存儲層 (VST) 的一部分,讀取熱數(shù)據(jù)將自動提升到閃存執(zhí)行。一個 FAS6240 控制器最多可支持 3 TB 的閃存,因此,相比于典型數(shù)據(jù)中心配置的部署而言,將每個集群節(jié)點限制到一個 512 GB 的卡(系統(tǒng)標(biāo)配)是規(guī)模更小的部署。
同樣,由于一個 FAS6240 控制器最多可支持 1440 個驅(qū)動器,因此每個控制器僅使用 72 個驅(qū)動器也是很低的配置。使用的磁盤是 450 GB15K SAS 驅(qū)動器。需要注意的是,我們在所有測試中都啟用了 RAID-DP® 技術(shù) — NetApp 雙奇偶校驗 RAID 6 實現(xiàn)形式。這與標(biāo)準(zhǔn)的客戶做法保持一致(RAID-DP 是 NetApp 默認項)。表 1 總結(jié)了相對于上述衡量指標(biāo)的基準(zhǔn)測試結(jié)果。
表 1) NetApp 通過 SPC-1 主要衡量指標(biāo)體現(xiàn)出的性能。
此外,經(jīng)過可持續(xù)性測試或可重復(fù)性測試,我們未發(fā)現(xiàn)性能隨時間有所下降。在下一部分您會發(fā)現(xiàn),NetApp 得到了令人非常滿意的結(jié)果,尤其是能以較短的響應(yīng)時間(延遲)提供較高的 IOPS。
與其他領(lǐng)先 SPC-1 結(jié)果的比較
我們根據(jù)大約 3 毫秒的響應(yīng)時間閾值,對基于磁盤的領(lǐng)先 SPC-1 結(jié)果進行了分析。分析表明,在以低延遲提供指定 IOPS 的情況下,NetApp SPC-1 結(jié)果屬于基于磁盤的企業(yè)系統(tǒng)的最佳結(jié)果。NetApp 通過主要基于 HDD 的配置,能夠達到接近閃存水平的性能。
3 毫秒的響應(yīng)時間目標(biāo)符合要求苛刻的低延遲數(shù)據(jù)庫應(yīng)用程序(例如金融企業(yè)使用的應(yīng)用程序)的需求。對于絕大多數(shù)數(shù)據(jù)庫工作負載而言,非常低的 I/O 延遲可大大提高數(shù)據(jù)庫的運行性能。
您可閱讀我最近發(fā)表的關(guān)于這些結(jié)果的博文,查看更為詳細的分析(外加評論)。
我們比較了以下幾個存儲系統(tǒng)(單擊下面的超鏈接可轉(zhuǎn)到每個存儲系統(tǒng)的完整 SPC-1 基準(zhǔn)測試報告):
• NetApp FAS6240 集群
• 帶有 V7000 的 IBM SVC
• 帶有 DS8700 的 IBM SVC
• Hitachi Data Systems VSP
• HP 3Par V800
• Huawei Symantec S8100
表 2) NetApp 集群與其他領(lǐng)先 SPC-1 結(jié)果的比較。
*這些數(shù)字的計算方法是,找到每個結(jié)果響應(yīng)時間最接近 3 毫秒的數(shù)據(jù)點,然后報告該點的 IOPS。(表中顯示了每個數(shù)據(jù)點的準(zhǔn)確響應(yīng)時間。)
SPC-1 IOPS 和每個磁盤的 IOPS 以及每次操作成本
表 2 從各個方面比較了六個系統(tǒng)的 SPC-1 結(jié)果。無可否認,有些系統(tǒng)達到的原始 SPC-1 IOPS(第一行)高于 NetApp FAS6240 集群。但是,NetApp 每個磁盤的 IOPS 達到其他供應(yīng)商結(jié)果的兩倍以上,而且能提供最低的每次操作成本(以標(biāo)價計)。我已將表中的定價規(guī)范化,使其反映所有配置的標(biāo)價(有些供應(yīng)商在提交的 SPC 中報告的是折扣價,造成若不規(guī)范便無法加以比較的情況)。
低延遲 IOPS
比較一下所有系統(tǒng)在 3 毫秒延遲情況下的最高性能(在表中以粗體顯示),您會發(fā)現(xiàn)只有一個系統(tǒng)(即帶有 V7000 的 IBM SVC)的性能超過 NetApp 系統(tǒng),但僅僅高出 4%。該系統(tǒng)的價格約為 NetApp 集群的 3.5 倍(以標(biāo)價計),而且該系統(tǒng)帶有 8 個 SVC 虛擬化引擎、16 個 V7000 系統(tǒng)(每個系統(tǒng)包含 2 個 SVC 控制器和 2 個 RAID 控制器)以及 1,920 個 15K RPM 146 GB 磁盤驅(qū)動器(或許不是您目前大量購買的驅(qū)動器。),其復(fù)雜性遠遠高于 NetApp 集群。較之由 6 個控制器(帶有 432 個磁盤)構(gòu)成的 NetApp 集群,該系統(tǒng)要配置、管理和支持更多的組件。
系統(tǒng)復(fù)雜性
總體而言,與表中所示其他存儲系統(tǒng)相比,NetApp FAS6240 集群能以更少的硬件和少得多的磁盤獲得良好的結(jié)果,并且是在測試中唯一一個采用雙奇偶校驗 RAID 而非鏡像的存儲陣列。這意味著更簡單的管理、更低的管理和能源成本,以及更切合實際的總體配置。
閃存是否能提供合適的解決方案?
完全基于 DRAM 和閃存的系統(tǒng)能提供極高的 IOPS 和非常短的響應(yīng)時間,盡管這些系統(tǒng)的 SPC-1 結(jié)果已存在,但是到目前為止,這些系統(tǒng)在實現(xiàn)高 IOPS 的同時,并不能提供企業(yè)通常需要的容量或功能。如果您對容量的要求不高,但需要極高的 IOPS,則當(dāng)然有必要評估完全基于閃存或完全基于 DRAM 的解決方案,但是需要斟酌取舍。
NetApp 也提供完全基于閃存的方案,但是在未來一段時間內(nèi),一旦您的容量要求超過數(shù)十 TB,出于經(jīng)濟性的考慮,基于磁盤或磁盤加閃存的混合存儲系統(tǒng)仍是更好的選擇。表 3 列出了通過粗略計算得出的成本差異,顯示了每 TB 原始容量的大體成本。
表 3) 容量成本:DRAM 和閃存陣列較之 NetApp 集群。
結(jié)論
憑借這一 SPC-1 結(jié)果,NetApp 證明了 Data ONTAP 8 集群模式能夠以卓越的性能處理 SAN 和 NAS 工作負載。集群模式可實現(xiàn):
• 低延遲(響應(yīng)時間)與高性能
• 可動態(tài)擴展的 FC、iSCSI、NFS 和 CIFS 統(tǒng)一集群
• 極高的性價比
• 無中斷運行,例如跨集群節(jié)點(包括 CIFS)的數(shù)據(jù)移動,而跨 CIFS 的數(shù)據(jù)移動通常幾乎無法實現(xiàn)
• Data ONTAP 功能組合包括寫入優(yōu)化、應(yīng)用感知、Snapshot™ 副本、重復(fù)數(shù)據(jù)刪除、數(shù)據(jù)壓縮、復(fù)制、精簡配置、虛擬存儲分層等
• 能夠?qū)⒂糜?7-模式的硬件用于集群模式,包括 V 系列平臺 — 可對其他供應(yīng)商的存儲陣列實施虛擬化
作者:系統(tǒng)工程師 Dimitris Krekoukias
Dimitris 從事 IT 行業(yè)已超過 17 年,在存儲、大規(guī)模備份和恢復(fù)、虛擬化、大規(guī)模并行系統(tǒng)以及高性能計算領(lǐng)域擁有豐富的經(jīng)驗。自從三年前加入 NetApp 以來,他一直擔(dān)任性能和競爭主題專家。他定期在 http://www.recoverymonkey.org/ 上發(fā)表有關(guān)性能和其他主題的博客。