SPC(storage performance council,存儲性能理事會):定義、管理和推動行業(yè)標準的、供應商中立的benchmark來描述存儲產(chǎn)品的性能
在這里,筆者先引用一段SNIA(存儲網(wǎng)絡(luò)工業(yè)協(xié)會)China教育委員會主席王紀奎先生主編的《成就存儲專家之路–存儲從入門到精通》一書中對SPC測試的介紹:
SPC的SPC-1和SPC-2
存儲性能理事會(storage performance council,SPC)是一家非營利組織,主要使命是定義存儲系統(tǒng)基準測試、實現(xiàn)其標準化并進行推廣,為計算機行業(yè)及其客戶提供客觀、可驗證的性能數(shù) 據(jù)。SPC成員對所有公司、學術(shù)機構(gòu)和個人開放。根據(jù)存儲行業(yè)的需要和行業(yè)所關(guān)心的問題,SPC在2001年創(chuàng)建了第一個行業(yè)標準性能基準測試,目標是推 動存儲性能的提高。目前IBM,HP,Sun,HDS,Dell等存儲業(yè)內(nèi)的巨頭都是SPC的重要會員,并且都視自身產(chǎn)品獲得更高的SPC標準評分為榮 譽。由于某種原因,存儲業(yè)內(nèi)的另一個巨頭EMC一直未能參加SPC,這不免讓我們有些遺憾。
SPC最為著名的標準是SPC-1和SPC-2。幾乎每個月都會有廠商將自己產(chǎn)品的SPC-1和SPC-2的測試結(jié)果公布,可以說這兩個標準是目前存儲業(yè)內(nèi)公認的最為活躍的測試標準。
SPC-1基準測試體現(xiàn)了存儲供應商衡量存儲系統(tǒng)處理復雜請求和大量數(shù)據(jù)的基本性能,其主要衡量存儲系統(tǒng)在隨機I/O負荷下的吞吐量(IOPS)。而SPC-2則主要衡量在各種高負荷連續(xù)讀寫應用場合下存儲系統(tǒng)的帶寬(MB/s)。
SPC-1設(shè)計一個專門為測試存儲系統(tǒng)在典型業(yè)務(wù)應用場合下的負載模型,這個負載模型連續(xù)不斷地對業(yè)務(wù)系統(tǒng)并發(fā)的做查詢和更新的工作,因此其主要由隨機 I/O組成。這些隨機I/O的操作涉及數(shù)據(jù)庫型的OLTP應用以及E-mail系統(tǒng)應用,能夠很好地衡量存儲系統(tǒng)的吞吐量(IOPS)指標。
SPC-2與SPC-1測量的模式完全不同,它由3個不同負荷模型構(gòu)成,主要衡量存儲系統(tǒng)在連續(xù)大規(guī)模移動數(shù)據(jù)時的性能。這3種負荷模型包括:
(1) 大文件處理模型。該模型模擬同時讀寫多個大容量模型的應用場景,這些場景一般常用在科學計算和大規(guī)模金融計算領(lǐng)域中。
(2) 大數(shù)據(jù)量的數(shù)據(jù)庫查詢模型。該模型模擬數(shù)據(jù)之間的大量連接(join)和全表掃描應用場景,這些場景一般常用在數(shù)據(jù)挖掘和常務(wù)智能領(lǐng)域。
(3) VOD模型。該模型主要模擬非線性編輯應用場景,會同時讀取多個大的影音文件并寫入存儲系統(tǒng)中。
可以看出SPC-2涵蓋了目前大量連續(xù)I/O的所有典型測試場景,因此能夠很好地測量出存儲系統(tǒng)的帶寬。
SPC-1和SPC-2在SPC組織的官方網(wǎng)站http://www.storageperformance.org/上,可以找到有關(guān)SPC-1和 SPC-2的最新數(shù)據(jù)。標準的測試結(jié)果能夠很好地幫助數(shù)據(jù)中心用戶明確各種存儲在不同應用場合下的性能表現(xiàn),用戶可以根據(jù)這些標準得分判別存儲系統(tǒng)是否能滿足自己業(yè)務(wù)系統(tǒng)的性能需求。
上述的最后一句話,相信現(xiàn)在已經(jīng)有許多人不再認同,其中原因我們在上文已經(jīng)有所敘述。那么SPC-1在今天就完全沒有意義了嗎?撰寫本文的目的又是什么呢?
上圖為SPC網(wǎng)站上公布的SPC-1測試結(jié)果對應的存儲廠商,其中包括我們熟悉的戴爾、富士通、惠普、日立數(shù)據(jù)系統(tǒng)(HDS)、IBM、 NetApp、甲骨文(Sun)、SGI;現(xiàn)在已經(jīng)被HP收購的3PAR、被Oracle收購的Pillar、被NetApp收購的LSI Engenio存儲部門(以O(shè)EM業(yè)務(wù)為主);推出SANmelody存儲虛擬化軟件的廠商DataCore、為眾多國內(nèi)渠道存儲品牌OEM供貨的臺灣廠 商Infortrend;還有固態(tài)存儲的先行者Texas Memory Systems(TMS)、主張精簡控制器架構(gòu)的Xiotech、以及唯一參與SPC組織的國內(nèi)存儲廠商華為賽門鐵克(現(xiàn)已被華為收購全部股份)。
SPC-1成績匯總分析、引發(fā)的疑問
回顧2011年,仍然有眾多存儲廠商公布了他們新產(chǎn)品的SPC-1測試成績。從入門級、中端一直到高端存儲系統(tǒng),乃至全閃存陣列;包括傳統(tǒng)雙控制器架構(gòu),也有比較熱門的Scale-out橫向擴展設(shè)計。另外,SPC-1結(jié)果中除了IOPS性能之外,還有$/SPC-1 IOPS(性價比)以及參測產(chǎn)品的詳細配置以及分項報價。由此我們還能計算出更多數(shù)字,比如平均每驅(qū)動器提供的IOPS、每GB容量的價格等。
當然,不同廠商、不同檔次的存儲設(shè)備在實際銷售時的list折扣也不相同,國內(nèi)外執(zhí)行的價格政策通常也會有所差異。因此本文中所引用和計算出的價格、性價比等數(shù)字,不代表用戶實際成交的水平,僅供對比參考。
SPC-1結(jié)果概要樣本:測試存儲型號為NetApp FAS3270A,報告總結(jié)中包括IOPS、性價比、總ASU容量、數(shù)據(jù)保護級別,以及總TSC價格(含3年維護)。
2011年公布的SPC-1測試成績匯總(按照時間先后從上到下排序),其中Huawei Symantec的兩款中端產(chǎn)品Oceanspace S5600T和S6800T只列出前者作為代表。
在分析以上數(shù)字之前,我們有必要對表格中的存儲系統(tǒng)簡單做一個分類。入門級:IBM System Storage DS3524 Express(有/無Turbo選項)、SGI InfiniteStorage 5000-SP 和 Fujitsu ETERNUS DX80 S2;中端:NetApp FAS3270A、IBM Storwize V7000、Pillar Axiom 600 Series 3、華為賽門鐵克Oceanspace S5600T,以及Oracle Sun ZFS Storage 7420c Appliance;高端:HP P10000 3PAR V800 Storage System 和 HDS Virtual Storage Platform (VSP);全閃存:Texas Memory Systems RamSan-630、華為賽門鐵克Oceanspace Dorado2100。
對于分類的依據(jù),相信稍微資深一點的同行都清楚,筆者也會在后面做進一步的解釋。
首先看IOPS,這也是各廠商多年來一直比拼的。3PAR在被惠普收購不到一年時推出的HP P10000 3PAR V800目前保持SPC-1測試的冠軍(450,212 IOPS),它配置了1,920個15,000轉(zhuǎn)FC驅(qū)動器;在其之前創(chuàng)造紀錄的是全閃存的TMS RamSan-630(400,503 IOPS),只使用了20個大容量閃存模塊(在這里也統(tǒng)稱為SSD),單位IOPS所占用的空間和消耗的電能確實不可同日而語。日立數(shù)據(jù)系統(tǒng)隨后公布的VSP測試成績沒有3PAR V800高(269,506 IOPS),它的驅(qū)動器數(shù)量也不是滿配(1,152個2.5英寸SAS硬盤),不過這兩款產(chǎn)品平均每驅(qū)動器提供的IOPS卻基本一致(233~234)。另外作為傳統(tǒng)高端存儲系統(tǒng)的VSP在性價比上也是相對最差的,達到了$8.18/SPC-1 IOPS,估計這個數(shù)字在滿配的情況下可能會有所下降。
問題1:如今將惠普3PAR歸類為高端SAN陣列估計不會再有人表示異議,盡管它還是不具備大型機(IBM z/OS)環(huán)境的支持,P10000 3PAR V800和HDS VSP的IOPS效率如此接近,它們在延時等其它方面的性能指標會有哪些差異?
中端存儲系統(tǒng)里面,Oracle Sun ZFS Storage 7420c在上表中的IOPS是最高的(137,066.20,華賽S6800T其實超過了它,只是我們此次沒有列出),其每驅(qū)動器IOPS也高達489.52。不過除了閃存產(chǎn)品之外,在這一項上最為領(lǐng)先的卻是NetApp FAS3270A(566.96),而該產(chǎn)品、IBM Storwize V7000、Pillar Axiom 600 Series 3的性價比卻稍現(xiàn)差了些,每IOPS成本都超過了7美金。這一級別產(chǎn)品性價比最高的還是華為賽門鐵克Oceanspace S5600T($2.73/SPC-1 IOPS),緊隨其后的是Sun ZFS 7420c($2.99/SPC-1 IOPS),它們的表現(xiàn)甚至超過了大部分入門級存儲系統(tǒng)。Storwize V7000和Pillar Axiom 600的每驅(qū)動器IOPS都在220~230范圍內(nèi),相比之下華賽S5600T的406.63也超過它們不少。
問題2:同樣是中端SAN陣列,NetApp FAS3270A是如何在驅(qū)動器數(shù)量較少的情況下實現(xiàn)較高的效率?IBM V7000和Pillar Axiom 600在這里看似亮點不多,它們“貴”在哪里?也就是說哪些方面為用戶提供了更多的附加價值?華賽S5600T和Sun ZFS 7420c是怎樣在價格極具競爭力的情況下,性能效率又在傳統(tǒng)磁盤陣列中領(lǐng)先?
本次對比的入門級存儲系統(tǒng)有些特點,因為除了富士通ETERNUS DX80 S2之外的三款都OEM自NetApp E2600(即原LSI Engenio 2600),這個從IBM System Storage DS3524 Express Turbo和SGI InfiniteStorage 5000-SP相差無幾的IOPS(24,500左右)、都是96個10,000轉(zhuǎn)SAS驅(qū)動器上就可以看出(每驅(qū)動器IOPS自然也十分接近)。當然二者使用的硬盤容量不同,因此SGI 5000-SP顯得性價比略高?
這里有必要專門提一下來自NetApp E2600原型系統(tǒng)的High Performance Tier,戴爾PowerVault MD3200/3600系列產(chǎn)品和SGI稱其為高性能層級,在IBM DS3500上則叫做Turbo Performance。它是一個可以在控制器Firmware層級激活的選項,需要單獨購買。根據(jù)筆者的經(jīng)驗,High Performance Tier應該是允許將不同LUN選擇分配給A/B控制器(注意:不是同一個LUN在2個控制器間自動負載均衡),以實現(xiàn)Active/Active(雙活動)配置最大發(fā)揮性能。而默認情況下只能分配給第一個控制器,在它出現(xiàn)故障時才能由另一個接管上面的LUN。
那么,IBM System Storage DS3524 Express(不帶Turbo)就是沒有激活Turbo Performance進行的測試,并且驅(qū)動器數(shù)量只有一半——48個10,000轉(zhuǎn)SAS驅(qū)動器。其實根據(jù)這一點還可以從側(cè)面看出,該產(chǎn)品家族(包括DS3500、MD3200/3600和SGI 5000-SP)單個控制器的IOPS處理能力在 48個高轉(zhuǎn)速SAS硬盤的情況下還不會成為瓶頸;對于曾經(jīng)的滿配——96個驅(qū)動器(目前增加到支持192個),加上High Performance Tier才能比較充分地發(fā)揮其性能。由于48驅(qū)動器DS3524的SPC-1 IOPS(14,797.26)比它“兩位師兄”的一半還要高一些,因此其性價比和每驅(qū)動器IOPS在三者中相對最好。
再來看看Fujitsu ETERNUS DX80 S2。該產(chǎn)品使用117個10,000轉(zhuǎn)2.5英寸SAS驅(qū)動器取得了34,995.02 IOPS的成績,平均每驅(qū)動器貢獻299.10。另外,它的$2.25/SPC-1 IOPS性價比在所有參與對比的硬盤介質(zhì)存儲系統(tǒng)中排名第一。看來,我們以前有些忽視了富士通的實力。
問題3:對于NetApp E2600及其OEM產(chǎn)品的控制器設(shè)計,筆者已經(jīng)相當熟悉,使用LSI SAS2116 RoC(RAID on Chip)為核心的PowerPC架構(gòu)在入門級存儲系統(tǒng)中有一定的代表性,能夠比較好地平衡性能、成本和設(shè)計復雜度。那么富士通DX80 S2是通過什么樣的方法,來實現(xiàn)滿配的情況下仍然保持良好性能效率,同時還兼具成本優(yōu)勢的呢?
還有一款全閃存陣列華為賽門鐵克Oceanspace Dorado2100,使用24個100GB SSD驅(qū)動器達到了100,051.99 SPC-1 IOPS(中端存儲系統(tǒng)的水平),應該是創(chuàng)造了迄今為止最優(yōu)的$0.90/SPC-1 IOPS。Texas Memory Systems RamSan-630的$1.05/SPC-1 IOPS也相差不遠,性價比都超出富士通DX80 S2一倍以上,固態(tài)存儲在這方面的優(yōu)勢明顯。另外RamSan-630每驅(qū)動器IOPS高達20,025,Dorado2100也有4168.8,遠超任何的傳統(tǒng)磁盤陣列。
最后,我們還列出了“數(shù)據(jù)保護”一欄,絕大多數(shù)產(chǎn)品都采用了Mirror(鏡像)的RAID級別,也就是RAID 10,只有NetApp FAS3270A配置為RAID DP(雙校驗盤,類似于RAID 6),TMS RamSan-630設(shè)計了芯片級的RAID 5保護。RAID 10的好處是理論上最好的隨機讀性能(n * 單盤IOPS,n為硬盤數(shù))和相對較好的隨機寫性能(n/2 * 單盤IOPS),缺點是硬盤空間利用率只有50%;而RAID 5、RAID 6(DP)的寫算法通常要復雜一些,但容量利用率比RAID 10高。
除了上述這些,在SPC-1測試報告中還有更多有價值的信息。下面我們就再列出一些,按照存儲系統(tǒng)的定位分3(4)個大類進行對比。
容量/成本對比、固態(tài)存儲的優(yōu)勢和不足
上表中就是我們在前面提到過的四款入門級存儲系統(tǒng),它們都屬于雙控制器模塊化陣列,支持的驅(qū)動器數(shù)量少于200,SPC-1 IOPS性能不超過40,000。盡管上面3款NetApp E2600系產(chǎn)品支持的硬盤數(shù)都在去年翻倍達到192個,但其性能未必也隨之同比例提高。筆者在《戴爾MD32/36更新:120、192驅(qū)動器可選》一文中曾經(jīng)介紹過:“戴爾PowerVault MD3200/3600新版Firmware的基本型號只支持到120個驅(qū)動器,要想進一步提升至192個需要購買額外的硬盤驅(qū)動器PFK?!币虼耍皇客‥TERNUS DX80 S2支持120塊盤也是基本夠用的?!翱侫SU(Application Storage Unit)容量”指的是執(zhí)行SPC-1 Benchmark過程中讀、寫測試的全部邏輯容量范圍,也就是性能結(jié)果對應的可用容量?!翱臻g利用率”即總ASU(Application Storage Unit)容量在總體物理容量之中所占的比例,在RAID 10模式下這個數(shù)字比較理想的情況是接近50%,而RAID 5、RAID 6(DP)則能達到更高的利用率。
以參與測試的IBM System Storage DS3524 Express Turbo為例,全部物理存儲容量中除了ASU空間之外,還有未用存儲、用于數(shù)據(jù)保護的鏡像存儲(RAID 10)、過量分配/元數(shù)據(jù),以及(熱)備用盤等。
配置48個硬盤驅(qū)動器(本次對比中最少,閃存系統(tǒng)除外)的IBM DS3524參考價格也是最低——48,310美元。我們計算出的“每GB價格”一項,SGI InfiniteStorage 5000-SP的13.5美金遠超過另外三款產(chǎn)品,一方面它使用了小容量的146GB驅(qū)動器,而在此基礎(chǔ)上的價格已經(jīng)與相同數(shù)量/類型300GB硬盤的 IBM DS3524相差不多??梢娫谶@里的“同質(zhì)化”競爭中,SGI 5000-SP沒有價格優(yōu)勢。
我們還發(fā)現(xiàn)一個問題,配置117個300GB驅(qū)動器的Fujitsu DX80 S2,其ASU容量為什么低于96個相同容量驅(qū)動器的IBM DS3524呢?原因只有一個——并沒有將全部容量用于測試,實現(xiàn)類似短擊硬盤的效果(靠近盤片內(nèi)圈的部分磁道不用,以此人為?提高單個驅(qū)動器的IOPS)。還記得上文中我們提出的問題3嗎,SPC-1測試也是“有空子可鉆”的?
當然這樣做也有負面效果,那就是提高了每GB價格(空間利用率只有27.79%)——盡管ETERNUS DX80 S2的總價格低于DS3524 Express Turbo,但每GB價格卻超過后者。其實這也為傳統(tǒng)磁盤存儲系統(tǒng)的用戶提供了一種參考,究竟是要容量,還是要IOPS呢?
上面5款中端存儲系統(tǒng)支持的驅(qū)動器數(shù)量在200~1000之間,SPC-1 IOPS測試成績位于50,000~150,000的范圍內(nèi),除了Pillar Axiom 600 Series 3被認為是Scale-out橫向擴展設(shè)計之外,其余仍然屬于雙控制器模塊化陣列。在這里NetApp FAS3270A的960個硬盤數(shù)處于領(lǐng)先;IBM Storwize V7000目前只支持240個驅(qū)動器并不是技術(shù)問題,要知道IBM的高端存儲系統(tǒng)DS8800已經(jīng)支持1,536塊盤,Storwize V7000是IBM在中端市場上第一款完全采用自主技術(shù)的產(chǎn)品(之前依靠與LSI Engenio合作的DS4000/5000系列),它還會在不久的將來隨著硬件配置升級而增加更多功能。
這一檔次的設(shè)備,每GB價格大多集中在15~25美金的范圍,華為賽門鐵克Oceanspace S5600T的性價比突出,每GB 7.8美元使它能夠與入門級存儲系統(tǒng)相媲美。NetApp FAS3270A高容量利用率的RAID DP,并沒有阻止其每GB價格高達23.5美金,它是否以某些方面成本為代價來提高性能效率?這個我們將在后文中再做分析。
這里四款采用RAID 10配置的陣列,平均空間利用率沒有入門級存儲系統(tǒng)高。前面我們認為性價比出色的2個產(chǎn)品中,華賽S5600T還是比較厚道(45.38%),而Oracle Sun ZFS Storage 7420c Appliance的容量利用率只有28.22%,不排除以此來增加每驅(qū)動器IOPS的嫌疑。
我們將高端存儲系統(tǒng)和全閃存陣列放在一個表格中,盡管二者支持的驅(qū)動器數(shù)量相差天壤之別,但它們都是在通過各自的方式(前者是盤數(shù)、后者使用閃存介 質(zhì))來滿足不斷增長的數(shù)據(jù)中心應用服務(wù)器對存儲IOPS的極致需求。惠普3PAR的控制器單元通過背板以Scale-out的方式擴展;日立數(shù)據(jù)系統(tǒng) VSP則顯得保守一些,他們提出了3D擴展——即Scale-up + Scale-out + Scale-deep(繼承原來USP V/VM的存儲虛擬化功能)的概念。
HP P10000 3PAR V800 和 HDS VSP支持的驅(qū)動器數(shù)量都在2,000個左右,與EMC Symmetrix VMAX的2,400個處于同一水平,它們的SPC-1 實測IOPS也都超過了200,000。3PAR V800由于滿配300GB 15,000轉(zhuǎn)光纖通道驅(qū)動器,因此總ASU容量和總價格在本次對比中最高,然而其12.9美金的每GB價格卻低于除華賽S5600T之外的四款中端存儲 系統(tǒng),可見3PAR一直以來宣傳的高性價比并不是空話。相比之下VSP卻由于空間利用率低等原因,每GB價格(44.6美金)已經(jīng)接近Texas Memory Systems RamSan-630固態(tài)存儲系統(tǒng)(51.7美金)。Scale-out架構(gòu)看似完勝,那么傳統(tǒng)的大型框架式(Monolithic Frame-Based)高端磁盤陣列在今天就沒有優(yōu)勢了嗎?
TMS RamSan-630可以說是本次對比的一個亮點,在傳統(tǒng)中端存儲系統(tǒng)的價格水平上提供了高端陣列的性能,另外華為賽門鐵克Oceanspace Dorado2100也是以傳統(tǒng)入門級存儲系統(tǒng)的價格提供了中端陣列的性能??赡苁怯捎隍?qū)動器RAID 10和芯片級RAID 5的空間利用率、以及架構(gòu)設(shè)計方面的不同,華賽Dorado2100每GB價格還比較高,并且ASU容量在這些系統(tǒng)中最低(可以換用大容量驅(qū)動器來提高)。當然全閃存陣列目前還無法與傳統(tǒng)磁盤陣列拼容量,它們暫時只適合存儲“少量”需要高IOPS的數(shù)據(jù)。
總結(jié)與展望
筆者認為,企業(yè)級固態(tài)存儲市場距離成熟還有比較長的一段路要走,相關(guān)產(chǎn)品或多或少地還存在一些不足、有待完善的地方,比如在本文開頭提到的可擴展性、高可用性等方面的能力。至本文截稿之時,我們得知EMC Project Lighting(閃電計劃)將于2月初發(fā)布,簡單說這是一款將PCIe SSD安裝在服務(wù)器上作為共享存儲系統(tǒng)緩存加速的產(chǎn)品,當然還包括FAST緩存(分層)等高級軟件功能。正如EMC在上一次利用FAST(全自動存儲分層)功能帶動SSD驅(qū)動器的出貨那樣,Lighting的發(fā)布也將引發(fā)PCIe閃存卡在企業(yè)存儲領(lǐng)域的另一個拐點?
回到SPC-1這個話題上,盡管對它的爭議不會就此停止,但我們覺得上述分析、評論還是能夠給人以收獲,比如說空間利用率與每驅(qū)動器IOPS、每 GB價格之間的微妙關(guān)系等。文中陸續(xù)提出的一些問題,有的找到了答案而還有些尚未了結(jié),這就是我們要留到下一篇討論的內(nèi)容。在涉及的產(chǎn)品里面,筆者曾經(jīng)分 析過NetApp E2600系(對應IBM DS3524和SGI 5000-SP)、IBM Storwize V7000和3PAR V800的架構(gòu)設(shè)計,那么下一步應該進行更全面的比較。SPC-1報告中還有響應時間曲線、結(jié)構(gòu)示意圖、詳細的配置信息和分項成本等待我們?nèi)ネ诰?,當然?僅限于SPC-1…