而與此同時,我們也看到了一份TPC-H SF 1000測試結果,其中包括部分AMD處理器的測試成績:
The figure table below shows TPC-H SF 1000 results for the 8-way 6-core Opteron 8439 on SQL Server and Sybase, the 16-way quad-core Itanium 9350 on Oracle, the 4-way Xeon 7560 on SQL Server and the 8-way POWER7 on Sybase.
從這些圖中我們不難得出一個結論:eX5系統(tǒng)的性能以及直追目前部分RISC架構的高端系統(tǒng)的性能,而隨著至強E7系列處理器在RAS方面的提升,System x3950 X5、System x3850 X5、System x3690 X5,以及IBM BladeCenter HX5在關鍵業(yè)務服務器領域已經占據了市場的高端。
關鍵應用高可靠:不能只靠CPU
IBM eX5架構面向高性能、高可靠性的應用,這也是其采用英特爾的RISC替換級別至強處理器EX系列——至強E7(代號Westme-EX)及之前采用至強7500(代號Nehalem-EX)的重要原因,但在系統(tǒng)可靠性方面,處理器、服務器平臺架構和系統(tǒng)整體構成了可靠性的三個要素,處理器方面的可靠性在此不再贅述,英特爾不斷將安騰的RAS特性移植到至強EX系列處理器上,而eX5架構和System X服務器可靠性則由IBM給予了充分的保證。
在系統(tǒng)級可靠性方面,eX5架構主要表現在Memory ProteXion技術的采用,它使得內存保護力度高達業(yè)界標準的4倍,它集成到eX5中與現成的DIMM配合工作。一般來說,不同DRAM的2個壞位便可導致Nehalem EP處理器發(fā)生故障。
Nehalem EX處理器在x8和x4 DIMM上面都支持SDDC+1,這樣當一個DRAM芯片壞掉、另一個完成糾錯時,系統(tǒng)仍可繼續(xù)運行。而eX5與Memory ProteXion組合時,即使在兩個DRAM完全壞掉時也可繼續(xù)運行并且檢測錯誤。
IBM預測性故障警報等高可用性特性能夠最大限度地延長應用的正常運行時間。它能提前發(fā)出潛在硬件故障警報,觸發(fā)預防行動,并維護應用可用性。其監(jiān)控并預警的組件涵蓋了硬盤、內存、處理器、風扇、電源等。
“總體而言,基于eX5架構的IBM全新服務器具備了高可靠性,并能進行預測性的故障警報和快速恢復等特性,還配備了Vmcontrol等軟件,已經能完全承擔起企業(yè)的關鍵任務應用。”Jay Holbrook表示。
針對在關鍵業(yè)務方面的應用,IBM系統(tǒng)與科技部System x全球高端產品總監(jiān)Jay Holbrook表示,當我們把越來越重要的工作負載跑在x86平臺上的時候,可靠性和可用性變得非常關鍵,IBM認為高可用性有四個組成部分,一是最可靠的硬件,IBM提供業(yè)界最好的硬件平臺。二是在這個硬件平臺有一個預測故障分析,有一個很好的診斷工具,可以在硬件出現故障出現之前就檢測到故障。三是更加智慧的軟件,是可以根據以前設置好的規(guī)則或者是根據我們診斷分析得來的信息及時采取相應的行動,比如通知管理員或者是采取冗余的設置。四是怎么從故障當中盡快的恢復,這也是提高可用性的重要手段,在出現故障之后可以很快的恢復正常。
他表示,基于eX5目前在業(yè)界受到的廣泛支持——像網絡的廠家EMULEX,操作系統(tǒng)像微軟、Redhat,還有SAP和VMWare都在廣泛支持eX5的架構——讓eX5成為了X86市場上最適合RISC-關鍵業(yè)務替換的X86計算系統(tǒng)。
“IBM采用了eX5的技術,目前是唯一的x86的平臺可以提供現在的內存擴展技術和I/O的擴展能力,從而使得內存和I/O的擴展性不局限于目前x86的架構,從而得到進一步擴展。eX5是性能優(yōu)化中心用于擴展內存的,Virtual Fabric是剛才談到的虛擬網絡連接的架構,從而使得I/O的擴展性得到進一步的提高。”Jay Holbrook認為,性能的提升只是eX5平臺特性的一個方面,最重要的是,IBM為eX5平臺設計了大量的應用解決方案和附加功能/組件,以及業(yè)界伙伴的普遍支持,他表示,IBM此次推出了業(yè)界第一個也是目前僅有的SAP認證的HANA,這就是最好的“認證”。
SAP HANA:IBM eX5開進
eX5此次的升級加之原有特性,異常豐富,這些內容可以留待后面去講——技術并非是所有關心eX5的人的重點,而面向SAP內存設備“SAP HANA”的全新的工作負載優(yōu)化型解決方案,卻一定能夠吊起很多人的胃口。
隨著SAP高性能分析應用軟件(SAP High-Performance Analytic Appliance ,簡稱SAP HANA)的推出,SAP在利用基于內存計算推動革新的歷程中又取得了一項具有里程碑意義的重大突破。去年12月,SAP正式宣布了HANA解決方案,及其配套的硬件方案的準入門檻。
HANA的特點是基于大內存進行內存計算,并完全針對多核處理器開發(fā),由于采用了獨特的多核處理算法,SAP HANA在不到一分鐘的時間內就可以基于5000億條銷售點記錄生成非常復雜的分析報告并可以進行查詢。取得該測試結果的硬件平臺為10臺刀片處理器組成的系統(tǒng),每臺處理器配備32個內核。
而對于IBM的System X eX5服務器平臺來說,最重要的一點是,SAP HANA的性能指標隨硬件升級而線性擴展,因此客戶在未來可以通過部署配備1000個或更多內核的系統(tǒng)實現更復雜的實時分析。
考慮到性能方面的需要以及產品定位的問題,IBM主要利用x3950 X5和x3690 X5服務器組建了四套系統(tǒng)和一套可升級選項套件,采用IBM的通用并行文件系統(tǒng)(GPFS),基于Novell SLES for SAP運行。“它是一個完整的軟件加硬件以及可選擇的服務的解決方案。” Jay Holbrook表示,除IBM硬件、操作系統(tǒng)、GPFS存儲文件系統(tǒng)之外,SAP提供了HANA預配置軟件,用戶唯一需要二次購買的就是SAP的License,而基于軟硬件集成的解決方案,讓采購后的部署異常簡單。
據Jay Holbrook透露,該系統(tǒng)解決方案得到SAP的認證,可使基于SAP的ERP數據分析應用達到每秒處理1.3TB的數據量,以及每小時進行10000次復雜的組合查詢分析報告。此外,eXFlash(極速存儲套件)和像MAX5性能優(yōu)化中心這些新的技術,在IBM HANA解決方案中也有所提供。
“我們定制了五種不同的型號,從比較小規(guī)模和特別大規(guī)模的可擴展的型號配置。這里面隨著業(yè)務需求的不同,我們有不同的配置,有些是傳統(tǒng)的硬盤,有的是有極速存儲套件的SSD。還有是FusionIO的SSD的卡,不同的配置帶來的不同的性能的SAP HANA的解決方案。” Jay Holbrook所展示的圖表中,顯示了不同配置的五個型號,而這其中的一些問題,筆者也與Jay Holbrook及徐行進行了深入的交流。
在這個型號列表中,最引人矚目的就是x3690 X5的SSD(7147-H3X)版本,這是一個采用10個200GB SSD的特別版本,純粹利用SSD來進行RAID5的數據保護并同時提供存儲容量,也因此可用容量只有1.6TB,而其他的型號都采用Flash(SSD或FusionIO)保護日志+傳統(tǒng)磁盤提供數據存儲容量的模式。
而另一方面,在較高端的三個型號,只采用了FusionIO的320GB或640GB PCIe卡來存儲日志存儲容量,由于顯然此方案中FusionIO卡為非冗余配置,且FusionIO也不可能為全部的320GB或640GB容量進行超量配置,高端型號的FusionIO卡的可靠性就成了一個隱患。
“SAP也在討論在做性能測試的時候發(fā)現eXFlash極速存儲套件是很好的,我們希望有一個型號是純SSD的配置,對于高端來講,再往上的配置用FusionIO的原因是當容量提升之后,后面的數據存儲是4個T以上,放了8個盤以后,系統(tǒng)的擴展能力就不再能夠放eXFlash極速存儲套件了,所以就轉到了FusionIO。”Jay Holbrook的意思實際上可以理解為,在提供了8塊硬盤的之后,eXFlash無法再增加8個更大容量的超過50GB(這應該是上一代eXFlash所提供的SSD容量版本)的SSD,因此轉向了FusionIO,而全配SSD的版本,則是和SAP溝通的結果,認為應當有一個高性能的全SSD的版本。
此外,Jay Holbrook表示,FusionIO的卡將SSD芯片和控制單元進行整合在一起,本身的控制單元考慮了冗余的機制,由于大部分的數據還是寫在外部的硬盤上,FusionIO卡主要是用來存放日志數據,而之所有所有的HANA方案都有采用SSD或FusionIO卡,主要就是考慮“日志對于速度更敏感,而硬盤存儲數據的保護性則更重要?!?/p>
但最主要的是兩點,徐行表示,一是同時在一個eX5系統(tǒng)中裝入兩塊卡的話空間方面比較困難,但FusionIO的卡的可靠性非常高,IBM經過了嚴格的驗證;二是,大部分用戶的HANA應用模式,都會是HA的高可用性架構,從這一點來看,日志數據已經獲得了很好的保護。
此外,除最低端的S(7147-H2X)型號之外,IBM為其他四個型號都提供了升級選項,實際上這也是L選項(M + SK*) (7143-H3X)的主要作用:用作升級連接模塊,IBM的HANA解決方案支持通過L選項(M + SK*) (7143-H3X)的雙節(jié)點配置,讓用戶可以通過內部連接獲得更高的單節(jié)點性能。
功能組件與技術亮點:從MAX5、eXFlash說起
在eX5架構中,IBM最為突出的就是MAX5和eXFlash功能,前者為eX5架構的服務器提供了擴展的內存容量,利用至強E7的一條QPI通道,在用戶后續(xù)上線虛擬化應用之后,提升系統(tǒng)的容量,而對于沒有虛擬化需求的用戶則滿足了更小的四路及八路服務器的空間尺寸;eXFlash則讓用戶能夠通過擴展SSD獲得高性能的啟動及前端處理速度,更適合前端接入應用的業(yè)務環(huán)境。
在本次升級中,通過靈動分區(qū)技術使雙節(jié)點x3850 X5添加了2個MAX5性能優(yōu)化中心,從而提供了節(jié)點故障切換能力,不過主要的變化,實際上是應用模式的變化,從下面兩張圖可以看出,傳統(tǒng)的應用模式只有1臺服務器+1個MAX5擴展的模式或兩臺服務器的雙節(jié)點模式,而在新的應用中,IBM允許用戶實現雙節(jié)點同時搭配MAX5擴展。
隨著至強E7和eX5芯片組的支持,目前MAX5性能優(yōu)化中心組件已經可以支持32GB DIMM以及低電壓DIMM,不過,其主要的應用領域,還是通過利用一條QPI帶寬,在未配置滿全部的處理器的情況下,獲得內存的大容量的提升,打破原有所限制的內存容量,“無需為了獲得最大內存來購買4個昂貴的處理器?!?/p>
eXFlash極速存儲套件,主要是通過SSD和高速控制器結合,提供更高的性能替換傳統(tǒng)的機械硬盤,目前x3850 X5和x3690 X5分別最多支持2個和3個eXFlash套件(每個套件支持8個SSD)。
據IBM方面表示,其能夠提供順序讀/寫250MB/s,隨機讀/寫4K數據塊30K和20K IOPS的性能,而每個eXFlash極速套件現在通過使用新的200GB的SSD(1.8寸 HS SAS SSD背板,使用6Gb SSD HBA,IBM提供50GB和200GB的1.8寸SATA MLC SSD),大幅度提升了可加速的容量——與一年前相比,更大容量的600GB 10K SAS硬盤已經普及。
“用新的eXFlash極速存儲套件,我們可以只用3%的成本,就是說比以前便宜97%,而且電力僅僅是以前的1%,降低了99%的功耗,就可以實現相同速度的IOPS,每秒鐘24萬的IO?!?IBM系統(tǒng)與科技部System x全球高端產品總監(jiān)Jay Holbrook表示,傳統(tǒng)的技術如果達到同樣的240K,就是24萬IOPS的話需要用80個存儲柜,就相當于有800個盤,每個磁盤是300個IOPS,總共是24萬。eXFlash大幅度的提升了系統(tǒng)IOPS的性能。
全面面向虛擬化應用
“可以在一個機器里面部署很多的虛擬機和更大的虛擬機,內存的擴展能力也夠多,這是對虛擬化的應用能力很強的。我們在設計eX5的時候,考慮到虛擬化和數據庫的應用,這也是剛才談到在現在的業(yè)務當中發(fā)展最快和應用最廣的兩種,一是虛擬化、一個是數據庫,也看到越來越多的關鍵業(yè)務應用跑在X86上,而這些關鍵應用最需要的是可靠性,eX5帶來的是最可靠的x86的平臺?!盝ay Holbrook表示,虛擬化在四路、八路及以上的系統(tǒng)更為普及,因為虛擬化更能夠發(fā)揮出這些系統(tǒng)的性能水平,因此eX5服務器的設計重點之一就是虛擬化。
“虛擬化的普及和工作負載規(guī)模的增加使內存和I/O變成了新瓶頸,雖然每個CPU的內核數量逐代增加,但系統(tǒng)內存和I/O靈活性并未跟上發(fā)展步伐?,F在,虛擬化需要系統(tǒng)提供大容量內存和靈活的I/O來支持最大的VM靈活性?!盝ay Holbrook向記者表示。
虛擬化的問題之一就是復雜的網絡連接所造成的數據孤島問題,IBM在eX5架構中采用了虛擬交換架構(Virtual Fabric)打破I/O瓶頸并且簡化部署流程,其基于Emulex所提供的CAN網絡聚合技術,能夠在一塊CAN卡上,實現以太網(10GbE無損以太網)、FCoE及iSCSI的能力,避免了復雜的LAN和SAN容量規(guī)劃和網絡孤島問題。
同時鑒于數據中心內HBA和NIC卡的冗余問題,實際上CAN卡還解決了冗余的多塊卡所帶來的成本問題——IBM虛擬交換架構技術可減少用于支持相同工作負載所需的適配器和交換機數量,從而降低成本。目前,在x3850 X5、x3690 X5及HX5、HS22和HS22V刀片中IBM都有所提供。
VMControl則瞄準了虛擬機的可靠性問題,IBM VMControl能夠監(jiān)控硬件并且在硬件故障發(fā)生之前自動轉移工作負載,VMControl提供了單一工具來同時管理和虛擬服務器。假如用戶配備的是VMControl Express版本,就可以免費下載Systems Director插件。System Director具備自動化功能,以便向VMwareVMotion發(fā)送物理警報。
作為可靠性的保障,VMControl會跟蹤硬件的運行狀況,而且自動可以把系統(tǒng)的虛擬機從不可靠的硬件上或者有可能出現問題的硬件上遷移到另一個機器上并且啟動虛擬機。主要利用虛擬化平臺的遷移功能,如VMware的VMotion技術實現。
去年IBM正式向市場推出了IBM Systems Director VMControl 2.1,并作為Systems Director的一個組件提供Express Edtion。其中VMControl標準版捕獲來自活動系統(tǒng)的信息,然后將捕獲到的信息存儲到一個可重復使用的系統(tǒng)鏡像資料庫中,也稱為虛擬設備,IBM Systems Director VMControl標準版提供從一個中央位置管理虛擬設備和自動部署虛擬設備的支持。
“現在已經有50%多的工作負載已經被虛擬化了。中國還沒有那么成熟的虛擬化的應用,但是我們看到這個趨勢是非常明顯的,我們相信中國IT的發(fā)展會很快的跟上全球步伐。”Jay Holbrook最后向記者表示。
此外,靈動分區(qū)(FlexNode靈動分區(qū))故障切換功能引起了媒體的關注,由于這項技術面向“多路服務器中出現的不可恢復的故障,”力圖提升“eX5為最可靠的多節(jié)點系統(tǒng)”,但是,由于雙節(jié)點運行情況下,出現宕機的系統(tǒng)會自動重啟,尚與HA有較大的差距,靈動分區(qū)(FlexNode靈動分區(qū))故障切換的功用到底面向何種情況,引發(fā)了一場討論。
“HA實現的可用性的級別不太一樣,HA是在應用層面,在兩臺機器上實現,這個是在一臺機器內部實現,而如果是兩臺機器中的一臺宕掉了,另外一臺的負載就會很大,靈動分區(qū)提供了另外一個級別,就是不完全宕掉還有一半能用。” Jay Holbrook表示,確實存在其中一個節(jié)點重啟過程中,另一正常節(jié)點負載壓力過大的情況,但是這項技術畢竟提供了一定程度上的保護,結合HA來用,等于有兩個級別的保護——“Activ-Active情況下,靈動分區(qū)還是很有用的,它提供了更高級別的可用性。”
作為IBM的智慧計算的一部分,eX5提升了System X的“智慧水平”,Jay Holbrook表示,“在2011 IBM論壇上,IBM正式發(fā)布了‘智慧的運算’(Smarter Computing)戰(zhàn)略。‘智慧的運算’是幫助客戶實踐‘智慧的地球’理念的重要戰(zhàn)略,包含大規(guī)模數據整合、優(yōu)化的系統(tǒng),以及云計算等新興服務交付模式。”
他認為,對于IBM System x服務器平臺,IBM擁有業(yè)界先進的第五代X架構(eX5),通過MAX5(性能優(yōu)化中心)、eXFlash(極速存儲套件)、FlexNode(靈動分區(qū))、Systems Director、IMM and uEFI等先進技術,IBM System x平臺提供了更高的性能、系統(tǒng)利用率和內存擴展,以及更低的成本和更簡單的部署。此次推出的System x服務器專為數據應用而設計,全新的工作負載優(yōu)化系統(tǒng)將有效的幫助用戶提升處理海量數據的能力,從而加快其云計算實踐的進程。