法國(guó)的Curie thin nodes以1.36PFLOP的運(yùn)算能力位列TOP500的第9名,這同樣是一臺(tái)基于至強(qiáng)E5的超級(jí)計(jì)算機(jī)。和SuperMUC一樣,它也是采用了Xeon E5-2680 8C處理器,主頻為2.7GHz,共計(jì)77184個(gè)內(nèi)核。Curie thin nodes的內(nèi)存為308736GB,整體功耗為2251kW,采用了Infiniband QDR高速互聯(lián)網(wǎng)絡(luò)。
SuperMUC和Curie thin nodes都采用Xeon E5-2680作為節(jié)點(diǎn)計(jì)算平臺(tái),很難說(shuō)是巧合。因?yàn)樵谑着l(fā)布的Xeon E5-2600處理器家族中,Xeon E5-2680屬于其中的高規(guī)格產(chǎn)品,它為8核心16線程結(jié)構(gòu),三級(jí)緩存為20M,QPI速度為8.0GT/s,功耗是130W。從整體上看,Xeon E5-2680是作為節(jié)點(diǎn)機(jī)較為合理的計(jì)算平臺(tái)選擇。
而事實(shí)上,從Nahalem架構(gòu)的至強(qiáng)5500到Sandy Bridge架構(gòu)的至強(qiáng)E5,至強(qiáng)處理器在高性能計(jì)算能力方面獲得了不斷的加強(qiáng)。新一代至強(qiáng)處理器已經(jīng)成為了TOP500超級(jí)計(jì)算機(jī)中的主流選擇。因?yàn)榻陙?lái)每年2次的TOP500榜單中,基于英特爾至強(qiáng)處理器的系統(tǒng)均超過(guò)了70%。
本屆TOP500榜單中,共有372套系統(tǒng)采用了英特爾處理器,這個(gè)比例超過(guò)了74%。而即使是新入榜的系統(tǒng),采用英特爾處理器的系統(tǒng)占據(jù)了超過(guò)78%的份額。這意味著未來(lái)英特爾在TOP500中的份額還會(huì)有所提升。
新一代至強(qiáng)發(fā)力高性能計(jì)算
英特爾對(duì)于高性能計(jì)算的全力支持,可謂是源遠(yuǎn)流長(zhǎng)。以Nahalem架構(gòu)的至強(qiáng)5500為標(biāo)志,英特爾至強(qiáng)處理器進(jìn)入了全新的時(shí)代。新架構(gòu)對(duì)內(nèi)存帶寬的大幅增加,快速通道互聯(lián)技術(shù)、智能加速技術(shù)以及英特爾超線程技術(shù)等的采用,使得至強(qiáng)5500相比于上一代產(chǎn)品,在制造、建模、地震模型等方面可以獲得超過(guò)3倍以上的性能提升。
基于32納米工藝制程的至強(qiáng)5600處理器,除了性能比上一代的至強(qiáng)5500提升60%左右為,更是在綠色節(jié)能方面頗有建樹(shù),為降低高性能計(jì)算機(jī)的整體功耗立下了汗馬功勞。
在自適應(yīng)能效方面,至強(qiáng)5600主要在4個(gè)方面進(jìn)行了改進(jìn):包括CPU功耗更低,每瓦特性能更高,六核版本至強(qiáng)5600的最低功耗為60W,四核版本至強(qiáng)5600的最低功耗只有40W;增強(qiáng)了智能節(jié)能技術(shù),可以調(diào)節(jié)六個(gè)內(nèi)核的能耗狀態(tài),性能功耗比更接近理想的線性狀態(tài);處理器內(nèi)核的能耗管理算法進(jìn)行了更新,可以讓Turbo Boost睿頻更高效,同時(shí)對(duì)內(nèi)存的能耗管理做到更精細(xì)化。此外,至強(qiáng)5600所集成的內(nèi)存控制器提供了對(duì)1.35v低電壓DDR3內(nèi)存的支持,而標(biāo)準(zhǔn)的DDR3電壓為1.5v。支持低電壓內(nèi)存的實(shí)際效果是在不犧牲性能的前提下可以降低20%的熱量。
除了不斷提供更高性能更低功耗的處理器給高性能計(jì)算用戶(hù)外,值得一提的是,英特爾早就提出了“Cluster Ready”計(jì)劃,對(duì)許多硬件廠商和軟件廠商的產(chǎn)品進(jìn)行兼容性認(rèn)證,讓用戶(hù)在搭建集群方面不用在選型方面費(fèi)心思。英特爾“Cluster Ready”可以幫助用戶(hù)在采購(gòu)和使用新平臺(tái)時(shí)更加簡(jiǎn)單——選購(gòu)經(jīng)過(guò)Intel Cluster Ready 認(rèn)證的應(yīng)用軟件和集群系統(tǒng),可以確保硬件平臺(tái)和軟件應(yīng)用之間的互操作性,獲得性能提升和穩(wěn)定可靠的平臺(tái)。
至強(qiáng)E5為高性能而生
2012年3月,英特爾按照“鐘擺”理論,推出了全新的基于Sandy Bridge架構(gòu)的至強(qiáng)E5-2600 處理器。新架構(gòu)的采用使得至強(qiáng)E5仿佛是為高性能計(jì)算而生,它在眾多方面的特殊設(shè)計(jì)和優(yōu)異表現(xiàn),使得很多用戶(hù)立刻將高性能計(jì)算平臺(tái)的選擇轉(zhuǎn)向了至強(qiáng)E5,這也使得其上市僅3個(gè)月就有45套系統(tǒng)沖進(jìn)了第39屆TOP500排行榜。
首先,至強(qiáng)E5具有8個(gè)核心,相比上一代的至強(qiáng)5600多出兩個(gè)內(nèi)核,具備20MB L3緩存,平均每核心2.5MB,這比上一代的每核心2MB要多25%,核心和緩存的增強(qiáng)對(duì)計(jì)算能力的提升明顯。因而至強(qiáng)E5在性能上比上一代的至強(qiáng)5600有80%的性能提升。
其次,至強(qiáng)E5在帶寬方面采用了環(huán)形鏈路總線,提升了帶寬降低了延遲。在QPI總線上,至強(qiáng)E5具備兩條最高8GT/s的QPI,相比至強(qiáng)5600家族每條鏈接帶寬增加了25%;在內(nèi)存支持上,至強(qiáng)E5具有四個(gè)內(nèi)存通道,內(nèi)存規(guī)格支持也提升到了DDR3-1600,而至強(qiáng)5600最高支持DDR3-1333。從這些規(guī)格來(lái)看,E5在數(shù)據(jù)帶寬上要明顯領(lǐng)先于至強(qiáng)5600,更加適合HPC苛求高帶寬的應(yīng)用。
第三,至強(qiáng)E5還引入了專(zhuān)門(mén)針對(duì)HPC應(yīng)用的AVX高級(jí)向量擴(kuò)展指令集,來(lái)加強(qiáng)浮點(diǎn)運(yùn)算性能。AVX技術(shù)是加大計(jì)算密度的起點(diǎn),AVX指令集將現(xiàn)存的浮點(diǎn)向量指令從128位擴(kuò)展到256位,這種改進(jìn)可以讓每核每時(shí)鐘浮點(diǎn)運(yùn)算峰值翻倍。
此外,英特爾還在5月推出了至強(qiáng)E5-4600處理器,這是針對(duì)緊湊型4路服務(wù)器的新平臺(tái)。至強(qiáng)E5-4600能在單個(gè)系統(tǒng)中最多可提供32個(gè)內(nèi)核和48個(gè)DIMM,適用于諸如科學(xué)研究和金融服務(wù)等各種廣泛的技術(shù)計(jì)算應(yīng)用,適合做大規(guī)模集群的“胖”節(jié)點(diǎn)使用。
當(dāng)前,云計(jì)算正快馬加鞭地走進(jìn)人們的工作和生活,高性能計(jì)算也因此被賦予了新的使命。隨著應(yīng)用的日益豐富和海量數(shù)據(jù)處理需求的增加,高性能計(jì)算已經(jīng)從原有的科研、氣象、工程、開(kāi)發(fā)等領(lǐng)域,逐漸向更為廣闊的商業(yè)計(jì)算和信息化服務(wù)擴(kuò)展。英特爾至強(qiáng)E5應(yīng)需而生,其獨(dú)特的創(chuàng)新設(shè)計(jì),已日漸被高性能計(jì)算用戶(hù)所認(rèn)可。相信,在下一屆全球TOP500中,一定會(huì)有更多的至強(qiáng)E5系統(tǒng)上榜。