這款超級計算機使用了Aries互聯(lián)技術(shù),這種技術(shù)對于大規(guī)模和并行計算來說意義重大,也正是如此英特爾在今年四月的時候,就花費1.4億美元收購了曾經(jīng)開發(fā)出Gemini互聯(lián)技術(shù)的團隊和芯片產(chǎn)品,以及與此相關(guān)的34項專利。
代號為“Cascade”超級計算機XC30
正是如此,Cray專屬并能使用Gemini和Aries技術(shù),并與英特爾研發(fā)設(shè)計代號為“Shasta”的通用超級計算機。此次推出的XC30超級計算機,是由Cray和DARPA聯(lián)手打造,使用了全新的Aries互連(Interconnect)技術(shù),在性能方面輕松超越了之前的世界第一超級電腦Titan,同時也和其它競爭對手(如我國的天河二號)拉開了差距。
Aries互聯(lián)和Cascade節(jié)點
Aries芯片擁有2.17億個柵極,采用了40nm制程工藝制造。Aries擁有184個SerDes(串并行)通道,提供30個光纖通道、64個PCI-E擴展通道。
XC30系統(tǒng)和刀片
XC30系統(tǒng)采用半寬、全長水平放置的刀片設(shè)計,每個刀片的背后都有一個Aries互聯(lián)通路。Aries芯片連入到機箱底板和刀片上的4個服務(wù)器節(jié)點。
這些刀片被應(yīng)用在Cray稱之為“processor daughter card”的模塊上,所有的CPU都有兩個這種processor daughter(2個雙插槽節(jié)點),在機箱中緊挨著并由PCI-E連接到Aries互聯(lián)通道上,每個刀片有4個節(jié)點。
值得一提的是,在XE6超級計算機上,每個刀片需要配備2個Gemini芯片將4個雙插槽的皓龍計算節(jié)點和Gemini互聯(lián)進行連接。但在 Aries超級計算機上,借助4個不同的Dragonfly topology,用戶只需要為刀片上的4個節(jié)點配備1個Aries芯片即可。也就是說,對于Cray可以節(jié)省大量的成本。
剛才提到processor daughter cards,這些計算卡上擁有4個至強E5插槽(通過英特爾的C600芯片組成對互聯(lián)),每個插槽對應(yīng)有4個內(nèi)存通道。
超級計算機XC30組成結(jié)構(gòu)示意圖
從圖中我們也可以看出,每個Cascade刀片上有4個計算節(jié)點,1個機箱中有16個刀片。XC30系統(tǒng)擁有數(shù)百個這種機柜并使用了主動光纖網(wǎng)絡(luò),而且它們也通過Aries芯片與節(jié)點互相連接。頂配的XC30超級計算機系統(tǒng)擁有多達200個機柜——與Jaguar、Titan超級計算機擁有一樣的身材,但在每個機柜中擁有比后兩者多(2倍)的x86插槽。
另外, 這款超級計算機新增了對英特爾最新推出的至強融核協(xié)處理器的支持(也支持英偉達的Tesla K20協(xié)處理器)。用戶只需要將processor daughter cards的處理器拿掉并替換成新的加速器即可。CPU卡可通過PCI-E來連接加速器,CPU的另一側(cè)則通過PCI-E與Aries相連。
XC30超級計算機散熱系統(tǒng)圖解
這種設(shè)計采用了熱插拔的風(fēng)機(機柜的左側(cè))和垂直縱向的水冷機組(位于機柜內(nèi)的右側(cè))。冷風(fēng)從數(shù)據(jù)中心進入到風(fēng)機,并橫向跨過刀片并對其進行降溫散熱。機柜中的縱向冷水機組會對空氣進行降溫并回流到數(shù)據(jù)中心,使得其能夠進入到下一組風(fēng)機并對整排機器進行散熱。