五年后,“走鵑”正式停止運(yùn)作,宣布退役?;蛟S很多人無(wú)法相信自己的耳朵,耗資如此巨大,當(dāng)年風(fēng)靡整個(gè)超算界的冠軍居然這么快就要退役了!這其中的原因究竟是什么?

首個(gè)突破千萬(wàn)億次的超級(jí)計(jì)算機(jī)“走鵑”

在討論英雄為何退役之前,我們有必要看一下他的基本資料:“走鵑”使用 fedora 操作系統(tǒng),混合使用 PowerPC 系列處理器和 AMD 六核處理器。它采用一種被稱為“TriBlades”的混合式架構(gòu)——將一片裝有 2 顆 Opteron 雙核 CPU 和 8GB 內(nèi)存的 LS21 型刀片服務(wù)器以及 2 片各載有兩顆 PowerXCell 8i 處理器和 8GB RAM 的 QS22 型刀片服務(wù)器合并,插在一片 PCI-Express 8x 的擴(kuò)充卡板上組成。

一組 BladeCenter H 機(jī)箱中可容納3 套 TriBlades ,一個(gè)機(jī)柜可被放入四組 BladeCenter H 機(jī)箱,共有 296 個(gè)機(jī)柜,也就是說(shuō)整套“走鵑”系統(tǒng)包含 6912 顆 AMD Opteron 雙核 CPU 和 12960 顆 PowerXCell 8i 處理器,內(nèi)存空間共有 114TB,存儲(chǔ)容量將近109萬(wàn)TB。

在5年的運(yùn)行中,Roadrunner是美國(guó)國(guó)家核安全管理局(NNSA)先進(jìn)仿真和運(yùn)算項(xiàng)目的“主力”,它為核武器儲(chǔ)備管理進(jìn)行仿真。據(jù) NNSA的聲明稱:“Roadrunner為核武器儲(chǔ)備管理進(jìn)行例證:一個(gè)卓越的團(tuán)隊(duì)整合復(fù)雜代碼和先進(jìn)計(jì)算架構(gòu),確保安全、可靠、有效的威懾。”

除了監(jiān)測(cè)核武器任務(wù),Roadrunner還協(xié)助描繪愛(ài)滋病基因樹(shù)映射,模仿宇宙大爆炸,幫助科學(xué)家理解暗物質(zhì)。

被能耗打敗 “走鵑”退役后轉(zhuǎn)做測(cè)試

事實(shí)上,Roadrunner仍然是全球最快的30臺(tái)超級(jí)電腦之一(目前排名第22位),為什么速度仍然排名靠前的“走鵑”卻要面臨著退役的命運(yùn)呢?

筆者認(rèn)為,當(dāng)年的超算英雄——“走鵑”退役最主要的原因在于能耗太大。據(jù)了解,“走鵑”要達(dá)到每秒1042萬(wàn)億次的浮點(diǎn)計(jì)算性能需要2345千瓦的功率,而相比之下,超級(jí)計(jì)算機(jī)排行榜前五名之一的德國(guó)于利希研究中心的IBM Juqueen超級(jí)計(jì)算機(jī)達(dá)到每秒4141萬(wàn)億次浮點(diǎn)計(jì)算性能只需要1970千瓦功率。由此可見(jiàn),在經(jīng)融危機(jī)和能源危機(jī)的雙重壓力下,“走鵑”不得不踏上退役的道路。

阿拉莫斯科學(xué)實(shí)驗(yàn)室的研究員表示,實(shí)驗(yàn)室未來(lái)的超級(jí)計(jì)算機(jī)需要比“走鵑”具備更高的每瓦性能,而且在操作和存儲(chǔ)海量數(shù)據(jù)方面都要更有優(yōu)勢(shì)。

隨著GPU等新的芯片技術(shù)的出現(xiàn),高性能計(jì)算機(jī)的每瓦性能大幅提升,Roadrunner已經(jīng)落后了。目前位居超級(jí)計(jì)算機(jī)排行榜第一位的美國(guó)橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室配備的Titan電腦,運(yùn)算速度達(dá)每秒17.59千萬(wàn)億次。Titan由Cray制造,它包括18688個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)有16顆 AMD Opteron處理器和1顆Nvidia Tesla GPU。

需要澄清的是,“走鵑”退役并不是要被拆解成碎片,研究人員將會(huì)繼續(xù)在走鵑上進(jìn)行一些測(cè)試實(shí)驗(yàn),尋找更優(yōu)的操作系統(tǒng)壓縮方法、優(yōu)化數(shù)據(jù)路由等。

分享到

tangrong

相關(guān)推薦