經(jīng)過分析該榜單,IT168服務(wù)器頻道認(rèn)為至少有以下五個(gè)新的關(guān)注點(diǎn):

一、天河一號(hào)TOP100再奪魁,有望沖擊TOP500冠軍

在2010年5月底的國際TOP500排行榜上,曙光星云(Nebulae)系統(tǒng)憑借1.271PFlop/s的Linpack性能獲得了第二名的位置,這是中國超級(jí)計(jì)算機(jī)界在國際舞臺(tái)上有史以來取得的最好成績。時(shí)隔半年,本以為在今年的國內(nèi)TOP100排行榜上,曙光星云會(huì)穩(wěn)拿冠軍,沒想到半年殺出了個(gè)程咬金,由國防科大生產(chǎn)的天河一號(hào)繼2009年之后再度奪魁。

在過去一年里,天河一號(hào)進(jìn)行了大升級(jí),目前的配置是14336顆英特爾六核至強(qiáng)X5670 2.93GHz CPU和7168顆Nvidia Tesla M2050 GPU和2048顆自主研發(fā)的八核飛騰FT-1000 CPU。處理內(nèi)核數(shù)突破20萬顆,是去年24576顆的8.25倍。其實(shí),天河一號(hào)不僅僅是升級(jí),而是幾乎更新了整個(gè)結(jié)構(gòu),上一代采用的是英特爾四核CPU+ATI GPU,通過Infiniband互連,而新一代則是英特爾六核CPU+NVIDIA GPU+自主八核飛騰CPU,通過專有網(wǎng)絡(luò)互連。

天河一號(hào)的峰值計(jì)算性能達(dá)到了4.7Pflops,即每秒4.7千萬億次,是上一代的3.9倍,Linpack值達(dá)到2.507Pflops,達(dá)到上一代的4.4倍。與排名第二的曙光“星云”相比,天河一號(hào)的峰值性能是其1.57倍,Linpack性能是1.97倍。另外,通過采用雙精度性能更高的GPU后,天河一號(hào)的系統(tǒng)效率,即Linpack值與理論峰值的比率,也由原來的47%提高了現(xiàn)在的53.3%。

而且,值得一提的是,天河一號(hào)的Linpack性能比目前TOP500第一名的Cray機(jī)器還要高,是后者的1.425倍。因此,天河一號(hào)還非常有希望在11月中旬將要公布的新一期TOP500中取得冠軍地位,結(jié)果如何,讓我們拭目以待。

TOP10系統(tǒng)如下表所示:

二、10萬核以上的超大規(guī)模計(jì)算系統(tǒng)出現(xiàn),應(yīng)用堪憂

在今年的TOP100排行榜上,出現(xiàn)了兩臺(tái)擁有10萬個(gè)處理內(nèi)核以上的超級(jí)計(jì)算機(jī)系統(tǒng),這些內(nèi)核包括普通的CPU核和GPU核。其中,天河一號(hào)的計(jì)算內(nèi)核數(shù)更是超過了20萬顆,達(dá)到202752顆。TOP10系統(tǒng)采用的處理器核數(shù)如下表所示:

這種超大系統(tǒng)的出現(xiàn)對(duì)技術(shù)和應(yīng)用兩方面都提出了很多挑戰(zhàn),包括計(jì)算效率、功耗、管理、I/O、占地面積、應(yīng)用軟件等等,尤其是應(yīng)用軟件可能會(huì)成為很大的瓶頸。據(jù)上海超算統(tǒng)計(jì),2009年其使用16核以下的作業(yè)占到了60%,17-160核的作業(yè)占39%,160核以上僅僅占到1%。這也意味著很多大機(jī)器被各類超算中心買去之后,實(shí)際上都會(huì)拆分成若干塊分給不同單位或部門去使用,因此并沒在起到大機(jī)器應(yīng)有的作用。

要解決這個(gè)問題,一方面,我們需要開發(fā)出可以使用到千核以上的應(yīng)用,以充分發(fā)揮大機(jī)器應(yīng)有的作用;另一方面,其實(shí)也可以考慮將“HPC與云計(jì)算”更好結(jié)合,讓高性能計(jì)算資源池化和自動(dòng)化,讓更多中小企業(yè)來使用。

三、GPU加速流行,其中5套進(jìn)了TOP10

GPU加速已經(jīng)成為做大系統(tǒng)的“絕招”。在最新的榜單上,采用CPU+GPU混合架構(gòu)的高性能計(jì)算機(jī)就達(dá)到了7套之多(如下表所示),而且都是2010年新安裝的,其中有6套是英特爾CPU與NVIDIA GPU的搭配,另一套是英特爾CPU與AIT GPU的搭配。而且值得關(guān)注的是,在TOP10中,就有5套采用了CPU+GPU的結(jié)構(gòu)。

英特爾與NVIDIA這對(duì)老冤家明爭暗斗,沒想到在用戶這里卻成了好搭檔。從大多數(shù)系統(tǒng)所使用的GPU來看,基于Fermi架構(gòu)的NVidia Tesla C2050受到了一致的青睞。這也似乎意味著NIVIDA在經(jīng)過幾年艱辛推廣之后,終于迎來了春天。

不過值得注意的是,GPU系統(tǒng)也并非完美無缺,除了軟件編程和移植比較難之外,計(jì)算系統(tǒng)效率低也是此次TOP100反映的一個(gè)現(xiàn)實(shí)。這7套GPU系統(tǒng)的計(jì)算效率都比較低,最低的只有18.3%,最高的也不過54%,而一般CPU集群的效率最高可突破90%,比如排名第20位的安裝在南京大學(xué)的IBM BladeCenter HS22刀片集群的效率就達(dá)到92%。

四、廠商集中化趨勢非常明顯,曙光和IBM占三分之二

從最新一期的TOP100來看,廠商的集中化趨勢非常明顯,表現(xiàn)在:一是有一些廠商退出了排行榜,比如SGI、銀河風(fēng)云、蜆殼星盈等;二是份額越來越多的掌握在少數(shù)兩三家廠商手中,僅曙光和IBM兩家的份額之和就超過了62%,幾乎在重演2007年的市場格局。

另外從發(fā)展趨勢來看,筆者統(tǒng)計(jì)了2007年-2010年的數(shù)據(jù),發(fā)現(xiàn)曙光和IBM都在不斷擴(kuò)大各自在HPC領(lǐng)域里的優(yōu)勢地位,尤其是IBM已經(jīng)連續(xù)四年穩(wěn)步增長,曙光今年的增長幅度也尤其高,相反,HP的份額卻在不斷減少,一增一減形成了非常鮮明的對(duì)比。

顯然,廠商的過度集中化,對(duì)于整個(gè)產(chǎn)業(yè)的健康發(fā)展并非好事,因?yàn)橐环矫媸袌鲂枰偁?,從而可為用戶提供更高性價(jià)比的產(chǎn)品和服務(wù),另一方面,產(chǎn)業(yè)也需要?jiǎng)?chuàng)新,特別是在云計(jì)算、物聯(lián)網(wǎng)的時(shí)代,需要有眾多的、有不同專業(yè)優(yōu)勢的大小廠商一起參與創(chuàng)新。

五、高性能計(jì)算在物聯(lián)網(wǎng)的應(yīng)用值得關(guān)注

石油勘探、科學(xué)計(jì)算、互聯(lián)網(wǎng)、工業(yè)、電信、教育仍然是我國高性能計(jì)算的主力軍。不過,隨著許多新興行業(yè)的發(fā)展,也對(duì)大型超級(jí)計(jì)算機(jī)產(chǎn)生了新的需求,比如生物信息、視頻計(jì)算、動(dòng)漫渲染、電子商務(wù)等。

今年尤其值得關(guān)注的是HPC在物聯(lián)網(wǎng)領(lǐng)域里的應(yīng)用——無錫物聯(lián)網(wǎng)云計(jì)算中心的曙光5000排在第80位。物聯(lián)網(wǎng)的發(fā)展會(huì)產(chǎn)生大量的數(shù)據(jù)需要計(jì)算處理,對(duì)超級(jí)計(jì)算機(jī)有著強(qiáng)烈的需求,雖然目前物理網(wǎng)還處于起步階段,但相信隨著物聯(lián)網(wǎng)的發(fā)展,會(huì)有越來越多的HPC系統(tǒng)出現(xiàn)。

分享到

liukai

相關(guān)推薦