新上榜的系統(tǒng)中,Intel架構(gòu)系統(tǒng)占95%,也就是說,新上榜的87套HPC系統(tǒng)中,Intel架構(gòu)占了83套。全部TOP500中,77套采用了E5 v3至強(qiáng)處理器,139套采用了E5 v2,合計(jì)216套。協(xié)處理器方面,33套HPC系統(tǒng)的Intel Xeon Phi協(xié)處理器的系統(tǒng)浮點(diǎn)計(jì)算能力大于其他55套其他協(xié)處理器的總和。
面對這樣的一個(gè)成績單,英特爾有理由驕傲和自豪。
跳出畫面看畫
如果不被單純的數(shù)據(jù)所迷惑,很快就會(huì)意識到應(yīng)用的問題,因?yàn)橹挥刑岣邞?yīng)用的水平,斥巨資投建的Top500系統(tǒng)才能夠最大程度發(fā)揮作用。
如今,軟件仍然是高性能計(jì)算機(jī)應(yīng)用的短板,很多軟件還是串行應(yīng)用,GPU也需要軟件編程的支持??朔@些障礙,系統(tǒng)應(yīng)用水平就可以更進(jìn)一步,從而充分發(fā)揮高性能計(jì)算機(jī)的威力。
“懂計(jì)算機(jī)的,不懂應(yīng)用;懂應(yīng)用的,不懂計(jì)算機(jī)。”這就是目前軟件并行化的難題。相對來說,要計(jì)算機(jī)懂應(yīng)用就更為艱難。大多數(shù)情況下,專業(yè)人員需要自己開發(fā)軟件或者算法,這些軟件或者算法具有很強(qiáng)的指向性,通用性不強(qiáng)。
為推動(dòng)軟件,特別是軟件并行化的進(jìn)程,英特爾從2013年開始在全球啟動(dòng)并行計(jì)算中心,如今已經(jīng)在全球15個(gè)國家建立,今年4月與中科院合作,在中國建立了首家英特爾并行計(jì)算中心(IPCC),圍繞LAMMPS分子動(dòng)力學(xué)模型并行優(yōu)化、相場動(dòng)力學(xué)模擬軟件開發(fā)與中科院的專家進(jìn)行合作。
并行計(jì)算中心的成果對于材料科學(xué)、生命科學(xué)、計(jì)算化學(xué)、計(jì)算物理等領(lǐng)域的應(yīng)用研究將產(chǎn)生重大影響。通過跨領(lǐng)域的開發(fā)者、科學(xué)家、技術(shù)專家的培訓(xùn)分享、技術(shù)交流等活動(dòng),該中心對16個(gè)領(lǐng)域,超過80種應(yīng)用軟件針對至強(qiáng)融核(Xeon Phi)進(jìn)行開發(fā)和優(yōu)化了,著名科學(xué)家斯蒂芬霍金教授所創(chuàng)建的的劍橋大學(xué)理論宇宙學(xué)研究中心(COSMOS)也得益于英特爾架構(gòu)計(jì)算平臺的優(yōu)化。
開花結(jié)果
盡管時(shí)間不長,但英特爾中國并行計(jì)算中心已經(jīng)取得很多成果。
據(jù)中國科學(xué)院超級計(jì)算中心主任助理王彥棡介紹,IPCC的工作分成兩部分:一是專門做求解偏微分方程的求解,針對于剛性偏微分方程的需求,可以在大時(shí)間尺度下做相場計(jì)算,同時(shí)計(jì)算結(jié)果保持一致。以模擬1024 三次方解方程為例,在一個(gè)2個(gè)CPU和2個(gè)MIC單節(jié)點(diǎn)上,性能可以做到1300G浮點(diǎn)運(yùn)算能力,接近理論值性能的52%,其中負(fù)載均衡、通訊兼容疊加等技術(shù)發(fā)揮了非常重要的作用。而在此之前,一個(gè)節(jié)點(diǎn)的性能發(fā)揮僅為6%~7%,這也就意味著,通過優(yōu)化,如今的一個(gè)節(jié)點(diǎn)相當(dāng)于以往幾十個(gè)節(jié)點(diǎn)的計(jì)算能力。IPCC另外一個(gè)重點(diǎn)是針對開源軟件提供支持,自己做算法開發(fā),提供DPD算法并注入到LAMMPS,將最終的代碼會(huì)以API的形式放到LAMMPS當(dāng)中,以開源方式對外發(fā)布。
圍繞著Top 500,頭頂著“國家科技實(shí)力象征”的光環(huán),高性能計(jì)算始終被輿論關(guān)注。天河二號,連續(xù)5屆排名榜首也確實(shí)為我國爭取了不少榮譽(yù)。但越是這個(gè)時(shí)候,專業(yè)人員越要保持清醒的頭腦。
硬實(shí)力固然重要,但“軟”實(shí)力同樣不可或缺,甚至更加重要。