【圖1】“天河二號(hào)(Milky Way2)”

近日,第41屆國(guó)際超級(jí)計(jì)算機(jī)TOP500榜單在國(guó)際超級(jí)計(jì)算大會(huì)(ISC13)上公布(詳情請(qǐng)見http://www.top500.org/),中國(guó)超級(jí)計(jì)算機(jī)“天河二號(hào)(Milky Way2)”以33.86 PFlops的實(shí)測(cè)峰值榮登榜首。

“微異構(gòu)架構(gòu)”提升系統(tǒng)可編程性

盡管“天河二號(hào)”肩負(fù)著奪冠的重大使命,但與往常一些只為了奪冠的超級(jí)計(jì)算機(jī)有所不同,“天河二號(hào)”更重要的任務(wù)是應(yīng)用——支持整個(gè)長(zhǎng)三角地區(qū)的科學(xué)研究、企業(yè)計(jì)算,甚至一些大數(shù)據(jù)的應(yīng)用。因此,它對(duì)于可編程性要求非常高。

從系統(tǒng)架構(gòu)上來(lái)看,“天河二號(hào)”整個(gè)系統(tǒng)采用了32000顆英特爾E5 2600 V2系列,加上48000英特爾至強(qiáng)融核協(xié)處理器。這樣的架構(gòu),英特爾將其稱之為“微異構(gòu)架構(gòu)”。什么是“微異構(gòu)架構(gòu)”?英特爾(中國(guó))服務(wù)器平臺(tái)產(chǎn)品經(jīng)理張振宇給出了這樣的解釋,“所謂‘微異構(gòu)架構(gòu)’就是采用單一編程模式的異構(gòu)”。


【圖2】英特爾(中國(guó))服務(wù)器平臺(tái)產(chǎn)品經(jīng)理張振宇

這聽起來(lái)似乎很有誘惑力,因?yàn)閷?duì)于許多高性能計(jì)算的客戶而言,無(wú)論是“CPU+GPU”的架構(gòu)還是“CPU+MIC”的架構(gòu),異構(gòu)編程畢竟是一個(gè)老大難。微異構(gòu)架構(gòu)并不是說(shuō)CPU上的程序可以直接在CPU+MIC的架構(gòu)上使用,張振宇進(jìn)一步談道,“客戶需要先將應(yīng)用程序在CPU上做并行優(yōu)化,之后才可以直接移植到至強(qiáng)融核上,這里面的優(yōu)化技巧和方法需要學(xué)習(xí)和熟悉”。

英特爾高性能計(jì)算產(chǎn)品線全面開花

英特爾每年都會(huì)在國(guó)際超級(jí)計(jì)算機(jī)大會(huì)上發(fā)布相應(yīng)的新品,去年發(fā)布了5100P,今年又發(fā)布了五款新的至強(qiáng)融核產(chǎn)品,包括 7100系列的7120P,7120X,31系列的3120P和3120A,還有5100系列的5120D。其中,7100最高的性能可以達(dá)到1.2T雙精度浮點(diǎn)計(jì)算。3100是最佳的性價(jià)比,5100是最通用的產(chǎn)品形態(tài),5120D是小型封裝,可以在OEM刀片系統(tǒng)里使用。

除了芯片之外,英特爾在HPC的各個(gè)領(lǐng)域也都陸續(xù)推出了相應(yīng)的產(chǎn)品,目前已經(jīng)形成了一個(gè)非常強(qiáng)大的產(chǎn)品線,包括Xeon Phi協(xié)處理器,英特爾Truescale和以太網(wǎng)的設(shè)備,同時(shí)還有正在研發(fā)的下一代互聯(lián)產(chǎn)品。此外,軟件方面,除了一些消息庫(kù)、并行軟件之外,英特爾今年還發(fā)布了一款新的并行文件系統(tǒng)——英特爾企業(yè)版Lustre。

Lustre最初來(lái)源于卡耐基梅隆大學(xué)的的研究員Peter Braam在NASD項(xiàng)目研究工作,其優(yōu)勢(shì)在于其可擴(kuò)展性和可靠性,同時(shí)可滿足大規(guī)模并行集群存儲(chǔ)系統(tǒng)上的I/O需求。Intel去年收購(gòu)了超級(jí)計(jì)算機(jī)集群解決方案文件系統(tǒng)Lustre的母公司W(wǎng)hamcloud。

“之前,在商業(yè)計(jì)算領(lǐng)域很少采用Lustre,因?yàn)樗且粋€(gè)開源軟件,在技術(shù)支持和體系架構(gòu)方面都不是很好,英特爾推出的企業(yè)版Lustre針對(duì)英特爾平臺(tái)進(jìn)行優(yōu)化和打包,同時(shí)為客戶提供定制化的服務(wù),從而保證商業(yè)計(jì)算的可靠性和性能要求”,張振宇這樣談道。

Knights Landing針對(duì)應(yīng)用特征設(shè)計(jì)的兩種“造型”

據(jù)介紹,下一代英特爾至強(qiáng)融核處理器Knights Landing將采用14納米制程技術(shù),非常值得一提的是,Knights Landing有兩種設(shè)計(jì)選擇,既可以插在CPU插槽上,也可以放在PCIe插槽上。這樣設(shè)計(jì)的初衷就是充分考慮應(yīng)用特征,張振宇表示,“有一小部分應(yīng)用是百分之百高度并行的,這類應(yīng)用可以很好地在眾核上運(yùn)行,不需CPU做串行計(jì)算再把計(jì)算結(jié)果交過(guò)來(lái),不需要協(xié)調(diào)的工作,針對(duì)這一類應(yīng)用,可以把Knights Landing直接做成處理器,把Knights Landing當(dāng)Cluster來(lái)跑這類應(yīng)用,性能會(huì)非常好”。

分享到

tangrong

相關(guān)推薦