英特爾數(shù)據(jù)中心事業(yè)部亞太和中國(guó)區(qū)高性能計(jì)算/工作站方案架構(gòu)師何萬青博士

借著對(duì)新公布的全球高性能計(jì)算TOP500榜單的分析,何萬青博士介紹了英特爾在高性能計(jì)算領(lǐng)域的投資,以及英特爾中國(guó)團(tuán)隊(duì)在高性能領(lǐng)域的工作。

TOP500:英特爾優(yōu)勢(shì)繼續(xù)擴(kuò)大

根據(jù)最新公布的全球高性能計(jì)算機(jī)500強(qiáng)排行榜,英特爾繼續(xù)遙遙領(lǐng)先。在本屆榜單中,有74%的上榜系統(tǒng)采用英特爾架構(gòu),同時(shí)新晉榜單的系統(tǒng)中有78%是基于英特爾架構(gòu)。這意味著英特爾的份額有望進(jìn)一步擴(kuò)大。

各架構(gòu)在TOP500中的應(yīng)用情況

與此同時(shí),即使是剛剛發(fā)布的英特爾至強(qiáng)E5處理器,已經(jīng)有45套基于至強(qiáng)E5的系統(tǒng)進(jìn)入TOP500,這其中包括了3套擁有每秒千萬億浮點(diǎn)計(jì)算能力的系統(tǒng)。位于萊布尼茨超級(jí)計(jì)算中心(LRZ)的“SuperMUC”是其中最大的高性能計(jì)算機(jī),具備每秒2900萬億次浮點(diǎn)計(jì)算能力(2.9 Petaflops),是歐洲計(jì)算能力最強(qiáng)的高性能計(jì)算機(jī),也是基于x86架構(gòu)的計(jì)算能力最強(qiáng)勁的高性能計(jì)算機(jī)。

何萬青表示,至強(qiáng)E5相比至強(qiáng)5600,性能提升高達(dá)80%,而在某些特定狀態(tài)下,能夠?qū)崿F(xiàn)比前代產(chǎn)品節(jié)能達(dá)50%。這對(duì)于日漸追求能耗產(chǎn)出比的高性能計(jì)算用戶具有很強(qiáng)的吸引力。而伴隨著至強(qiáng)E5-2600和E5-4600的相繼到位,下半年會(huì)有更多的基于至強(qiáng)E5的系統(tǒng)上榜。

至強(qiáng)融核:百億億次更近一步

即將于2012年年底問世的英特爾眾核(MIC)處理器引起了業(yè)內(nèi)的強(qiáng)烈關(guān)注。在前不久舉行的國(guó)際超級(jí)計(jì)算大會(huì)上,英特爾公司宣布未來所有基于英特爾集成眾核架構(gòu)(英特爾MIC 架構(gòu))的產(chǎn)品將采用全新品牌——英特爾至強(qiáng)融核。

英特爾一直將至強(qiáng)融核譽(yù)為通往百億億次超級(jí)計(jì)算機(jī)的“捷徑”,從目前英特爾公布的技術(shù)細(xì)節(jié)以及英特爾做的樣機(jī)來看應(yīng)該能擔(dān)此重任。

英特爾能源及高吞吐計(jì)算團(tuán)隊(duì)高級(jí)主管工程師菲利浦?蒂埃里博士

英特爾能源及高吞吐計(jì)算團(tuán)隊(duì)高級(jí)主管工程師菲利浦?蒂埃里博士介紹,英特爾至強(qiáng)融核協(xié)處理器將采用22 納米3-D三柵極晶體管制程技術(shù),可在 PCI-e 插卡形態(tài)下集成超過50顆內(nèi)核和支持最低8GB容量的GDDR5 內(nèi)存。此外,它還具備支持512b SIMD 指令的特點(diǎn),可在單個(gè)指令控制下同時(shí)處理多個(gè)數(shù)據(jù)元素,從而能顯著提升性能。

在去年使用DGEMM進(jìn)行的協(xié)處理器現(xiàn)場(chǎng)演示中,英特爾進(jìn)行了使用單顆“Knights Corner”協(xié)處理器提供超過1TeraFLOPs(每秒1萬億次浮點(diǎn)計(jì)算)雙精度實(shí)際性能的展示。而在2012年國(guó)際超級(jí)計(jì)算大會(huì)上,英特爾使用行業(yè)基準(zhǔn)測(cè)試工具Linpack (Rmax)展示了同樣超過1 TeraFLOPs 的性能。

英特爾至強(qiáng)融核處理器

英特爾還宣布首個(gè)基于英特爾至強(qiáng)融核協(xié)處理器的集群已經(jīng)投入使用,并在本屆高性能計(jì)算機(jī)500強(qiáng)榜單上位列第150位,其具備了每秒118萬億次浮點(diǎn)計(jì)算的性能。

在國(guó)內(nèi),英特爾已經(jīng)將“Knights Corner”提供給一些用戶測(cè)試和試用。同時(shí),浪潮、曙光、超云等系統(tǒng)廠商已經(jīng)和英特爾至強(qiáng)融核展開前期的合作。

為實(shí)現(xiàn)到2018年達(dá)到百億億級(jí)計(jì)算目標(biāo)的承諾,英特爾還在多個(gè)領(lǐng)域進(jìn)行了大量投資。英特爾最近就收購(gòu)了Qlogic的Infiniband業(yè)務(wù)和Cray的互連技術(shù),以進(jìn)一步開拓創(chuàng)新,消除在未來提供可擴(kuò)展的百億億次級(jí)計(jì)算平臺(tái)所面臨的障礙。

HPC:生態(tài)鏈更加成熟

除了提供更高性能、更低功耗的處理器以及固態(tài)硬盤、高速互聯(lián)技術(shù)外,英特爾還提供了適用于多種操作系統(tǒng)的軟件開發(fā)工具套件——Parallel Studio XE和Cluster Studio XE。兩款產(chǎn)品都融合了英特爾C/C++和Fortran編譯器,支持最新的至強(qiáng)E5處理器、性能與并行庫(kù),以及正確性分析器和性能檔案器,以便最大程度實(shí)現(xiàn)應(yīng)用程序性能、代碼質(zhì)量和可靠性。

菲利浦?蒂埃里專門介紹了英特爾Cluster Studio XE,它為英特爾架構(gòu)(IA)集群上的分布式并行計(jì)算設(shè)定了新標(biāo)準(zhǔn)。這種高級(jí)工具套件具有很高的靈活性,在IA-32和英特爾64位架構(gòu)的基礎(chǔ)上,使基于MPI的應(yīng)用程序性能適用于高度并行、共享內(nèi)存的集群系統(tǒng)。英特爾Cluster Studio XE可輕松編碼、調(diào)試并優(yōu)化基于MPI的集群應(yīng)用程序,以便獲得高至PFLOP級(jí)的性能。

為了支持中國(guó)高性能計(jì)算的發(fā)展,英特爾還和浪潮建立了聯(lián)合實(shí)驗(yàn)室,加大在生命科學(xué)、石油等領(lǐng)域的研發(fā)。此外,英特爾還積極推進(jìn)英特爾真實(shí)應(yīng)用負(fù)載計(jì)劃和“Cluster Ready”計(jì)劃。

其中,“Cluster Ready”計(jì)劃是對(duì)許多硬件廠商和軟件廠商的產(chǎn)品進(jìn)行兼容性認(rèn)證,讓用戶在搭建集群方面不用在選型方面費(fèi)心思。英特爾“Cluster Ready”可以幫助用戶在采購(gòu)和使用新平臺(tái)時(shí)更加簡(jiǎn)單。用戶只要選購(gòu)經(jīng)過英特爾 Cluster Ready認(rèn)證的應(yīng)用軟件和集群系統(tǒng),就可以確保硬件平臺(tái)和軟件應(yīng)用之間的互操作性,獲得性能提升和穩(wěn)定可靠的平臺(tái)。

何萬青博士透露,目前英特爾和浪潮、聯(lián)想在“Cluster Ready”計(jì)劃方面合作很深,聯(lián)想已經(jīng)有20多套系統(tǒng)通過了驗(yàn)證。而在真實(shí)應(yīng)用負(fù)載計(jì)劃中,英特爾目前主攻16個(gè)節(jié)點(diǎn)的至強(qiáng)E5集群,已經(jīng)在一些科研院校進(jìn)行實(shí)際測(cè)試。

總體而言,在英特爾的大力支持和推動(dòng)下,中國(guó)高性能計(jì)算的生態(tài)鏈正在日臻完善。而一年一度的英特爾高性能計(jì)算研討會(huì),又將是國(guó)內(nèi)高性能計(jì)算研究和使用者的一場(chǎng)盛會(huì)。

分享到

xuzhenxin

相關(guān)推薦