英特爾(中國)有限公司服務(wù)器平臺(tái)產(chǎn)品經(jīng)理張振宇

令人驚嘆的是,盡管英特爾至強(qiáng)E5處理器問世才3個(gè)月,但本次TOP500中已有多達(dá)45套基于E5處理器的系統(tǒng)入榜,其中包括3套擁有每秒千萬億次浮點(diǎn)計(jì)算能力的系統(tǒng)。

此外,英特爾還在國際超級計(jì)算大會(huì)上宣布未來所有基于英特爾集成眾核架構(gòu)(英特爾MIC 架構(gòu))的產(chǎn)品將采用全新品牌——英特爾至強(qiáng)融核(Intel Xeon Phi)。英特爾(中國)有限公司服務(wù)器平臺(tái)產(chǎn)品經(jīng)理張振宇透露,第一代英特爾至強(qiáng)融核產(chǎn)品家族(代號為“Knights Corner”的協(xié)處理器)將于 2012 年年底推出,屆時(shí)它將成為英特爾至強(qiáng)處理器E5-2600/4600產(chǎn)品家族的重要補(bǔ)充,并為高度并行的工作負(fù)載帶來全新性能。

至強(qiáng)E5為高性能計(jì)算而生

英特爾至強(qiáng)E5在本屆TOP500中的表現(xiàn),除了45套系統(tǒng)入圍外,更是奪得了第四名的佳績。

位于德國萊布尼茨超級計(jì)算中心(LRZ)的“SuperMUC”,達(dá)到每秒2900萬億次浮點(diǎn)計(jì)算的的計(jì)算能力,是當(dāng)前歐洲計(jì)算能力最強(qiáng)的高性能計(jì)算機(jī),也是目前基于英特爾至強(qiáng)處理器E5產(chǎn)品家族的最大的高性能計(jì)算機(jī),在本屆榜單上排名第四。

回首全球高性能計(jì)算機(jī)的發(fā)展之路,1997年當(dāng)時(shí)最快的計(jì)算機(jī)叫“ASCI RED”,其運(yùn)行速度僅為1TFLOP,當(dāng)時(shí)一個(gè)放20臺(tái)2路服務(wù)器的機(jī)柜,其典型的計(jì)算能力是0.5GFLOP。到2012年6月,最快的IBM的“紅杉”達(dá)到了16PFLOP。目前,一個(gè)20千瓦標(biāo)準(zhǔn)機(jī)柜能提供高達(dá)5TFLOP的計(jì)算能力。而到2018年,業(yè)內(nèi)最快的計(jì)算機(jī)將達(dá)到百億億次級別,屆時(shí)一個(gè)20千瓦標(biāo)準(zhǔn)機(jī)柜就能提供0.5到1PFLOP的計(jì)算能力。“在1997年我們需要用16萬個(gè)標(biāo)準(zhǔn)機(jī)柜才能達(dá)到80TFLOP的計(jì)算能力,現(xiàn)在用至強(qiáng)處理器的服務(wù)器僅需16個(gè)機(jī)柜就能實(shí)現(xiàn)了。”張振宇說,“處理器以及相關(guān)技術(shù)的發(fā)展,使得人類的計(jì)算能力日新月異。”

作為高性能計(jì)算的上游和領(lǐng)導(dǎo)廠商,英特爾一直在致力于提供更快更高能效的高性能計(jì)算機(jī)。2012年3月,英特爾推出了至強(qiáng)E5-2600處理器,采用Sandy-Bridge架構(gòu)的英特爾至強(qiáng)E5更是為高性能計(jì)算增添了新的動(dòng)力。

首先,至強(qiáng)E5具有8個(gè)核心,相比上一代的至強(qiáng)5600多出兩個(gè)內(nèi)核,具備20MB L3緩存,平均每核心2.5MB,這比上一代的每核心2MB要多25%,核心和緩存的增強(qiáng)對計(jì)算能力的提升明顯。因而至強(qiáng)E5在性能上比上一代的至強(qiáng)5600有80%的性能提升。

英特爾至強(qiáng)融核標(biāo)識

其次,至強(qiáng)E5在帶寬方面采用了環(huán)形鏈路總線,提升了帶寬降低了延遲。在QPI總線上,至強(qiáng)E5具備兩條最高8GT/s的QPI,相比至強(qiáng)5600家族每條鏈接帶寬增加了25%;在內(nèi)存支持上,至強(qiáng)E5具有四個(gè)內(nèi)存通道,內(nèi)存規(guī)格支持也提升到了DDR3-1600,而至強(qiáng)5600最高支持DDR3-1333。從這些規(guī)格來看,E5在數(shù)據(jù)帶寬上要明顯領(lǐng)先于至強(qiáng)5600,更加適合HPC苛求高帶寬的應(yīng)用。

第三,至強(qiáng)E5還引入了專門針對HPC應(yīng)用的AVX高級向量擴(kuò)展指令集,來加強(qiáng)浮點(diǎn)運(yùn)算性能。AVX指令集將現(xiàn)存的浮點(diǎn)向量指令從128位擴(kuò)展到256位,這種改進(jìn)可以讓每核每時(shí)鐘浮點(diǎn)運(yùn)算峰值翻倍。英特爾認(rèn)為,AVX技術(shù)是加大計(jì)算密度的起點(diǎn)。

此外,英特爾還發(fā)布了至強(qiáng)E5-4600,這是針對緊湊型4路服務(wù)器的新平臺(tái)。至強(qiáng)E5-4600能在單個(gè)系統(tǒng)中最多可提供32個(gè)內(nèi)核和48個(gè)DIMM,適用于諸如科學(xué)研究和金融服務(wù)等各種廣泛的技術(shù)計(jì)算應(yīng)用,適合做大規(guī)模集群的“胖”節(jié)點(diǎn)使用。

眾核進(jìn)入倒計(jì)時(shí)

英特爾在高性能計(jì)算的另一利器——集成眾核架構(gòu)(MIC)處理器亦將進(jìn)入倒計(jì)時(shí)。在國際超級計(jì)算大會(huì)上, 英特爾公司宣布未來所有集成眾核架構(gòu)產(chǎn)品將采用全新品牌——英特爾至強(qiáng)融核。同時(shí)第一代英特爾至強(qiáng)融核產(chǎn)品家族(代號為“ Knights Corner”的協(xié)處理器)將于 2012 年年底推出,屆時(shí)它將成為英特爾至強(qiáng)處理器 E5-2600/4600 產(chǎn)品家族的重要補(bǔ)充,并為高度并行的工作負(fù)載帶來全新性能。英特爾(中國)有限公司服務(wù)器平臺(tái)產(chǎn)品經(jīng)理張振宇透露,至強(qiáng)融核第一代產(chǎn)品將主要用于高性能計(jì)算( HPC)市場,而未來的英特爾至強(qiáng)融核產(chǎn)品還將滿足企業(yè)數(shù)據(jù)中心和工作站的需求。

為了加深用戶對至強(qiáng)融核系統(tǒng)的了解和認(rèn)知,英特爾還搭建了首個(gè)基于至強(qiáng)融核協(xié)處理器的集群并投入了使用,該系統(tǒng)目前在本屆TOP500榜單上位列第150位,它具備了每秒118萬億次浮點(diǎn)計(jì)算的性能。

張振宇介紹,至強(qiáng)融核處理器具備出色的易用性,能夠充分利用在英特爾架構(gòu)上使用的常見編程模式、技術(shù)和開發(fā)者工具。由于它能夠更充分地利用并行 CPU 代碼,軟件公司和 IT 部門將無需重新為其開發(fā)人員提供與加速器有關(guān)的專用編程模型的培訓(xùn)。除了兼容 x86 編程模式外,英特爾至強(qiáng)融核協(xié)處理器還能夠適用于專為高性能計(jì)算優(yōu)化且高度并行的獨(dú)立計(jì)算節(jié)點(diǎn)。它可以獨(dú)立于主機(jī)操作系統(tǒng)來運(yùn)行自己的基于Linux的操作系統(tǒng)。這一特性將可以為實(shí)施無法采用其它 GPU 技術(shù)的集群解決方案帶來更大的靈活性。

全球高性能計(jì)算對比

具體規(guī)格和技術(shù)細(xì)節(jié)方面,首個(gè)英特爾至強(qiáng)融核協(xié)處理器將采用22 納米3-D三柵極晶體管制程技術(shù),可在 PCI-e插卡形態(tài)下集成超過 50 顆內(nèi)核和支持最低 8GB容量的GDDR5 內(nèi)存。此外,它還具備支持512b SIMD 指令的特點(diǎn),可在單個(gè)指令控制下同時(shí)處理多個(gè)數(shù)據(jù)元素,從而能顯著提升性能。

從去年開始,英特爾還在全球范圍內(nèi)精心挑選了100家企業(yè)和科研單位,開始對“ Knights Corner”進(jìn)行測試和試用,其中中國的企業(yè)有6家,涵蓋了石油、互聯(lián)網(wǎng)等領(lǐng)域。英特爾工程師正幫助他們將應(yīng)用移植到MIC上,因而張振宇認(rèn)為,到今年年底有可能出現(xiàn)真正的集成眾核系統(tǒng)。

英特爾高性能計(jì)算三駕馬車

此外,英特爾至強(qiáng)融核協(xié)處理器還獲得了廣泛的行業(yè)支持,包括 Bull、Cray、戴爾、惠普、IBM、浪潮和NEC在內(nèi)的44家制造商已承諾將推出采用該款協(xié)處理器的系統(tǒng)。

向百億億次進(jìn)軍

英特爾在高性能計(jì)算領(lǐng)域的目標(biāo),就是到2018年向全球提供每秒浮點(diǎn)計(jì)算能力達(dá)百億億次的超級計(jì)算機(jī),為此英特爾正朝著這個(gè)目標(biāo)不斷努力。

張振宇表示,目前在推動(dòng)千萬億次向百億億次級的過程當(dāng)中,至強(qiáng)扮演著非常重要的角色,它本身是非常強(qiáng)大的平臺(tái),最重要是能夠適應(yīng)各種各樣的工作負(fù)載。但到百億億次的發(fā)展階段僅僅靠至強(qiáng)是不夠的。需要用眾核架構(gòu)來提供高度定型應(yīng)用的效率,提高計(jì)算效率。

各種架構(gòu)近年來在TOP500中的變化

張振宇透露,首個(gè)搭配采用英特爾至強(qiáng)E5處理器和至強(qiáng)融核協(xié)處理器的千萬億級(可實(shí)現(xiàn)每秒千萬億次浮點(diǎn)計(jì)算能力)的高性能計(jì)算機(jī)將于 2013 年年初推出,并將命名為“Stampede”。英特爾預(yù)計(jì)在英特爾至強(qiáng)融核協(xié)處理器的可編程性和卓越性能的支持下,明年還將會(huì)有大量千萬億級的系統(tǒng)涌現(xiàn)。

英特爾在高性能計(jì)算領(lǐng)域的優(yōu)勢

為了實(shí)現(xiàn)到2018年達(dá)到百億億級計(jì)算目標(biāo)的承諾,英特爾還在多個(gè)領(lǐng)域進(jìn)行了大量投資,旨在滿足未來對于龐大性能的需求。英特爾最近收購了Qlogic的Infiniband業(yè)務(wù)和Cray的互連技術(shù),以進(jìn)一步在此基礎(chǔ)上創(chuàng)新,消除在未來提供可擴(kuò)展的百億億次級計(jì)算平臺(tái)所面臨的障礙。

分享到

xuzhenxin

相關(guān)推薦