2012年11月13日于北京,英特爾正式發(fā)布了全新的至強融核(Xeon Phi)協(xié)處理器。此次發(fā)布的至強融核協(xié)處理器包括3100系列和5110P兩款。在北京的發(fā)布會上,來自英特爾中國有限公司服務(wù)器平臺產(chǎn)品經(jīng)理張振宇先生,和大家分享了這兩款至強融核協(xié)處理器的規(guī)格細節(jié)。

挑戰(zhàn)計算極限 至強融核或?qū)⒍x未來

英特爾中國有限公司服務(wù)器平臺產(chǎn)品經(jīng)理 張振宇

張振宇表示,從2011到2016年,高性能計算市場的年復(fù)合增長率將達到20%,在能源、生命科學(xué)、影音娛樂、國家安全等方面,對計算的需求都日漸增加。HPC不僅是重要的研究手段,同時也是國家體現(xiàn)出整體實力的重要標準。而英特爾新產(chǎn)品的發(fā)布,也是出于希望客戶在購買解決方案的同時,降低成本、提高效率,同時為未來成長保留擴展空間的目的。

挑戰(zhàn)計算極限 至強融核或?qū)⒍x未來

HPC推動數(shù)據(jù)中心快速成長

至強E5榮登TOP500 至強融核震撼現(xiàn)身

目前至強E5已經(jīng)成為服務(wù)器市場上應(yīng)用最廣泛的處理器。而至強E5和融核的搭配,可以應(yīng)用于更多行業(yè)中復(fù)雜的并行計算應(yīng)用。這款開發(fā)歷時8年的協(xié)處理器產(chǎn)品是英特爾一個巨大的創(chuàng)新,同時也標志著英特爾和基數(shù)計算新時代的到來。至強融核延伸了英特爾至強品牌,支持高度并行化應(yīng)用。

挑戰(zhàn)計算極限 至強融核或?qū)⒍x未來

英特爾眾核架構(gòu)發(fā)展歷程概覽

至強融核可以用于為英特爾至強進行優(yōu)化的軟件環(huán)境之中,在應(yīng)用移植方面,英特爾至強融核和英特爾至強使用相同的編程語言、指令、庫和工具,與傳統(tǒng)的加速器不同,至強融核在硬件特定編碼、異構(gòu)TCO方面更有優(yōu)勢,為軟件開發(fā)商和用戶提供應(yīng)用代碼的共享,減少人力物力成本。

英特爾至強融核協(xié)處理器基于英特爾集成眾核(英特爾MIC)架構(gòu),可作為現(xiàn)有英特爾至強處理器E5-2600/4600產(chǎn)品家族的補充,為高度并行化的應(yīng)用提供無與倫比的性能。

此次推出的至強融核協(xié)處理器3100系列和5110p兩大家族,基于其最先進的22納米3-D三柵極晶體管制程工藝生產(chǎn)。

挑戰(zhàn)計算極限 至強融核或?qū)⒍x未來

綜合基準測試摘要(圖片來自Intel)

英特爾至強融核3100產(chǎn)品家族能夠提供超過1000 Gigaflops(即每秒1萬億次浮點計算)的雙精度浮點計算性能,并支持容量最高達6GB、帶寬最高達240GB/秒的內(nèi)存,以及內(nèi)存錯誤校正碼(ECC)等一系列可靠性特性。該產(chǎn)品家族工作時的熱設(shè)計功耗(TDP)范圍在300瓦以內(nèi)。至強融核3100系列產(chǎn)品,包含3100A和3100T(前者內(nèi)置風(fēng)扇主動式散熱,后者使用系統(tǒng)風(fēng)扇被動式散熱)。

挑戰(zhàn)計算極限 至強融核或?qū)⒍x未來

至強融核3100系列規(guī)格

至強融核協(xié)處理器5110P則能以更低的功耗提供額外的性能。該芯片配置60個內(nèi)核,主頻速度為1.05GHz。它能夠?qū)崿F(xiàn)1011 Gigaflops(即每秒1.01萬億次浮點計算)的雙精度浮點計算性能。它可支持容量和帶寬分別高達8GB和320GB/秒的GDDR5內(nèi)存,熱設(shè)計功耗(TDP)為225瓦。這種芯片類似圖形卡,能夠插入到一個PCI-Express 2.0插槽中,并借助系統(tǒng)風(fēng)扇進行散熱冷卻(被動式散熱,本身不含風(fēng)扇)。

挑戰(zhàn)計算極限 至強融核或?qū)⒍x未來

至強融核5110P規(guī)格

至強融核能夠滿足運行計算密集型工作負載(如生命科學(xué)應(yīng)用和金融模擬)的客戶需求,而5110P則可用于處理諸如數(shù)字內(nèi)容創(chuàng)建和能源研究等內(nèi)存密集型工作負載。值得一提的是,至強融核5110P已經(jīng)交付給一些早期用戶,并出現(xiàn)在了最新發(fā)布的第40屆全球高性能計算機500強(TOP500)排行榜的上榜系統(tǒng)中。

挑戰(zhàn)計算極限 至強融核或?qū)⒍x未來

至強融核3100系列和5110P

為了讓諸如德克薩斯高級計算中心(TACC)等客戶早日使用全新的英特爾至強融核協(xié)處理器技術(shù),英特爾還提供了兩款定制化的產(chǎn)品:英特爾至強融核協(xié)處理器SE10X和英特爾至強融核SE10P。兩者均可在熱設(shè)計功耗為300瓦的情況下提供1073 GFlops的雙精度浮點計算性能,其余規(guī)格則與英特爾至強融核協(xié)處理器5110P相似。關(guān)于TACC采用至強融核的更多信息,我們會在下一頁進行詳細介紹。

挑戰(zhàn)計算極限 至強融核將定義未來[圖]

至強融核晶圓

英特爾至強融核協(xié)處理器5110P已于今天開始出貨,并將于2013年1月28日以2649美元的建議銷售價格正式面市。英特爾至強融核協(xié)處理器3100產(chǎn)品家族將于 2013年上半年面市,其建議銷售價格將在2000美元以下。

英特爾還提供了兩款定制化的產(chǎn)品:英特爾至強融核協(xié)處理器SE10X 和英特爾至強融核SE10P。兩者均可在熱設(shè)計功耗為300瓦的情況下提供1073 GFlops的雙精度浮點計算性能,其余規(guī)格則與英特爾至強融核協(xié)處理器5110P相似。這些芯片專門用于德克薩斯高級計算中心(Texas Advanced Computing Center,簡稱TACC)的Stampede超級計算機,并不會商業(yè)性上市銷售。

挑戰(zhàn)計算極限 至強融核將定義未來[圖]

Stampede超級計算機

Stampede超級計算機中至強融核,是通過在PCIe riser卡中進行安裝并放入到戴爾PowerEdge C8220X“Zeus”計算節(jié)點中,每個節(jié)點包括2個至強E5-2680處理器和32GB系統(tǒng)內(nèi)存,如下同所示:

挑戰(zhàn)計算極限 至強融核或?qū)⒍x未來

PowerEdge C8220X “Zeus”計算節(jié)點

后面的mezzanine card是為InfiniBand而特定設(shè)計的。雙LGA2011插槽上面由被動式散熱片所覆蓋,并且每個插槽對應(yīng)4個DIMM。在右側(cè),可以看到一個2.5英寸的存儲設(shè)備。Stampede使用的是傳統(tǒng)硬盤,并未設(shè)立Hadoop集群,其專注的是高超的計算性能。

挑戰(zhàn)計算極限 至強融核或?qū)⒍x未來

節(jié)點中的藍色光芒,意味著至強融核被順利安裝并正常工作

挑戰(zhàn)計算極限 至強融核將定義未來[圖]

Stampede數(shù)據(jù)存儲

Stampede各個節(jié)點都采用了2.5英寸硬盤,因此在容量上并不能滿足如此規(guī)模的超級計算機對數(shù)據(jù)的存儲需求。為此,專有的存儲節(jié)點也就隨之而生。

挑戰(zhàn)計算極限 至強融核將定義未來[圖]

支持熱插拔的驅(qū)動器倉

接下來,我們繼續(xù)看看至強融核協(xié)處理器。至強融核協(xié)處理器能夠充分利用為英特爾架構(gòu)提供的人們熟知的編程語言、并行模式、技術(shù)和開發(fā)人員工具,這有助于確保軟件公司和企業(yè)的IT部門加大對并行代碼的利用,且無需為與加速器相關(guān)的專有的、針對硬件的特定編程模式重新培訓(xùn)其開發(fā)人員。

挑戰(zhàn)計算極限 至強融核將定義未來[圖]

至強融核協(xié)處理器側(cè)面

挑戰(zhàn)計算極限 至強融核將定義未來[圖]

至強融核協(xié)處理器插槽部分

英特爾正在提供包括今天發(fā)布的英特爾 Parallel Studio XE和英特爾 Cluster Studio XE在內(nèi)的軟件工具,來幫助科學(xué)家和工程師們優(yōu)化其代碼,以便充分利用英特爾 至強融核 協(xié)處理器。這些工具能夠通過英特爾 至強融核 協(xié)處理器和英特爾 至強 處理器E5產(chǎn)品家族共用的編程語言和模型對代碼進行優(yōu)化,從而使應(yīng)用不但能從英特爾 至強融核 協(xié)處理器的數(shù)十個內(nèi)核中獲益,亦可從英特爾 至強 處理器E5更為高效的多線程資源利用上獲得幫助。

挑戰(zhàn)計算極限 至強融核將定義未來[圖]

即將安裝放入Stampede超級計算機的至強融核協(xié)處理器

在最新發(fā)布的第40屆全球高性能計算機500強(TOP500)排行榜上,不僅有超過75%(379套)的系統(tǒng)采用了英特爾至強處理器,今年11月發(fā)布的榜單還新增了7套基于英特爾至強融核協(xié)處理器的上榜系統(tǒng),其中包括:

TACC首次部署的Stampede系統(tǒng)(每秒2.66千萬億次浮點計算,在榜上排名第7)、美國國家航空航天局(NASA)氣候模擬中心的 Discover系統(tǒng)(每秒417萬億次浮點計算,排名第52)、英特爾公司的Endeavour系統(tǒng)(每秒379萬億次浮點計算,排名第57)、俄羅斯科學(xué)院聯(lián)合超級計算中心的MVS-10P超級計算機(每秒375萬億次浮點計算,排名第58)、美國國家航空航天局(NASA)Ames研究中心的 Maia系統(tǒng)(每秒212萬億次浮點計算,排名第117)、南烏拉爾國立大學(xué)的SUSU系統(tǒng)(每秒146萬億次浮點計算,排名第170)以及田納西大學(xué)國家計算科學(xué)研究所的Beacon系統(tǒng)(每秒110萬億次浮點計算,排名第253)。

目前,有包括華碩、宏碁、Cray、戴爾、富士通、惠普、IBM、浪潮、NEC、SGI等超過50家制造商,正在采納基于英特爾至強融核協(xié)處理器的設(shè)計解決方案。

英特爾正在借助至強融核協(xié)處理器,在x86領(lǐng)域開辟出高度并行的計算市場,由于至強融核可以脫離至強單獨運行,而且也支持Linux內(nèi)核。也許在不遠的將來,至強融核將會擔當起更多的計算重任,不僅僅在并行計算領(lǐng)域,在整個企業(yè)計算中,至強融核或?qū)⒍x未來計算新格局。

分享到

zhaohang

相關(guān)推薦