James Reinders談到,英特爾服務(wù)于兩類開發(fā)群體的兩條開發(fā)產(chǎn)品線分別面向獲取最大并行性能和獲取最大并行開發(fā)效率的用戶,而獲取最大并行開發(fā)效率的用戶,如在Windows平臺上開發(fā)VC++應(yīng)用的Intel Parallel Studio已經(jīng)進(jìn)行了Beta測試,預(yù)計(jì)在2009年上半年發(fā)布。

他應(yīng)用高性能計(jì)算快速特征分析,如Cycle統(tǒng)計(jì)、CPI值、內(nèi)存訪問、緩存效率、NUMA、SMT、IO粒度/延遲、MPI粒度/擴(kuò)展性等方面來評價(jià)HPC平臺,并以如下圖的性能特征雷達(dá)圖來綜合比較不同處理器對應(yīng)用的適用性。

在至強(qiáng)5500上,英特爾采用了SSE4.2,該新的指令集被嵌入在Nehalem何新忠,包括STTNI、ATA、POPCNT、CRC32等新特性。用以加速字符和文本處理器、加速搜索、加大在大型數(shù)據(jù)庫中搜索數(shù)據(jù)的速度,并支持了新的通信領(lǐng)域的指令。

英特爾智能加速、超線程及NUMA特性也是Nehalem平臺的優(yōu)異特性,打開NUMA開關(guān)之后,James表示可以提高大部分高性能計(jì)算的性能,而智能加速技術(shù)的Turbo開關(guān)可以提高CPU密集型(100%CPU使用率)高性能計(jì)算程序的性能。

下圖為典型數(shù)字氣象預(yù)報(bào)應(yīng)用特征(應(yīng)用雷達(dá)圖):

James在演講中同時(shí)談到了如何對MPI進(jìn)行性能調(diào)優(yōu)、根據(jù)應(yīng)用通信模式調(diào)整MPI拓?fù)洌ù至6日{(diào)優(yōu))、通過ITAC函數(shù)分析精確優(yōu)化MPI性能(細(xì)粒度調(diào)優(yōu))等調(diào)優(yōu)方法。

在萬兆以太網(wǎng)的優(yōu)勢部分,他談到,至強(qiáng)5500可擴(kuò)展支持多個(gè)萬兆以太網(wǎng)端口(10GbE),而新的英特爾82599萬兆網(wǎng)控制器芯片+至強(qiáng)5500能夠提供更低的總體成本,82599萬兆網(wǎng)控制器芯片提供了雙端口的全萬兆帶寬、I/O虛擬化、對FCoE的支持及iSCSI的硬件加速以及LAN主板集成設(shè)計(jì)。

James表示,英特爾的以太網(wǎng)技術(shù)支持iWARP技術(shù),NerEffect的iWARP技術(shù)為服務(wù)器集群保證了高吞吐、低延遲的以太網(wǎng)絡(luò)連接,他同時(shí)介紹了iWARP在石油行業(yè)應(yīng)用的優(yōu)勢。

在最后的總結(jié)中,他表示,至強(qiáng)5500的用戶需要充分考慮SSE4.2的向量優(yōu)化實(shí)現(xiàn)以優(yōu)化關(guān)鍵循環(huán)、而集群性能很大程度上取決于MPI優(yōu)化的粒度,并建議使用英特爾Cluster Tools進(jìn)行調(diào)優(yōu),同時(shí),萬兆以太網(wǎng)將推動HPC擴(kuò)展發(fā)展。

分享到

cuihao

相關(guān)推薦