全球高效能計算市場中有國內(nèi)外眾多領(lǐng)先的廠商,很大比例的高效能計算都是由領(lǐng)先的英特爾處理器提供源動力。TOP500全球高效能計算排行榜是全球最權(quán)威的高效能計算應(yīng)用情況統(tǒng)計表,根據(jù)其2008年6月18日新鮮出爐的榜單數(shù)據(jù)顯示,基于英特爾處理器的上榜高效能計算系統(tǒng)共有375臺,占全球前500名單總數(shù)的75.00%,相比前一期榜單中70.08%的份額有進(jìn)一步提升。而此次中國地區(qū)上榜的12臺高效能計算系統(tǒng)中的11臺系統(tǒng)均基于英特爾處理器構(gòu)建。
處理器 |
前期上榜系統(tǒng)數(shù)量 |
本期上榜系統(tǒng)數(shù)量 |
系統(tǒng)數(shù)量 所占比例 |
Rmax合計 (每秒萬億次浮點運(yùn)算) |
Rpeak合計 (每秒萬億次浮點運(yùn)算) |
處理器 數(shù)量合計 |
英特爾 |
354 |
375 |
75.00% |
5918584 |
9714666 |
950114 |
IBM Power |
61 |
68 |
13.60% |
3863219 |
5034406 |
1041652 |
AMD |
79 |
55 |
11.00% |
1867398 |
2646183 |
417175 |
其他 |
6 |
2 |
0.40% |
50815 |
59293 |
6134 |
總計 |
500 |
500 |
100.00% |
11700015.87 |
17454547.7 |
2415075 |
2008年6月TOP500全球高效能計算排行榜處理器架構(gòu)分析
處理器:高效能計算的核心動力
英特爾能得到高效能計算客戶的廣泛認(rèn)同,關(guān)鍵在于英特爾有成熟完備的高效能計算解決方案,并能不斷滿足高效能計算客戶對高效能計算系統(tǒng)提出的越來越高的需求。
英特爾架構(gòu)處理器為有強(qiáng)大性能表現(xiàn)的高效能計算節(jié)點服務(wù)器提供源動力,能針對高效能計算的需求,高效率的進(jìn)行大規(guī)模并行計算,同時具有節(jié)能環(huán)保的特點:
多核技術(shù)推動性能飛躍
繼2006年英特爾首發(fā)四核處理器后,其強(qiáng)大的性能吸引了越來越多客戶的青睞。此次TOP500榜單顯示,基于四核處理器的高效能計算系統(tǒng)已經(jīng)占據(jù)市場主流,全部500臺系統(tǒng)中基于四核處理器的達(dá)到283臺。其中,共有257臺高效能計算系統(tǒng)采用了四核英特爾®至強(qiáng)®處理器(包括至強(qiáng)®5300系列處理器、雙至強(qiáng)®5400系列處理器以及至強(qiáng)®7300系列處理器),占全部四核處理器系統(tǒng)總數(shù)的90.81%,占全部系統(tǒng)的51.40%。
值得注意的是,四核英特爾®至強(qiáng)®處理器在高效能計算系統(tǒng)中的廣泛應(yīng)用大大推動了TOP500上榜系統(tǒng)整體性能的提高。舉例來看,本次榜單中排名最后的系統(tǒng)的性能在僅僅六個月前的榜單中可名列第200名。
領(lǐng)先技術(shù)全面提升系統(tǒng)能效
能耗與散熱是IT數(shù)據(jù)中心一直試圖妥善解決的難題,最新一期TOP500榜單中首次引入能效指標(biāo)也足以說明能耗問題對于高效能系統(tǒng)構(gòu)建的重要程度。
英特爾架構(gòu)處理器為滿足高效能計算的節(jié)能環(huán)保需求,同時為客戶提供多種熱設(shè)計功耗,以滿足高效能計算所需的高密度部署。英特爾領(lǐng)先的45納米處理器制程技術(shù)可以大大提高單個處理器的能效,此次TOP500榜單上,基于45納米制程的英特爾®至強(qiáng)®5400系列處理器取得x86架構(gòu)能效表現(xiàn)前三名,其它基于該處理器構(gòu)建的系統(tǒng)在能效問題上也有著不俗的表現(xiàn)。
在進(jìn)行集群能效管理方面,英特爾新一代至強(qiáng)處理器都將支持按需切換技術(shù)(Demand Based Switching ,DBS),該技術(shù)可以根據(jù)系統(tǒng)任務(wù)的負(fù)荷程度,動態(tài)調(diào)整處理器主頻,在需要高效率處理數(shù)據(jù)時讓CPU全速工作,而在處理簡單任務(wù)時,則選擇降低工作頻率,有效地減少了處理器空閑時的功耗。根據(jù)Intel公布的測試數(shù)據(jù),采用DBS技術(shù)可以平均節(jié)約能耗28%以上。功耗的降低大大減輕了IT數(shù)據(jù)中心的能耗與散熱壓力。
軟件調(diào)優(yōu):高效能計算的制勝法寶
英特爾®軟件產(chǎn)品是一整套幫助應(yīng)用開發(fā)及使用人員在X86及安騰體系架構(gòu)上最大程度提升性能的軟件工具。這些工具與目前市場主流的高效能計算軟硬件運(yùn)行環(huán)境兼容,使用人員很容易將這些工具與他們現(xiàn)有的軟件工具配合使用。英特爾高效能軟件產(chǎn)品由一組完整的工具產(chǎn)品組成,包括高效能編譯器,VTuneTM 可視化性能分析器,高性能函數(shù)庫,多線程工具和應(yīng)用于高效能計算的集群工具及工具包等等。這些軟件產(chǎn)品能幫助用戶通過調(diào)優(yōu)中間件和應(yīng)用軟件,最大限度發(fā)揮系統(tǒng)的性能。目前,英特爾®軟件產(chǎn)品已被越來越多地成功使用在全球很多知名的軟件公司、高效能計算中心及實驗室內(nèi),并且發(fā)揮著越來越重要的作用。
最新TOP500榜單中排名第一的勝利油田,采用的是2.33GHz英特爾®至強(qiáng)®雙核處理器,具有960個節(jié)點,共4096顆處理器,其實測LINPACK峰值高達(dá)18.60萬億次浮點運(yùn)算。這一成績的取得不僅依靠強(qiáng)大的硬件支持,軟件調(diào)優(yōu)更是功不可沒。該系統(tǒng)在調(diào)優(yōu)過程中采用了英特爾公司提供的兩個軟件: Intel Compilers(編譯器)和Intel VTune Analyzers。該系統(tǒng)在建立伊始,其16個集群節(jié)點的效能只有66%,僅僅達(dá)到了0.39萬億次/每秒的水平。技術(shù)人員在采用Intel VTune Analyzers調(diào)優(yōu)工具的分析后,發(fā)現(xiàn)系統(tǒng)在交換機(jī)方面存在瓶頸,通過與網(wǎng)絡(luò)廠商技術(shù)人員分析行和調(diào)整,系統(tǒng)的性能提升到9.28萬億次/每秒(1000個節(jié)點)。此后,該系統(tǒng)采用MPI+OpenMP的混合應(yīng)用架構(gòu),進(jìn)一步將性能提升至12.2萬億次/每秒的。最后又通過移除掉緩慢交換節(jié)點,以及反復(fù)平衡每一個節(jié)點性能后,才最終達(dá)到了目前的18.6萬億次/每秒的水平。
從需求出發(fā),設(shè)計完美高效能計算系統(tǒng)
用戶在選擇高效能集群時,通常首先關(guān)注的是性能指標(biāo)。而在每臺高效能集群系統(tǒng)最初設(shè)計的建議多是綜合了目前應(yīng)用實測結(jié)果,以及專家的經(jīng)驗給出的。通常情況下,由于實際測試需要的設(shè)備和工作量太大,所以用戶大多是從已有平臺的測試結(jié)果定性的推測未來平臺的性能。如此進(jìn)行高效能計算系統(tǒng)的設(shè)計會與實際情況有一定的偏差。
為了更好的分析現(xiàn)有系統(tǒng)及預(yù)測未來應(yīng)用所需硬件平臺的實際性能,英特爾提供了全面的工具以實現(xiàn)對應(yīng)用軟件的計算、通信和數(shù)據(jù)存儲等多方面進(jìn)行精細(xì)化的特征分析,并分析高效能集群系統(tǒng)的硬件系統(tǒng)特征,再將數(shù)據(jù)組合起來,以建立性能模型,再通過性能模型模擬并預(yù)測應(yīng)用軟件在未來硬件平臺上的實際性能。采用這些分析工具,可以大大提高用戶設(shè)計未來高效能集群系統(tǒng)的準(zhǔn)確度。
與產(chǎn)業(yè)精誠合作,助力中國高效能計算發(fā)展
英特爾擁抱開放標(biāo)準(zhǔn),與業(yè)界眾多合作伙伴為用戶提供整體的解決方案,并分享成功實踐經(jīng)驗。
英特爾成立40周年,以及進(jìn)入中國23年以來,一直不斷致力于創(chuàng)新,與國內(nèi)外高效能計算廠商一道,為中國高效能用戶提供領(lǐng)先的高效能計算解決方案和行業(yè)實踐經(jīng)驗,幫助其提升核心競爭力,從而在未來的發(fā)展中走在世界前列。