清華大學(xué)陳文光教授同時還負責(zé)863高性能計算評測
陳文光表示,清華大學(xué)的高性能計算中心現(xiàn)在已經(jīng)有了一個較為清楚的測試設(shè)計思路:讓供應(yīng)商提供一個節(jié)點用以測試,該測試則僅針對處理和內(nèi)存速度,網(wǎng)絡(luò)和存儲等指標(biāo)則由其他方法進行輔助確定。同時,該測試必須是面向應(yīng)用的。
他表示,清華大學(xué)目前采用的測試方法至少可以在處理器和內(nèi)存的角度給出一個指導(dǎo)性的意見,得到適合的處理器和內(nèi)存。此外,網(wǎng)絡(luò)目前一般選取40Gbps的Infiniband,但全連接還是部分連接,則要看預(yù)算和應(yīng)用模式來確定。
第二個難點則是選取哪些應(yīng)用程序來進行測試,對此,陳文光認為5-10個應(yīng)用程序用來測試即可,“從邏輯上來說,每個學(xué)校的潛在用戶可能有幾十上百程序,選擇最重要的用戶進行測試,如清華就是氣象預(yù)報和氣象圖像,應(yīng)用個數(shù)不能太多,評測本身是有開銷的,從經(jīng)驗來說,5-10個應(yīng)用就能夠覆蓋學(xué)校應(yīng)用測試。測試的規(guī)模要縮小到一個節(jié)點上,讓應(yīng)用在一個節(jié)點的內(nèi)存上能夠跑起來即可。”——陳文光的測試僅限于一個節(jié)點,而每個程序的執(zhí)行時間大致在1000秒左右。
第三個難點是如何把評測結(jié)果歸結(jié)為性能指標(biāo),陳文光認為這并不困難,清華大學(xué)采用的是“相對性能法”:“把結(jié)果歸結(jié)為指標(biāo)其實并不難,將測試程序在一個參考系統(tǒng)上的執(zhí)行時間作為參考時間,使用SPECCPU的標(biāo)準(zhǔn)方法測試,將多個測試結(jié)果進行幾何平均即可。”
不過,目前的測試方法在網(wǎng)絡(luò)連接和IO存儲方面有些薄弱,,陳文光認為,測試單個節(jié)點,可以對處理器和內(nèi)存選型給予較好的指導(dǎo),但是對網(wǎng)絡(luò)的選取,已經(jīng)有一些國外的技術(shù)可以預(yù)測并行程序的性能,但現(xiàn)階段來看,還不是普及化的評測方法。
實際案例:HPC測試是如何完成的
為了能更好的說明評測方法,陳文光以清華大學(xué)的一套實際HPC系統(tǒng)的購買前測試過程,為與會聽眾講解了更詳細的HPL測試方法。
“像清華探索4號HPC測試,我們是在單節(jié)點上做的Linpack,讓廠商各自調(diào)優(yōu),并規(guī)定整機HPL性能設(shè)定值必須達到的性能100TFlops,同時要達到一定的效率,尤其是并行效率。”陳文光表示,在測試過程中,他們選取了清華大學(xué)HPC應(yīng)用領(lǐng)域的最重要的五個程序:GEOSCHEM、SPIDER、GAMIL、VASP、MPI-DVDAC——這些都是在環(huán)境、生物、氣候、原子模擬等方面最流行的程序,同時也是清華大學(xué)最常用的軟件。
此外,在應(yīng)用測試的優(yōu)化工作方面,陳文光表示,雖然不允許FDO方式進行優(yōu)化,但是“廠商的優(yōu)化能力體現(xiàn)在其技術(shù)實力和服務(wù)能力上。”如果廠商的優(yōu)化、服務(wù)能力不過關(guān),陳文光說,“HPC系統(tǒng)少不了麻煩原廠商,到那時候如果不行,就麻煩了。”
在陳文光介紹的例子中,共有六套系統(tǒng)參與到測試中來,編譯環(huán)境為英特爾編譯器環(huán)境,在得出六套系統(tǒng)的測試結(jié)果之后,評測中心以測試的第一套系統(tǒng)作為基礎(chǔ),做其它五臺系統(tǒng)的幾何平均,從而得出相對公正的得分,其中綜合性能較好的節(jié)點,將成為采購的首選。
863高性能計算評測中心對英特爾的全線服務(wù)器處理器產(chǎn)品進行了評測
值得注意的是,陳文光談到了有關(guān)功耗測試的內(nèi)容,“采購?fù)度?000萬,每年的電費400萬,因此對功耗測試非常重視。”因此,清華大學(xué)同樣進行了系統(tǒng)滿載和空載時的功耗測試,從而比較出了更加低能耗,綠色節(jié)能的節(jié)點。
陳文光透露,正是在這樣的評測中,清華大學(xué)選擇了英特爾的至強7500、至強5600和安騰9300產(chǎn)品線,他表示,高性能計算評測中心目前已經(jīng)能夠達到“用什么就測什么”的發(fā)展階段,但這樣的發(fā)展,與原廠商,如英特爾的支持密不可分。
接受聽眾提問時,陳文光表示,評測中心并不考慮系統(tǒng)的配置和產(chǎn)品具體信息,提交的HPC系統(tǒng)并不要求系統(tǒng)配置一定要一摸一樣,評測中心考察的,是“如何在一個節(jié)點上獲得更高的性能。”
此外,陳文光也表示,指令集的向量化優(yōu)化能夠大量的提高系統(tǒng)的性能。