顧凡認(rèn)為,HPC應(yīng)該回歸“工具”的本質(zhì)
與此同時(shí),基于我們都了解“永遠(yuǎn)希望同樣的任務(wù)算的時(shí)間越短越少,同樣的模型能夠解決更多的問(wèn)題。”的HPC“剛性需求”——因此,顧凡表示,高性能計(jì)算要充分的去考慮“來(lái)自HPC的挑戰(zhàn)”在增大問(wèn)題規(guī)模、縮短運(yùn)算時(shí)間和增大物理復(fù)雜度的方面因素,而不是單純的去追求浮點(diǎn)運(yùn)算量的提升——“因?yàn)檫@三個(gè)方面,哪個(gè)方面可以提升都對(duì)HPC是有益處的。”
顧凡表示,這也就是說(shuō),要想讓高性能計(jì)算回歸本質(zhì),成為“工具”,在提升浮點(diǎn)運(yùn)算、追求單節(jié)點(diǎn)性能最高的同時(shí),需要同時(shí)考慮總線速度、內(nèi)存帶寬,而對(duì)于英特爾來(lái)說(shuō)“英特爾始終不遺余力的做系統(tǒng)、產(chǎn)品和軟件編譯器。”就是為了滿足這樣的一個(gè)需求——“所有的包括多核、眾核、AVX都是為了提高浮點(diǎn)計(jì)算能力,提高總線速度。QPI解決處理器喂飽的問(wèn)題,總線帶寬、內(nèi)存帶寬能夠匹配的上。”
英特爾全面化高性能計(jì)算戰(zhàn)略
也正是基于此,在本次ChinaGrid2009學(xué)術(shù)年會(huì)上,英特爾方面不斷的提出“英特爾所提供的是“平臺(tái)”而不是單純提供處理器”的概念——“英特爾核心價(jià)值在于處理器、編譯器以及生態(tài)環(huán)境的相關(guān)部分,英特爾在進(jìn)入酷睿架構(gòu)之后,走向了一個(gè)正確的方向,選擇了四核的階段去做了更新(QPI)。隨著核心越來(lái)越多,內(nèi)存通道、QPI的帶寬也要越來(lái)越大,進(jìn)行匹配。”顯然,顧凡認(rèn)為,正是基于對(duì)整體、對(duì)平臺(tái)以及除浮點(diǎn)計(jì)算之外的更多應(yīng)用需求的認(rèn)知,英特爾能夠滿足“讓HPC回歸本質(zhì),變成工具”的要求。
所以,在演講開始之前,顧凡展示了一副三年前用的PPT:英特爾希望,在數(shù)模優(yōu)化、并行化、數(shù)值計(jì)算、數(shù)據(jù)管理、結(jié)果可視化方面能夠?yàn)楦咝阅苡?jì)算用戶提供支持,讓他們能夠減少在這方面的壓力,將更多的精力放在“物理模型、數(shù)學(xué)模型、理性分析”上面。
何萬(wàn)青:基于特征分析的評(píng)價(jià)標(biāo)準(zhǔn)
在年初的文章中,我曾多次分析了目前高性能計(jì)算的評(píng)價(jià)體系,尤其是TOP500所采用的Linkpack,并一直期待能夠出現(xiàn)一個(gè)或是一種更加客觀、貼近用戶應(yīng)用的高性能計(jì)算系統(tǒng)性能評(píng)價(jià)方法,而在本次ChinaGrid2009學(xué)術(shù)年會(huì)上,何萬(wàn)青的演講因此也就對(duì)我產(chǎn)生了極大的吸引。
對(duì)于TOP500所采用的Linkpack,何萬(wàn)青卻在演講開始時(shí)給予了肯定,這顯然出乎我的意料——他表示:“專門來(lái)測(cè)試浮點(diǎn)性能的,能夠榨取最后一點(diǎn)性能,驗(yàn)證系統(tǒng)進(jìn)行“體驗(yàn)”,簡(jiǎn)單和趁手的工具進(jìn)行系統(tǒng)性能的測(cè)試。很多系統(tǒng)的bug都是Linkpack找到的。”
何萬(wàn)青認(rèn)為,Linpack還是有用的,可以做TOP500的指標(biāo),但是不適合實(shí)際應(yīng)用中的系統(tǒng)評(píng)價(jià)
因此,“本身作為TOP500的指標(biāo)是非常好的。”——這句話的意思再簡(jiǎn)單不過(guò):對(duì)于TOP500有用的Linkpack,對(duì)于在實(shí)際中評(píng)價(jià)高性能計(jì)算系統(tǒng)或許是不合適的。
何萬(wàn)青所提出的面向?qū)ο蟮腂enchmark,基本可以理解為“針對(duì)不同的應(yīng)用,把應(yīng)用特征摘取出來(lái),進(jìn)行針對(duì)性的測(cè)試。”對(duì)此,何萬(wàn)青舉例表示,在香港天文臺(tái),采用Linkpack進(jìn)行測(cè)試其應(yīng)用的時(shí)候,hypertown和Nehalem是一樣的,但是具體到三個(gè)特殊的針對(duì)應(yīng)用的測(cè)試,Nehalem的提升是非常高的,在氣象上這一點(diǎn)非常常見,因?yàn)闅庀髴?yīng)用往往更多是對(duì)內(nèi)存敏感型的,而不是頻率敏感型的——當(dāng)然,這個(gè)問(wèn)題我已經(jīng)在此之前在文章《Nehalem:改變千萬(wàn)億次計(jì)算的未來(lái)》討論過(guò)。
言歸正傳,我們回到對(duì)何萬(wàn)青對(duì)高性能計(jì)算的評(píng)價(jià)標(biāo)準(zhǔn)上。
何萬(wàn)青將高性能計(jì)算的應(yīng)用場(chǎng)景劃分為四個(gè),分別為:?jiǎn)我粦?yīng)用程序、多個(gè)同類型應(yīng)用程序針對(duì)特別的應(yīng)用程序、通用的高性能計(jì)算中心(HPC Center),因此,測(cè)試應(yīng)該根據(jù)不同的應(yīng)用場(chǎng)景和應(yīng)用特征來(lái)設(shè)定——四類測(cè)試方法為:針對(duì)應(yīng)用程序的特點(diǎn)來(lái)進(jìn)行Benchmark測(cè)試、根據(jù)一類應(yīng)用程序的共同特點(diǎn)來(lái)進(jìn)行針對(duì)性的測(cè)試、運(yùn)行就緒的系統(tǒng)選擇正確的Benchmark子集、運(yùn)行通用的HPC Benchmark獲得平均的指標(biāo)。
何萬(wàn)青的“雷達(dá)圖”其實(shí)道理很簡(jiǎn)單:看明白某一個(gè)應(yīng)用在哪方面最敏感,一方面可以用來(lái)進(jìn)行優(yōu)化,另一方面可以評(píng)價(jià)高性能計(jì)算系統(tǒng)的性能——當(dāng)然是針對(duì)某一個(gè)或一類特定的應(yīng)用。
因此,我們?cè)诤稳f(wàn)青的四個(gè)例子上,都看到了由多種應(yīng)用特性組成的“雷達(dá)圖”:在一個(gè)雷達(dá)圖上,各個(gè)方向上都代表了一個(gè)特性,或者說(shuō)是特征,這正是讓應(yīng)用顯示出其“特性”的地方——就此,用戶可以根據(jù)這個(gè)特性來(lái)完成對(duì)高性能計(jì)算系統(tǒng)的針對(duì)應(yīng)用特征,或者說(shuō)針對(duì)實(shí)際情況的測(cè)試,而不是無(wú)論在何時(shí)何地都是用Linpack,畢竟并不是所有的,甚至不能說(shuō)大多數(shù)高性能計(jì)算應(yīng)用都是浮點(diǎn)敏感占主要地位的。
何萬(wàn)青的方法簡(jiǎn)述起來(lái)就是找到影響應(yīng)用性能的幾個(gè)重要技術(shù)指標(biāo),設(shè)計(jì)相應(yīng)的性能評(píng)估模型(變動(dòng)某個(gè)指標(biāo)會(huì)對(duì)性能造成什么樣的影響),確定合適的測(cè)試應(yīng)用和負(fù)載,而不是單純的使用Linpack,