在上述領(lǐng)域,華中科技大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院院長金海教授率領(lǐng)的集群與網(wǎng)格計(jì)算湖北省重點(diǎn)實(shí)驗(yàn)室是國內(nèi)學(xué)界的佼佼者。作為“中國教育科研網(wǎng)格ChinaGrid”計(jì)劃的專家組組長,金海也非常關(guān)注CPU領(lǐng)域的進(jìn)展。在AMD全球首發(fā)代號為巴塞羅那的四核處理器之際,本報(bào)記者獨(dú)家采訪了金海,從高性能計(jì)算與網(wǎng)格計(jì)算等角度分析AMD四核處理器的價(jià)值。



華中科技大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院院長 金海


      體系架構(gòu)和功耗優(yōu)勢


      記者:代號巴塞羅那的AMD四核處理器即將發(fā)布。從目前發(fā)布的資料來看,AMD在四核處理器上延用了直連架構(gòu)、集成內(nèi)存控制器、超傳輸總線等架構(gòu)。從高性能計(jì)算的角度,如何看待這種繼承性的架構(gòu)?


      金海:從目前得到的資料來看,同樣的架構(gòu)從單核、雙核延伸到四核,說明它是一個(gè)有彈性的架構(gòu)。以直連架構(gòu)為例,它既保持了與之前傳統(tǒng)前端總線架構(gòu)的兼容性,消除瓶頸,內(nèi)存帶寬又可達(dá)傳統(tǒng)FSB+北橋架構(gòu)的2倍以上,響應(yīng)時(shí)延卻僅為傳統(tǒng)架構(gòu)的一半。超傳輸互聯(lián)技術(shù)可以提供更高的帶寬和更低的延遲。另外,I/O數(shù)據(jù)使用單獨(dú)的總線,加大了CPU的吞吐量,同時(shí),內(nèi)存帶寬會隨著CPU的增加而增加。這樣都對于高密度計(jì)算有明顯幫助。


      此外,由于架構(gòu)上的特點(diǎn),使得巴塞羅那和其他皓龍?zhí)幚砥饕粯?,在大?guī)模使用內(nèi)存時(shí)也具有一定功耗優(yōu)勢。


      記者:這種架構(gòu)特性能給網(wǎng)格計(jì)算帶來什么好處?


      金海:我們對處理器的一些新特性比較有興趣。在網(wǎng)格計(jì)算研究中,經(jīng)常會需要考慮異構(gòu)環(huán)境中的問題。例如如在去年完成的ChinaGrid一期項(xiàng)目中,各個(gè)學(xué)校就有包括基于RISC指令集、EPIC指令集,x86指令集在內(nèi)的不同設(shè)備參與,而且各個(gè)指令集下的CPU架構(gòu)和特性還各不相同,網(wǎng)絡(luò)結(jié)構(gòu)也不一樣,這就要求我們必須考慮如何盡量提高系統(tǒng)帶寬和I/O,并降低延遲,巴塞羅那在體系架構(gòu)上的繼承性滿足這一要求。


      而且,在網(wǎng)格計(jì)算中也要盡量降低功耗方面的開銷,而巴塞羅那在功耗方面采用了更精細(xì)的內(nèi)部控制。例如獨(dú)立動態(tài)核心技術(shù),實(shí)現(xiàn)了每個(gè)內(nèi)核可以使用獨(dú)立的頻率工作,CoolCore技術(shù)實(shí)現(xiàn)了粗放模式和精微模式的電路控制,這兩項(xiàng)技術(shù)都對于CPU省電有較大好處。此外,還有AMD在業(yè)界率先使用的雙重動態(tài)電源管理(DDPM)技術(shù),能對CPU和內(nèi)存控制器分別獨(dú)立供電,使得在功耗降低的同時(shí)獲得更高的內(nèi)存帶寬。


      內(nèi)存帶寬優(yōu)勢


      記者:集成內(nèi)存控制器一直是AMD處理器的特點(diǎn),在四核里也是如此。這種集成內(nèi)存控制器的方式,對于高性能計(jì)算有什么樣的好處?


      金海:集成內(nèi)存控制器是AMD在內(nèi)存方面很有創(chuàng)意的一個(gè)設(shè)計(jì),顯然使CPU到內(nèi)存的路徑更短,延遲降低,同時(shí)每一個(gè)CPU具有專有內(nèi)存帶寬。在高性能計(jì)算領(lǐng)域,從CPU核心到內(nèi)存之間的數(shù)據(jù)交換往往受制于帶寬限制,之間的延遲越來越高,限制了系統(tǒng)整體性能的提升??這一現(xiàn)象導(dǎo)致了“內(nèi)存墻”(Memory wall)一詞的誕生。隨著近年來處理器性能的大幅提升,“內(nèi)存墻”在高性能計(jì)算和網(wǎng)格計(jì)算領(lǐng)域的瓶頸作用也越來越明顯,所以我們需要有能較好緩解這一現(xiàn)象的產(chǎn)品出現(xiàn)。


      巴塞羅那在內(nèi)存帶寬上采用了一系列優(yōu)化技術(shù),使得在不做其他改動的前提下,內(nèi)存性能比雙核皓龍?zhí)嵘?0%。其中,巴塞羅那采用的核心預(yù)取、內(nèi)存預(yù)取、內(nèi)存頁面優(yōu)化、寫爆發(fā)和大內(nèi)存緩沖技術(shù)能帶來40%的性能提升。此外,DDPM技術(shù)能讓每個(gè)核心的內(nèi)存控制器獲得額外10%左右的提升。


      記者:帶寬直接影響到高性能計(jì)算時(shí)的數(shù)據(jù)吞吐量,現(xiàn)有的資料顯示,在四核中使用了寬浮點(diǎn)加速器。這個(gè)寬浮點(diǎn)加速器對于高性能計(jì)算又有什么影響呢?


      金海:從目前看到的資料里可以得出結(jié)論,在巴塞羅那處理器中,SSE的執(zhí)行帶寬、指令拾取帶寬、數(shù)據(jù)緩存負(fù)載帶寬、L2/NB帶寬等都是現(xiàn)有處理器的兩倍。因此,可以知道系統(tǒng)的數(shù)據(jù)通路寬了兩倍,這意味著在ChinaGrid項(xiàng)目中存在的大量科學(xué)計(jì)算帶來的浮點(diǎn)運(yùn)算就可以更快完成。


      硬件級的虛擬化優(yōu)勢


      記者:虛擬機(jī)技術(shù)是近些年來IT業(yè)界非常熱的一個(gè)領(lǐng)域,無論是硬件廠商還是軟件廠商都積極參與。據(jù)了解,你目前正擔(dān)負(fù)著國家973計(jì)劃中的“計(jì)算系統(tǒng)虛擬化基礎(chǔ)理論與方法研究”研究項(xiàng)目,那么AMD四核處理器在虛擬機(jī)技術(shù)上有什么樣的吸引力?


      金海:很顯然,大家之所以希望虛擬化幫助提升IT基礎(chǔ)設(shè)施的效率,那么打破“每臺服務(wù)器一種應(yīng)用”的模式,根據(jù)工作負(fù)載或維護(hù)安排遷移虛擬機(jī)就是它最有吸引力的地方,它將一臺計(jì)算機(jī)分成多個(gè)獨(dú)立的虛擬機(jī),能夠同時(shí)支持多種不同的操作系統(tǒng)和應(yīng)用。


      如果在一個(gè)硬件系統(tǒng)上運(yùn)行多個(gè)虛擬機(jī),那么如何保證從最底層的CPU到最上層的應(yīng)用之間,物理機(jī)與虛擬機(jī)之間高速高效的數(shù)據(jù)交換,以及虛擬機(jī)之間的高隔離度就成了重要課題。我們通過研究VMware和Xen這樣在Windows和Linux操作系統(tǒng)上的典型虛擬機(jī)產(chǎn)品,可以知道相較傳統(tǒng)的進(jìn)程遷移,虛擬機(jī)遷移具有很大優(yōu)勢,但同時(shí)帶來不少挑戰(zhàn)。例如在內(nèi)存遷移、網(wǎng)絡(luò)連接保持、用戶數(shù)據(jù)遷移和虛擬機(jī)本身的效率等問題上還有提升空間。而這就需要有從底層硬件、固件到軟件的同步提升,巴塞羅那就從CPU底層提供了良好的硬件支持。


      例如DEV(Device Exclusion Vector)技術(shù)可以在內(nèi)存中創(chuàng)建保護(hù)域,通過拒絕未經(jīng)授權(quán)的內(nèi)存訪問請求,使得設(shè)備在未經(jīng)授權(quán)的情況下,不得訪問內(nèi)存頁面,實(shí)現(xiàn)了在硬件中嵌入安全性,從而提高虛擬機(jī)效率。


      此外,為了提升虛擬機(jī)與物理機(jī)之間的數(shù)據(jù)傳送及翻譯轉(zhuǎn)換,巴塞羅那中使用了帶標(biāo)簽的 TLB(Translation Look-aside Buffer,地址轉(zhuǎn)換后備緩沖器,它是 CPU 中的一個(gè)表,用于存儲最近使用的從虛擬到物理內(nèi)存翻譯記錄),使得在多個(gè)虛擬機(jī)同時(shí)運(yùn)行時(shí),在內(nèi)存地址中切換時(shí)可以使系統(tǒng)管理程序知道TLB與虛擬機(jī)之間的一一對應(yīng)關(guān)系,從而提高虛擬機(jī)性能。


      用戶歡迎多元結(jié)構(gòu)


      記者:在全球TOP500排名中,出現(xiàn)了越來越多的基于AMD處理器的系統(tǒng),而且有消息說IBM、Cray和Sun三大廠商都將采用巴塞羅那作為千萬億次HPC的搭建平臺,您如何看待這一趨勢?


      金海:總結(jié)起來,AMD的新一代處理器的重要貢獻(xiàn)來自于三個(gè)方面,即獨(dú)特的系統(tǒng)架構(gòu),優(yōu)勢的內(nèi)存性能與控制,以及在虛擬化領(lǐng)域里的一系列新設(shè)計(jì)。在這三方面,AMD都提供了較好的方案,例如有彈性的直連架構(gòu)實(shí)現(xiàn)了線性的性能提升,所需要解決的問題越大,越復(fù)雜,直連架構(gòu)的優(yōu)勢也就越大。


      作為高性能計(jì)算領(lǐng)域里的研究人員,我們當(dāng)然希望能夠有更多新的技術(shù)、新的設(shè)計(jì)和新的突破點(diǎn)出來,滿足更多領(lǐng)域?qū)τ诟咝阅苡?jì)算的需求。具體到即將開始的ChinaGrid網(wǎng)格二期工程,我們也希望看到在6個(gè)核心計(jì)算節(jié)點(diǎn)和40個(gè)高校計(jì)算節(jié)點(diǎn)中,有更多來自不同廠商的產(chǎn)品,讓更多性價(jià)比良好的系統(tǒng)能被各個(gè)領(lǐng)域的研究者說采用。


       人物鏈接:


      金海,工學(xué)博士,華中科技大學(xué)教授、博士生導(dǎo)師,華中科技大學(xué)計(jì)算機(jī)學(xué)院院長,華中科技大學(xué)“集群與網(wǎng)格計(jì)算湖北省重點(diǎn)實(shí)驗(yàn)室”和“服務(wù)計(jì)算技術(shù)與系統(tǒng)教育部重點(diǎn)實(shí)驗(yàn)室”主任。國務(wù)院特殊津貼專家、中國計(jì)算機(jī)學(xué)會常務(wù)理事、中國計(jì)算機(jī)學(xué)會對外聯(lián)絡(luò)部副主任。教育部重大專項(xiàng)“中國教育科研網(wǎng)格ChinaGrid”計(jì)劃的專家組組長。主要研究領(lǐng)域?yàn)橛?jì)算機(jī)體系結(jié)構(gòu)、并行與分布式處理、集群計(jì)算和網(wǎng)格計(jì)算、對等計(jì)算、網(wǎng)絡(luò)存儲與并行I/O、網(wǎng)絡(luò)安全、可信計(jì)算等。

分享到

多易

相關(guān)推薦