CPU加工工藝的不斷提升,多核及CPU中集成內(nèi)存控制器,在提高性能的同時(shí),降低了主板芯片組的功耗。

另一方面,通過降低電壓和頻率也可以降低CPU的動態(tài)功耗,在CPU功耗控制方面,如Intel推出的動態(tài)功耗節(jié)點(diǎn)管理器(Dynamic Node Management)是一個(gè)內(nèi)嵌于英特爾服務(wù)器芯片組的帶外 (OOB) 功率管理策略引擎。

它與 BIOS 和操作系統(tǒng)功耗管理 (OSPM) 協(xié)作,動態(tài)地調(diào)整平臺功耗,從而實(shí)現(xiàn)服務(wù)器)性能/功耗的最大化。在專用低功耗部件研究方面,包括上海瀾起公司研發(fā)的高級內(nèi)存緩存AMB芯片、SSD固態(tài)電子硬盤等技術(shù)與產(chǎn)品。

基礎(chǔ)架構(gòu)級節(jié)能技術(shù)

基礎(chǔ)架構(gòu)級節(jié)能技術(shù)主要包括液冷、存儲制冷、高效能電源、高效能散熱冷卻技術(shù)等諸多技術(shù)。

高效能散熱冷卻技術(shù)包括研究效率更高的散熱方式和性能更好的冷卻設(shè)備,如HP PARSEC體系結(jié)構(gòu)(Parallel Redundant Scalable Enterprise Cooling)、IBM的機(jī)房冷卻系統(tǒng)等。

存儲制冷(Stored Cooling)指預(yù)先基于制冷設(shè)備存儲部分制冷能力,在需要時(shí)再有效釋放,類似電池的儲電功能,如IBM基于存儲冷卻技術(shù)的機(jī)房冷卻方案。液冷技術(shù)包括水冷及液態(tài)金屬制冷,由于其導(dǎo)熱能力強(qiáng)并且熱容更大,能夠更快的緩解負(fù)載突變造成的散熱壓力并吸收更多的熱量,在當(dāng)前大型計(jì)算機(jī)中使用越來越普遍,如IBM Cool Blue機(jī)柜系統(tǒng)。

系統(tǒng)級節(jié)能技術(shù)

在解決功耗方面,除采用上述CPU功耗控制、CPU工作頻率調(diào)整、液體冷卻、低功耗專用芯片、芯片級冷卻等技術(shù)以外,學(xué)術(shù)界和企業(yè)界也在研究系統(tǒng)級節(jié)能技術(shù)和產(chǎn)品,包括:基于負(fù)載情況動態(tài)調(diào)整系統(tǒng)狀態(tài)、實(shí)施部分節(jié)點(diǎn)或部件的休眠;根據(jù)各進(jìn)程能耗的不同對CPU任務(wù)隊(duì)列進(jìn)行調(diào)整,如將一些產(chǎn)生較多熱量的任務(wù)從溫度較高的CPU上遷移到溫度較低的CPU上從而實(shí)現(xiàn)能耗的均衡。

如國家高性能計(jì)算機(jī)工程技術(shù)研究中心開發(fā)的自適應(yīng)功耗管理系統(tǒng),可實(shí)現(xiàn)基于能效的作業(yè)調(diào)度策略,IBM PowerExecutive允許用戶 " 計(jì)量 " 任何單一物理系統(tǒng)或一組物理系統(tǒng)的實(shí)際電力使用數(shù)據(jù)和趨勢數(shù)據(jù),并可對實(shí)際用電量進(jìn)行監(jiān)視,并在系統(tǒng)、機(jī)箱或機(jī)架層次上對數(shù)據(jù)中心中的電耗和熱耗進(jìn)行有效分配。
服務(wù)器節(jié)能技術(shù)發(fā)展趨勢

當(dāng)前全球最快性能Top 500超級計(jì)算機(jī)其每瓦Gflops性能都在0.5以下,未來高效能計(jì)算機(jī)系統(tǒng),其每瓦Gflops性能應(yīng)在1.0GFlops per watt 以上,當(dāng)前混合異構(gòu)體系結(jié)構(gòu)、自主節(jié)能管理、應(yīng)用加速、系統(tǒng)級節(jié)能等技術(shù)的發(fā)展正推動這一目標(biāo)的逐步實(shí)現(xiàn)。

體系結(jié)構(gòu)促動節(jié)能技術(shù)的發(fā)展

雖然尚存在軟件的可用性、任務(wù)調(diào)度、編程模式等諸多問題,基于標(biāo)量處理器、FPGA、向量及多線程處理器、圖形處理器等來構(gòu)建混合異構(gòu)的高性能計(jì)算機(jī)系統(tǒng)已成為解決能耗的主要途徑之一,其中可重構(gòu)計(jì)算結(jié)構(gòu)能以較低的硬件復(fù)雜度實(shí)現(xiàn)指令、數(shù)據(jù)及線程級并行,并且具有較大的性能/功耗、性能/價(jià)格優(yōu)勢,已廣泛應(yīng)用于科學(xué)計(jì)算等諸多領(lǐng)域,以實(shí)現(xiàn)應(yīng)用加速。

采用混合異構(gòu)的高性能計(jì)算機(jī)系統(tǒng)包括IBM代號為"Roadrunner"的千萬億次超級計(jì)算機(jī),其采用混合異構(gòu)刀片機(jī)群來構(gòu)建,每個(gè)機(jī)箱包括3個(gè)計(jì)算節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)包括4個(gè)刀片,2個(gè)QS22 Cell刀片,1個(gè)擴(kuò)展連接刀片,另外一個(gè)是LS21雙核AMD Opteron刀片。

全系統(tǒng)采用6562顆AMD 雙核Opteron CPU 和12240顆八核Cell 處理器芯片,其中,Opteron處理器負(fù)責(zé)一般的計(jì)算進(jìn)程、文件IO和通訊,Cell負(fù)責(zé)那些復(fù)雜的、重復(fù)的、大量消耗機(jī)器資源的計(jì)算過程,同時(shí)Roadrunner還采用先進(jìn)的"混合編程(Hybrid Programming)"軟件,以實(shí)現(xiàn)異構(gòu)計(jì)算。該款機(jī)器以437.43 MFLOPS/watt的能效成績排在Green500中第三名。

節(jié)能趨向全方位發(fā)展

芯片級、基礎(chǔ)架構(gòu)級以及系統(tǒng)級節(jié)能確實(shí)能夠節(jié)約部分功耗,但并不能提高機(jī)房的冷卻效率,高性能計(jì)算機(jī)系統(tǒng)中節(jié)能和散熱冷卻是緊密結(jié)合在一起的,基于服務(wù)器能耗監(jiān)控和制冷設(shè)備的聯(lián)動可以提升冷卻系統(tǒng)的效率,實(shí)現(xiàn)精確制冷。服務(wù)器能耗監(jiān)控和制冷設(shè)備的聯(lián)動基于完整的機(jī)房散熱模型,評估機(jī)房的散熱效率,并根據(jù)散熱模型計(jì)算相應(yīng)制冷量,調(diào)整空調(diào)的風(fēng)壓和風(fēng)速、液冷機(jī)柜的溫度、流速、機(jī)柜風(fēng)扇轉(zhuǎn)速以實(shí)現(xiàn)精確制冷的需求。

可以說,未來服務(wù)器系統(tǒng)的節(jié)能必將向芯片、基礎(chǔ)架構(gòu)、系統(tǒng)、機(jī)房制冷聯(lián)動全方位發(fā)展,包括芯片級節(jié)能技術(shù)、低功耗專用芯片、芯片級冷卻、應(yīng)用加速、液體冷卻、CPU頻率動態(tài)調(diào)整、功耗限制、實(shí)施部分節(jié)點(diǎn)或部件的休眠、根據(jù)各進(jìn)程能耗的不同對CPU任務(wù)隊(duì)列進(jìn)行調(diào)整、基于能效的作業(yè)調(diào)度策略、基于散熱模型的機(jī)房制冷聯(lián)動等諸多方面。

自主節(jié)能管理浮出水面

未來節(jié)能管理和服務(wù)器監(jiān)控管理融合的趨勢將進(jìn)一步增強(qiáng),包括自動監(jiān)控各類資源部件的能耗,對能耗監(jiān)控歷史數(shù)據(jù)深度挖掘、關(guān)聯(lián)推理并實(shí)施系統(tǒng)動態(tài)功耗預(yù)測,通過其自配置、自恢復(fù)、自優(yōu)化等特性自主地采取措施、減少人工干預(yù),實(shí)施和作業(yè)調(diào)度、虛擬計(jì)算環(huán)境、機(jī)房制冷的聯(lián)動,可根據(jù)應(yīng)用的能耗特征構(gòu)造虛擬計(jì)算環(huán)境,并提供保證服務(wù)質(zhì)量的綜合手段以及分析、診斷應(yīng)用系統(tǒng)的工具,減少人工干預(yù),以實(shí)現(xiàn)智能功耗管理。自主節(jié)能管理可以有效緩解高性能計(jì)算機(jī)系統(tǒng)管理的復(fù)雜性和功耗壁壘雙重壓力。

服務(wù)器能效評價(jià)技術(shù)現(xiàn)狀

服務(wù)器系統(tǒng)的發(fā)展離不開基準(zhǔn)程序測試。按照應(yīng)用類型,基準(zhǔn)測試程序可分為科學(xué)計(jì)算、商業(yè)應(yīng)用、信息服務(wù)等。按照測試關(guān)注的對象,包括宏觀基準(zhǔn)測試程序和微觀基準(zhǔn)測試程序兩類。

宏觀基準(zhǔn)測試程序測量服務(wù)器系統(tǒng)的總體性能,如NPB包括5個(gè)核心程序和3個(gè)CFD應(yīng)用程序,用來測試大規(guī)模計(jì)算機(jī)系統(tǒng)性能;PARKBENCH基于Fortran90和HPF來測試共享或分布共享計(jì)算機(jī)結(jié)構(gòu)的性能;PMB是由Pallas研究開發(fā)的一套綜合的MPI基準(zhǔn)測試程序集;PmaC是一套測試大規(guī)模計(jì)算機(jī)系統(tǒng)基本性能的正交基準(zhǔn)測試程序集;HPCC綜合考慮了計(jì)算、訪存、通信與輸入輸出性能指標(biāo),試圖取代傳統(tǒng)的Linpack Benchmark 成為TOP500排序的依據(jù)。

微觀基準(zhǔn)程序測量服務(wù)器系統(tǒng)某個(gè)特定方面的性能,如CPU速度、存儲器速度、I/O速度、操作系統(tǒng)性能和網(wǎng)絡(luò)性能等,如Linpack側(cè)重于系統(tǒng)浮點(diǎn)峰值運(yùn)算能力的測試。目前已提出和正在使用的基準(zhǔn)程序組已超過100多個(gè)。

當(dāng)前在服務(wù)器能效評價(jià)標(biāo)準(zhǔn)及技術(shù)方面,主要有如下幾種評價(jià)方式:SPECpower_ssj2008

國際標(biāo)準(zhǔn)性能評估機(jī)構(gòu)(SPEC)發(fā)布了SPECpower_ssj2008,這是業(yè)界第一項(xiàng)用于評測系統(tǒng)級別服務(wù)器的與運(yùn)算性能相關(guān)的功耗基準(zhǔn)測試工具,其測試模型如下圖1所示。

SPEC設(shè)計(jì)的SPECpower_ssj2008不僅可以作為一項(xiàng)指標(biāo)來比較不同服務(wù)器之間能耗和性能,還可作為提高服務(wù)器效率的工具集來使用。

SPECpower_ssj2008可以評估服務(wù)器系統(tǒng)在10%負(fù)載的待機(jī)模式到100%滿負(fù)載狀況下的功耗數(shù)據(jù),測試的負(fù)載為典型的服務(wù)器端的JAVA商業(yè)應(yīng)用程序。負(fù)載可擴(kuò)展,多線程,可以在不同的操作環(huán)境間移植。

圖1、SPECpower_ssj2008測試模型

運(yùn)行在SUT(System Under Test)上的負(fù)載SSJ(Server Side Java)是一個(gè)模擬標(biāo)準(zhǔn)三層客戶-服務(wù)器架構(gòu)的java實(shí)現(xiàn)。SSJ包含JVM Instance和JVM Director,JVM Instance包含三層:Threads(tier1),Business Logic(tier2)和Warehouses(tier3)。JVM Director和實(shí)際負(fù)載同時(shí)運(yùn)行,它的主要作用是控制負(fù)載上的JVM實(shí)例;與CCS通信,接受和分發(fā)來自CCS的命令;收集負(fù)載數(shù)據(jù)并向CCS報(bào)告。

Green Top 500

2007年11月,在美國內(nèi)華達(dá)州里諾市舉行的超級計(jì)算2007大會上,美國弗吉尼亞工學(xué)院首次發(fā)布了"綠色500(Green500)"超級計(jì)算機(jī)排行榜,對全球能效最高的超級計(jì)算機(jī)進(jìn)行了排名,以作為TOP500排行榜的補(bǔ)充。

Green500榜單中所有的系統(tǒng)都以MFLOPS/Watt(百萬次浮點(diǎn)運(yùn)算/瓦特)來統(tǒng)計(jì)其性能功耗比。MFLOPS數(shù)值來自TOP500榜單中所上報(bào)的Linpack基準(zhǔn)測試性能,Watt值來自系統(tǒng)運(yùn)行Linpack基準(zhǔn)時(shí)的測量功率,或者是基于系統(tǒng)規(guī)格估算出的最大功率,單節(jié)點(diǎn)能耗基于功率表、電壓計(jì)、電流計(jì)測得,用多個(gè)節(jié)點(diǎn)的功耗求平均,再乘所有計(jì)算節(jié)點(diǎn)個(gè)數(shù),得到系統(tǒng)總能耗。

在第31次Top500排行榜名列第一的Roadrunner, 以437.43 MFLOPS/watt能效成績排名Green500第三,另外兩臺系統(tǒng)都是IBM基于Cell處理器的QS22超級計(jì)算機(jī),能效值分別為488.14 MFLOPS/watt、488.14 MFLOPS/watt。
Green Grid

2007年成立的行業(yè)協(xié)會Green Grid 開發(fā)了測量數(shù)據(jù)中心效率和生產(chǎn)力的標(biāo)準(zhǔn),如圖2所示。指標(biāo)PUE(Power UsageEffectiveness,電力使用效率)=總設(shè)施耗電量與IT設(shè)備耗電量之比。

應(yīng)當(dāng)小于2,越接近1越好;指標(biāo)DCiE(DataCenter infrastructure ,數(shù)據(jù)中心基礎(chǔ)設(shè)施效率)=IT設(shè)備耗電量x100與總設(shè)施耗電量之比,數(shù)字越大越好。

這兩項(xiàng)指標(biāo)被用于將數(shù)據(jù)中心消耗在供電和冷卻上的電量與數(shù)據(jù)中心的IT設(shè)備使用的電量進(jìn)行比較。Green Grid最終希望為數(shù)據(jù)中心拿出一個(gè)類似于汽車每加倫英里數(shù)的指標(biāo),不過,采集能耗數(shù)據(jù)以及應(yīng)用這兩項(xiàng)指標(biāo),使其可被應(yīng)用于不同機(jī)構(gòu)的數(shù)據(jù)中心效率上,仍有很多工作要做。

圖2、Green Grid 評價(jià)指標(biāo)

中國服務(wù)器能效評價(jià)標(biāo)準(zhǔn)展望

如何衡量服務(wù)器系統(tǒng)的能效?一方面服務(wù)器的能效囊括CPU、內(nèi)存、外圍芯片組、電源、硬盤等諸多部件能耗的狀況,我們需要開發(fā)新的度量準(zhǔn)則(metrics)和benchmarks來測量和預(yù)測服務(wù)器系統(tǒng)及部件級能效特征,這種基準(zhǔn)測試往往基于壓力測試,評價(jià)服務(wù)器及其組件的極限能效性能,另一方面,我們也必須看到服務(wù)器的能效和應(yīng)用的能效需求密不可分,應(yīng)用在影響服務(wù)器系統(tǒng)性能的高低、規(guī)模的大小的同時(shí),也在影響系統(tǒng)整體能效的輸出狀態(tài),所以高性能計(jì)算機(jī)的能效評價(jià)我們必須考慮到應(yīng)用的因素,應(yīng)用的多樣性和新技術(shù)的涌現(xiàn),導(dǎo)致了大規(guī)模計(jì)算機(jī)系統(tǒng)實(shí)現(xiàn)形式的多樣性,能效評價(jià)應(yīng)能適應(yīng)這些新的變化,并能關(guān)注到系統(tǒng)的占地面積、維護(hù)成本、可靠性、可用性、好用性、總體擁有成本、可編程性、可移植性等各影響因素的層次關(guān)系,最終目標(biāo)應(yīng)是實(shí)現(xiàn)以應(yīng)用效率為導(dǎo)向的服務(wù)器能效評價(jià)體系,而非單一的功耗度量準(zhǔn)則。

分享到

adan

相關(guān)推薦