對(duì)于數(shù)據(jù)中心的高耗能以及帶來(lái)的大量運(yùn)營(yíng)費(fèi)用,數(shù)據(jù)中心管理者都在想方設(shè)法地利用自然冷卻技術(shù)給數(shù)據(jù)中心降溫,同時(shí)降低能源的消耗。比如惠普在英格蘭東北部小鎮(zhèn)溫雅德的首座風(fēng)冷數(shù)據(jù)中心,Google在荷蘭使用海水降溫的數(shù)據(jù)中心等等。
雖然數(shù)據(jù)中心在嘗試各種新方式來(lái)降低冷卻使用的能耗,但大部分?jǐn)?shù)據(jù)中心在炎熱的夏天基本上還是只能依靠空調(diào)來(lái)給數(shù)據(jù)中心降溫。同時(shí)作為數(shù)據(jù)中心主要IT設(shè)備的服務(wù)器,其能耗占到了數(shù)據(jù)中心的一半以上。
位于北京昌平的263數(shù)據(jù)中心就是這樣一個(gè)代表。263網(wǎng)絡(luò)通信股份有限公司網(wǎng)絡(luò)中心經(jīng)理李旺介紹,盡管夏天也采用給空調(diào)鹽水降溫和冬天風(fēng)冷降溫等手段,但空調(diào)和服務(wù)器的能耗依然是數(shù)據(jù)中心電費(fèi)支出的絕大部分,尤其是服務(wù)器的能耗,占到了263數(shù)據(jù)中心電費(fèi)支出的一半以上。
如果說(shuō)給數(shù)據(jù)中心機(jī)房降溫還可以采用風(fēng)冷和水冷等手段減少能耗,那么服務(wù)器有沒有辦法更節(jié)能呢?答案是當(dāng)然有。
節(jié)點(diǎn)管理技術(shù)節(jié)能有方
首先是采用基于新一代至強(qiáng)處理器平臺(tái)的服務(wù)器。以至強(qiáng)5600處理器為例,它可以實(shí)現(xiàn)對(duì)早期單核服務(wù)器15:1的整合,每年可以節(jié)省95%的電力支出。
其次,英特爾獨(dú)門秘器的節(jié)點(diǎn)管理器技術(shù),可以實(shí)現(xiàn)服務(wù)器能耗的動(dòng)態(tài)調(diào)節(jié),使得服務(wù)器在“空閑”狀態(tài)時(shí)可處于“休眠”狀態(tài),大大降低能耗。
英特爾節(jié)點(diǎn)管理器是內(nèi)嵌于英特爾服務(wù)器芯片組的帶外功率管理策略引擎,它與BIOS和操作系統(tǒng)功耗管理(OSPM)協(xié)作,動(dòng)態(tài)地調(diào)節(jié)平臺(tái)功耗,從而實(shí)現(xiàn)節(jié)點(diǎn)(服務(wù)器)性能/功耗的最大化。它可以通過(guò)基于規(guī)范IPMI協(xié)議的接口、由支持的基板管理控制器(BMC)使用。它需要一個(gè)類似PMBus的儀器提供電源。
節(jié)點(diǎn)管理器具有如下功能:動(dòng)態(tài)監(jiān)控功耗——在允許的誤差范圍內(nèi)測(cè)試服務(wù)器平臺(tái)的功耗;平臺(tái)功耗設(shè)限——將平臺(tái)功耗設(shè)置為限定目標(biāo)功率的同時(shí)保證在該功耗限額下的最佳性能;功耗閥值警報(bào)——節(jié)點(diǎn)管理器根據(jù)限定目標(biāo)功耗來(lái)來(lái)監(jiān)控平臺(tái)的功耗。
263昌平數(shù)據(jù)中心就得益于英特爾節(jié)點(diǎn)管理技術(shù)而降低了夜間的運(yùn)行能耗。263網(wǎng)絡(luò)通信股份有限公司網(wǎng)絡(luò)中心經(jīng)理李旺表示,有鑒于用戶在夜間使用郵箱的頻率要比白天低很多,尤其是下半夜后。工程師就利用節(jié)點(diǎn)管理技術(shù),將夜間的功耗調(diào)低,在滿足正常運(yùn)營(yíng)的同時(shí)減少了無(wú)效的能耗支出,節(jié)省了開支。
中國(guó)市場(chǎng)的搜索老大百度公司亦對(duì)英特爾節(jié)點(diǎn)管理器的功效進(jìn)行了測(cè)試。百度在模擬負(fù)載的情況下,對(duì)于單一節(jié)點(diǎn),當(dāng)采用有效功率策略時(shí),在不影響性能的情況下可節(jié)省40瓦功率;對(duì)于機(jī)架,在相同機(jī)架級(jí)功率限額下能提升計(jì)算能力20%;和百度此前的數(shù)據(jù)中心相比,采用節(jié)點(diǎn)管理技術(shù)后,機(jī)架密度增幅可以達(dá)到20%至40%。
和數(shù)據(jù)中心管理平臺(tái)相得益彰
事實(shí)上,節(jié)點(diǎn)管理器技術(shù)只能為獨(dú)立的服務(wù)器提供能耗溫度監(jiān)控和基于各種策略的能源管理,可以說(shuō)它是一個(gè)單兵“利器”。節(jié)點(diǎn)管理器和英特爾數(shù)據(jù)中心管理平臺(tái)IntelDCM相配合,將能建立起數(shù)據(jù)中心多層次的能耗和熱效率管理,從而能從數(shù)據(jù)中心的層面節(jié)能增效。
一般而言,數(shù)據(jù)中心管理產(chǎn)品(DCM)應(yīng)具備三大基本功能,即監(jiān)測(cè)、管控和報(bào)表。英特爾數(shù)據(jù)中心管理平臺(tái)(IntelDataCenterManager,IntelDCM)涵蓋了監(jiān)控、管理數(shù)據(jù)中心的機(jī)架和服務(wù)器組電、熱等能耗的軟件技術(shù),IT部門利用它來(lái)實(shí)現(xiàn)提高機(jī)架密度、降低能耗與散熱成本,從而優(yōu)化機(jī)房布局并輕松獲益。
其中,監(jiān)測(cè)是指實(shí)時(shí)采集能源信息,包括服務(wù)器功耗和溫度等能耗信息。這方面數(shù)據(jù)中心管理工具必須依賴于節(jié)點(diǎn)管理器,是節(jié)點(diǎn)管理器給管理平臺(tái)提供了準(zhǔn)確的功耗和溫度等信息。管控是指配置能源使用策略,管理服務(wù)器集群的功耗。用戶可以根據(jù)數(shù)據(jù)中心的情況,優(yōu)化并使用策略。這意味著在服務(wù)器上,用戶第一次有能力對(duì)服務(wù)器功耗使用策略。報(bào)表功能則通過(guò)對(duì)能源使用報(bào)表的分析,幫助用戶梳理能源消耗的時(shí)間、地點(diǎn)等信息。
英特爾數(shù)據(jù)中心管理平臺(tái)支持所有具備英特爾節(jié)點(diǎn)管理器并能夠通過(guò)基板管理控制器(BMC)發(fā)出英特爾節(jié)點(diǎn)管理器IPMI規(guī)范命令的原始設(shè)備制造商(OEM)平臺(tái)。該技術(shù)專門提供在不影響工作性能的同時(shí)進(jìn)行的服務(wù)器組能源管理。為了達(dá)到這一目標(biāo),英特爾數(shù)據(jù)中心管理平臺(tái)為每一臺(tái)獨(dú)立的服務(wù)器動(dòng)態(tài)調(diào)整能耗標(biāo)準(zhǔn)以適應(yīng)該服務(wù)器工作量的變化、使用率和由此改變的能源需求量。
總的來(lái)說(shuō),英特爾節(jié)點(diǎn)管理器加上英特爾數(shù)據(jù)中心管理平臺(tái),首先是幫助用戶節(jié)約能源,降低功耗。顯而易見,通過(guò)監(jiān)控、管理和報(bào)表功能,可以很好地幫助管理者們找到能耗的熱點(diǎn),并對(duì)熱點(diǎn)能耗進(jìn)行有效的管控。舉例來(lái)說(shuō),如果沒有對(duì)CPU溫度、頻率等信息進(jìn)行監(jiān)管,可能當(dāng)夜間服務(wù)器使用率降低時(shí),可服務(wù)器CPU還在高速運(yùn)行。
其次,可以增加機(jī)房和機(jī)架密度,節(jié)約空間。事實(shí)上,數(shù)據(jù)中心更多的情況不是空間受限制,而是能耗受限制。比如有時(shí)服務(wù)器放不滿機(jī)架,因?yàn)樘峁C(jī)架的能源、電源不夠。而通過(guò)數(shù)據(jù)中心管理平臺(tái),可以增加每個(gè)機(jī)架的密度,能源動(dòng)態(tài)分配,充分利用機(jī)架空間,增加機(jī)房和機(jī)架的密度。這從另一個(gè)方面也達(dá)到了節(jié)約能耗的目的。