TT中國 發(fā)表于:13年11月20日 00:21 [轉(zhuǎn)載] DOIT.com.cn
圣誕節(jié)就快來臨了,在IT人員的愿望清單里,可靠的服務(wù)器必不可少。隨著虛擬化技術(shù)的出現(xiàn),一臺物理服務(wù)器承載了幾十個工作負(fù)載,對可靠性的需求就更加強(qiáng)烈,因為硬件故障與失敗的遷移都會導(dǎo)致服務(wù)器崩潰,那就麻煩了。
與服務(wù)器可靠性相關(guān)的技術(shù),如冗余電源供應(yīng)、內(nèi)存錯誤監(jiān)測與糾正都進(jìn)行得有點慢。需要識別、容納與解決故障條件的協(xié)議與行為花費太昂貴,而且橫跨所有層的交互操作并沒有廣泛的實施標(biāo)準(zhǔn)。本文介紹一些最新的工具,方便IT人士打造可靠的服務(wù)器。
存儲子系統(tǒng)可靠性
檢查奇偶校驗位與錯誤糾正碼ECC的技術(shù)可追溯到十多年前,較新的內(nèi)存熱備份與鏡像都也比較完善。當(dāng)然,隨著內(nèi)存數(shù)量與其重要性在服務(wù)器中伴隨著虛擬化蹭蹭上升,我們需要更強(qiáng)悍的內(nèi)存控制技術(shù)。
請求與巡視清除是ECC內(nèi)存的高級應(yīng)用。在請求清除中,系統(tǒng)可在運行期間糾正隨機(jī)或偶然的ECC閱讀錯誤。巡視清除可積極主動地定位并糾結(jié)系統(tǒng)內(nèi)存中的錯誤。如果這些行動對于修復(fù)內(nèi)存錯誤還不管用,那么就意味著永久性故障。潛在的永久性故障觸發(fā)彈性功能,如使用鏡像內(nèi)存模式拖拽數(shù)據(jù)。有些系統(tǒng)會將失敗位置打上標(biāo)簽,防止今后使用有問題的內(nèi)存。
EEC只能在任何內(nèi)存位置上糾正單位錯誤,如果是其他高級錯誤就得用上其他技術(shù)。如單臺設(shè)備數(shù)據(jù)糾正器SDDC或高級ECC,其結(jié)合ECC模式在單個內(nèi)存芯片里糾正多位內(nèi)存錯誤。通過比較,雙設(shè)備數(shù)據(jù)糾正器DDDC可讓服務(wù)器抵御兩個內(nèi)存芯片上同時發(fā)生的多位錯誤。增強(qiáng)型的DDDC或DDDC+1能在此基礎(chǔ)上發(fā)現(xiàn)并糾正額外的單位錯誤。這些技術(shù)解決了范圍更廣的內(nèi)存小故障,預(yù)防共工作負(fù)載崩潰。
內(nèi)存鏡像通過提供DIMM保護(hù)內(nèi)存,對內(nèi)存內(nèi)容進(jìn)行同步化的復(fù)制。當(dāng)監(jiān)測到有內(nèi)存故障,系統(tǒng)交換到鏡像副本,直到替換出故障的DIMM。市面上的新款服務(wù)器支持局部內(nèi)存鏡像:只對任務(wù)關(guān)鍵工作負(fù)載所用服務(wù)器部分內(nèi)存進(jìn)行鏡像。顯然,這是降低成本的一種方式。
處理器子系統(tǒng)可靠性
服務(wù)器可靠性最大的威脅是在于當(dāng)內(nèi)存或處理器故障傳達(dá)到系統(tǒng),并且在工作負(fù)載之間傳遞。數(shù)據(jù)遏制模式識別一個或多個內(nèi)存位置有錯誤,預(yù)防其他進(jìn)程繼續(xù)使用。例如在發(fā)生不可糾正錯誤時,過濾模式阻止系統(tǒng)將網(wǎng)絡(luò)數(shù)據(jù)移動到PCIe總線,隔離服務(wù)器,阻止任何意外的網(wǎng)絡(luò)數(shù)據(jù)傳輸?shù)接脩艋蚱渌⻊?wù)器那去。
服務(wù)器使用處理器清除,將工作負(fù)載從有錯的處理器核心無縫遷移到空閑的核心。有錯的處理器就一直空閑著,直到解決了錯誤問題。至于內(nèi)存清除,處理器清除只能在你的服務(wù)器有空余核心時才能發(fā)揮效用,所以對于利用率高的主機(jī)來說不太方便,因為無法忍受宕機(jī)時間。如果你的服務(wù)器使用插座禁用功能,它甚至可以啟動一個有故障的處理器。
可靠性服務(wù)器的其他功能
過去,服務(wù)器故障會導(dǎo)致關(guān)閉整個系統(tǒng),修復(fù)有錯的設(shè)備。某些服務(wù)器現(xiàn)在包括熱添加或熱插拔功能,所有在服務(wù)器運行期間,有相關(guān)技術(shù)能升級或替換核心組件,如CPU、DIMM、PCIe卡等。
熱添加是電氣工程的、BIOS和操作系統(tǒng)智能的結(jié)晶。某些操作系統(tǒng),如Windows Server 2008 R2、Red Hat Enterprise Linux 6與SUSE Linux Enterprise Server 11,可在服務(wù)器運行期間識別新資源并加以配置。
公司簡介 | 媒體優(yōu)勢 | 廣告服務(wù) | 客戶寄語 | DOIT歷程 | 誠聘英才 | 聯(lián)系我們 | 會員注冊 | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.