浪潮天梭M13關(guān)鍵應用主機

分段內(nèi)存鏡像功能: 提高系統(tǒng)可用性的同時減少內(nèi)存資源浪費

內(nèi)存故障是引起系統(tǒng)停機的主要原因之,內(nèi)存鏡像功能(Memory Mirroring)是解決這一問題的重要手段。內(nèi)存鏡像功能是服務(wù)器上重要的RAS特性之一,指將服務(wù)器上的內(nèi)存分為兩個頻道,一個頻道是另一個頻道的鏡像,用來創(chuàng)建內(nèi)存的冗余副本,在主內(nèi)存數(shù)據(jù)發(fā)生錯誤時自動從鏡像內(nèi)存中讀取,從而確保整個系統(tǒng)的穩(wěn)定可靠。但此技術(shù)原則上需要犧牲整個系統(tǒng)一半的內(nèi)存容量為代價,這對于最高可配備48TB內(nèi)存容量的天梭M13來說無疑是難以接受的。

目前較新的Intel處理器已支持分段內(nèi)存鏡像技術(shù)(即部分內(nèi)存鏡像特征),利用此特性,天梭M13可在其搭載的關(guān)鍵應用系統(tǒng)K-UX(3.2或更高版本)中人為指定某塊區(qū)域作為鏡像,將關(guān)鍵核心數(shù)據(jù)放入鏡像內(nèi)存區(qū),以享受內(nèi)存鏡像功能帶來的高可用性,非關(guān)鍵數(shù)據(jù)所占內(nèi)存區(qū)域不做鏡像處理。這樣既保證了核心業(yè)務(wù)穩(wěn)定運行,又極大程度避免了內(nèi)存資源的浪費。

分段內(nèi)存鏡像功能如何實現(xiàn)?

分段內(nèi)存鏡像功能需要硬件支持,原理示意圖如下:

分段內(nèi)存鏡像功能硬件層面原理示意圖

如圖所示ch0的Region1和ch2的Region1被設(shè)置為內(nèi)存鏡像區(qū)域,其他Region沒有配置鏡像,(總內(nèi)存容量-內(nèi)存鏡像區(qū)域配置容量)即為OS實際可用內(nèi)存容量。

另外這一特性也需要OS層面支持,原理如下:

在NUMA架構(gòu)的服務(wù)器上,每個物理CPU為一個node,可以通過BIOS為每個node上配置分段j內(nèi)存鏡像區(qū)域,OS解析BIOS上傳的EFI內(nèi)存區(qū)域?qū)傩耘渲帽恚{(diào)整內(nèi)存管理區(qū)域,保證內(nèi)核關(guān)鍵數(shù)據(jù)使用的內(nèi)存分配在內(nèi)存鏡像區(qū)域,應用程序使用的內(nèi)存分配在非鏡像區(qū)域。如下圖所示:

分段內(nèi)存鏡像功能OS層面原理示意圖

對于一個由兩個node 組成的系統(tǒng),在每個node上都配有mirror 區(qū)域,OS將鏡像區(qū)域設(shè)置為normal,用于分配內(nèi)核數(shù)據(jù);非鏡像區(qū)域設(shè)置為movable,用于分配應用層數(shù)據(jù)。

K-UX 3.2及以上版本提供對分段內(nèi)存鏡像的支持。系統(tǒng)啟動時通過BIOS設(shè)置分段內(nèi)存鏡像區(qū)域,建議預留不低于內(nèi)存總?cè)萘康?/64作為內(nèi)存鏡像區(qū)域。操作系統(tǒng)默認關(guān)閉內(nèi)存鏡像特性,用戶可根據(jù)實際情況選擇配置操作系統(tǒng)內(nèi)存鏡像相關(guān)屬性。

浪潮關(guān)鍵應用主機天梭M13強大的高可用技術(shù),可以有效避免硬件故障、單點設(shè)備故障以及數(shù)據(jù)中心災害等各種情況對系統(tǒng)業(yè)務(wù)的影響,幫助客戶應對移動互聯(lián)時代對IT基礎(chǔ)設(shè)施帶來的挑戰(zhàn)。

分享到

zhangnn

相關(guān)推薦