圖:POWER的高級(jí)虛擬化技術(shù)
微分區(qū)技術(shù)
IBM的微分區(qū)源自大型主機(jī)技術(shù),是基于服務(wù)器虛擬化領(lǐng)域的二項(xiàng)主要突破:物理處理器和I/O設(shè)備的虛擬化。二項(xiàng)虛擬化都可實(shí)現(xiàn)分區(qū)對(duì)這類計(jì)算資源的共享。此外,還有其他眾多相關(guān)技術(shù),包括可精細(xì)調(diào)整的資源分配,更大分區(qū)數(shù)量的承載能力和更高資源利用效率。
新一代基于POWER 5 / 5+的服務(wù)器上的虛擬化是基于POWER 4的服務(wù)器上的分區(qū)模式的增強(qiáng)。
在基于POWER 4的服務(wù)器上,每個(gè)處理器只能被唯一地分配一個(gè)分區(qū)。因?yàn)楸环峙涞奶幚砥鞅晃ㄒ坏姆謪^(qū)占據(jù),所以跨分區(qū)的處理器共享是十分困難的,所以這些分區(qū)被稱作綁定分區(qū)(Dedicated Partition)。
在全新基于POWER 5 / 5+的系統(tǒng)中,微分區(qū)模式使單個(gè)物理處理器被“抽象”成多個(gè)虛擬處理器,并可分別進(jìn)行分配。虛擬處理器不能再被共享,但它們的根基?物理處理器則是共享的,因?yàn)檫@些物理處理器已經(jīng)在“平臺(tái)層面”進(jìn)行了虛擬化。這種“共享”是全新分區(qū)模式中最根本的特點(diǎn),并具備“自主運(yùn)算能力”。綁定有虛擬處理器的分區(qū)則被稱為共享處理器分區(qū)。
圖:p5服務(wù)器的微分區(qū)技術(shù)
必須強(qiáng)調(diào)的是虛擬化的“抽象”過程是由硬件和POWER Hypervisor(固件的一個(gè)組成部分)共同完成的。除非專門賦予一個(gè)操作系統(tǒng)區(qū)別物理和虛擬處理器的能力,否則從操作系統(tǒng)的角度來(lái)看,一個(gè)虛擬處理器和一個(gè)物理處理器是完全沒有區(qū)別的。在硬件/固件上實(shí)現(xiàn)分區(qū)最大的優(yōu)勢(shì)在于只要經(jīng)過很少甚至根本不需要進(jìn)行應(yīng)用移植,用戶就可以充分利用POWER 5 / 5+及其相關(guān)技術(shù)。此外,為達(dá)到更理想的性能表現(xiàn),還可以選擇進(jìn)一步增強(qiáng)操作系統(tǒng)的功能,實(shí)現(xiàn)對(duì)微分區(qū)技術(shù)的深度利用。例如當(dāng)系統(tǒng)處于空閑時(shí),系統(tǒng)會(huì)自主地將CPU的周期釋放給POWER Hypervisor,將資源供給需要的分區(qū)使用。全新推出的AIX 5L V5.3操作系統(tǒng)是第一個(gè)擁有此類功能的AIX 5L版本。
圖:AIX 5.3新增功能
系統(tǒng)管理員在設(shè)置和管理系統(tǒng)時(shí),在為一個(gè)分區(qū)指定虛擬處理器數(shù)量的同時(shí),也就相當(dāng)于為它指定虛擬處理器背后所支持的物理處理器數(shù)量和容量。所謂指定“容量”,是指系統(tǒng)管理員可以將一個(gè)物理處理器的部分計(jì)算能力分配給一個(gè)分區(qū),而不必受限于處理器物理上的單位和個(gè)數(shù)。
實(shí)現(xiàn)“更精細(xì)”分配處理器計(jì)算能力后,給定系統(tǒng)平臺(tái)就能被劃分成更多的分區(qū),所能同時(shí)支持的工作負(fù)荷也實(shí)現(xiàn)了最大化。雖然系統(tǒng)管理的通常做法是將眾多應(yīng)用裝在一個(gè)操作系統(tǒng)下,但絕大多數(shù)用戶出于性能表現(xiàn)和穩(wěn)定性方面的考慮,希望各個(gè)應(yīng)用或工作負(fù)荷間的干擾最小。面對(duì)這樣的需求,最好的解決辦法是將不同應(yīng)用或工作負(fù)荷放在完全分開的系統(tǒng)分區(qū)。較之傳統(tǒng)邏輯或物理分區(qū)系統(tǒng),共享處理器技術(shù)因?yàn)槟苤С指喾謪^(qū),使這樣的需求得以更好滿足。
該技術(shù)另一個(gè)重要方面就是能顯著提高物理處理器的利用率。有二點(diǎn)可以證明:
1. 在分區(qū)層面上,處理器的處理能力能得到更精細(xì)的分配,這主要是源于處理器可以更精細(xì)地進(jìn)行分配。
2. 分區(qū)上的操作系統(tǒng)具有主動(dòng)“上繳”計(jì)算能力的功能。當(dāng)一個(gè)分區(qū)沒有什么工作需要做的時(shí)候,系統(tǒng)管理程序(hypervisor)就會(huì)將處理器“上繳”的空閑計(jì)算能力分配給其他需要的地方。通過提高物理處理器的利用率,在系統(tǒng)平臺(tái)層面上有效降低了系統(tǒng)空閑時(shí)間。
從成本角度看,用戶現(xiàn)有UNIX系統(tǒng)的利用率常常只有10~25%,一味地通過增加服務(wù)器和處理器數(shù)量來(lái)滿足應(yīng)用,勢(shì)必使成本上升而收效甚微。而常見的分區(qū)技術(shù)往往是以大于或者等于1顆物理處理器為單位實(shí)現(xiàn)的,在實(shí)際應(yīng)用中這一界限有時(shí)并不夠精細(xì),尤其是隨著單位CPU的處理能力的不斷提高,就更是如此。
如果采用微分區(qū)技術(shù),效果將十分顯著。因?yàn)檫@意味著用戶在服務(wù)器整合中,不再需要買那么多的處理器及其處理能力,資源的劃分和共享也將更為精細(xì)。
虛擬I/O
I/O虛擬包括四項(xiàng)獨(dú)特的功能:
1) 虛擬以太網(wǎng)
2) 共享以太網(wǎng)適配器
3) 共享光纖通道適配器
4) 虛擬磁盤存儲(chǔ)器
圖:虛擬體系結(jié)構(gòu)(以p5 570為例)
通過共享網(wǎng)絡(luò)適配器和磁盤存儲(chǔ)器,用戶不再需要將它們一對(duì)一地綁定在邏輯分區(qū)上,而可以實(shí)現(xiàn)多個(gè)邏輯分區(qū)共享某個(gè)適配器或磁盤,這使得I/O模式更富有經(jīng)濟(jì)性。
用戶可以設(shè)置虛擬以太網(wǎng),從而搭建邏輯分區(qū)間的通信網(wǎng)絡(luò)。POWER Hypervisor充當(dāng)了符合IEEE標(biāo)準(zhǔn)的以太網(wǎng)交換,而各個(gè)邏輯分區(qū)的操作系統(tǒng)實(shí)現(xiàn)了虛擬以太網(wǎng)適配器。POWER Hypervisor以太網(wǎng)交換也使IEEE虛擬局域網(wǎng)機(jī)制能夠發(fā)揮作用。使用虛擬以太網(wǎng),用戶可以部署邏輯分區(qū)間的通信,這可在節(jié)省大量物理以太網(wǎng)適配器、擴(kuò)展空間和物理線路的同時(shí)提高通信帶寬。
要讓服務(wù)器內(nèi)部共享以太網(wǎng)及光纖通道適配器和虛擬磁盤存儲(chǔ)器,必須首先建立管理邏輯分區(qū)(Hosting LPAR)?;贏IX 5L操作系統(tǒng)的管理邏輯分區(qū)會(huì)被封裝起來(lái),用以簡(jiǎn)化系統(tǒng)管理。這些管理邏輯分區(qū)管理著物理的硬件資源,并將這些資源共享給眾多“客戶”邏輯分區(qū)。管理和“客戶”邏輯分區(qū)間的通信由一組系統(tǒng)管理程序(hypervisor)來(lái)實(shí)現(xiàn)。
二層數(shù)據(jù)包轉(zhuǎn)發(fā)器(Packet Forwarder)是實(shí)現(xiàn)物理以太網(wǎng)適配器共享的核心,它負(fù)責(zé)傳遞客戶邏輯分區(qū)和物理以太網(wǎng)適配器間的通信數(shù)據(jù)包。
向“客戶”邏輯分區(qū)分配和映射SAN LUN,實(shí)現(xiàn)了共享物理光纖通道。管理邏輯分區(qū)中的多路徑I/O軟件能保護(hù)管理邏輯分區(qū)和SAN存儲(chǔ)管理器間光纖通道的錯(cuò)誤。
管理分區(qū)中的AIX 5L 邏輯卷管理(LVM)實(shí)現(xiàn)了虛擬磁盤存儲(chǔ)器。系統(tǒng)中的磁盤卷將成為“客戶”邏輯分區(qū)的虛擬磁盤。管理邏輯分區(qū)同樣能有效實(shí)現(xiàn)SCSI目標(biāo)模式(SCSI Target Mode)
用戶能通過運(yùn)行多個(gè)I/O管理邏輯分區(qū)來(lái)提高系統(tǒng)可用性?!翱蛻簟边壿嫹謪^(qū)能運(yùn)行多路徑I/O軟件防止主機(jī)分區(qū)的錯(cuò)誤。
推動(dòng)“自主計(jì)算” 虛擬技術(shù)為客戶帶來(lái)價(jià)值
企業(yè)已經(jīng)迎來(lái)了快速成長(zhǎng)的時(shí)代,業(yè)務(wù)日趨復(fù)雜,辦公場(chǎng)所逐年增加,所有這些都給IT建設(shè)提出了更多挑戰(zhàn)。傳統(tǒng)的環(huán)境中,服務(wù)器數(shù)量將無(wú)序增長(zhǎng),應(yīng)用增加、重疊和互相干擾,又引致服務(wù)器數(shù)量的進(jìn)一步增加,形成惡性循環(huán),這無(wú)疑都導(dǎo)致IT管理成本呈現(xiàn)幾何級(jí)數(shù)增長(zhǎng)。要打破惡性循環(huán)鏈,實(shí)現(xiàn)自主計(jì)算,并大大簡(jiǎn)化IT基礎(chǔ)架構(gòu),虛擬化無(wú)疑是理想的選擇。
服務(wù)器整合和集中 隨著企業(yè)的發(fā)展,IT部門積累了各個(gè)時(shí)期運(yùn)行各種應(yīng)用的大大小小服務(wù)器,擁有邏輯分區(qū)能力的IBM p系列服務(wù)器在這樣的環(huán)境就大有用武之地,IBM p5系統(tǒng)的微分區(qū)技術(shù)更可大放光芒。通過微分區(qū)技術(shù),用戶將可以根據(jù)實(shí)際應(yīng)用的計(jì)算力需要,將基于POWER 5 / 5+處理器的系統(tǒng)劃分成大小不一的微分區(qū),實(shí)現(xiàn)虛擬微分區(qū)對(duì)現(xiàn)有物理服務(wù)器的完全取代。以單臺(tái)基于POWER 5 / 5+的p5系統(tǒng)取代數(shù)百臺(tái)小型服務(wù)器,實(shí)現(xiàn)服務(wù)器的整合和集中,微分區(qū)技術(shù)功不可末。
虛擬刀片服務(wù)器 IBM微分區(qū)技術(shù)可以在單臺(tái)p5系統(tǒng)上配置出數(shù)百片“低成本”的獨(dú)立虛擬刀片分區(qū),其效能與IA架構(gòu)刀片服務(wù)器環(huán)境相仿。在一個(gè)刀片環(huán)境中,獨(dú)立的刀片必須具有處理瞬間任務(wù)高峰的計(jì)算能力(比如奧運(yùn)網(wǎng)站的服務(wù)器)。但是一般來(lái)說,大多數(shù)刀片都沒有在其計(jì)算環(huán)境中發(fā)揮出應(yīng)有的計(jì)算效率??梢哉fIBM p5系統(tǒng)上的微分區(qū)和虛擬以太網(wǎng)技術(shù)就是為這種高密度計(jì)算環(huán)境而生,因?yàn)樵谕慌_(tái)基于POWER 5 / 5+的服務(wù)器上,由微分區(qū)所實(shí)現(xiàn)的虛擬刀片之間可以實(shí)現(xiàn)自主負(fù)載調(diào)度,從而提高系統(tǒng)效用;而虛擬以太網(wǎng)技術(shù)提供了虛擬刀片間低成本高速的通訊快車,其速度可以與系統(tǒng)總線媲美。
生產(chǎn)和批處理/測(cè)試系統(tǒng) 微分區(qū)技術(shù)為同一系統(tǒng)中共存的生產(chǎn)和測(cè)試系統(tǒng)提供了理想的運(yùn)行平臺(tái)。系統(tǒng)管理員可以給生產(chǎn)微分區(qū)劃撥應(yīng)用所需要的大量資源,并保證應(yīng)用系統(tǒng)能夠高速地運(yùn)行;同時(shí),管理員可以給測(cè)試微分區(qū)劃撥最少的指定資源,并允許他們獲得其他的空閑計(jì)算資源或計(jì)算周期。
互補(bǔ)的生產(chǎn)系統(tǒng)
在這樣的環(huán)境中,系統(tǒng)性能表現(xiàn)至關(guān)重要。用戶經(jīng)常能發(fā)現(xiàn),有時(shí)候其服務(wù)器間的工作負(fù)荷呈現(xiàn)這樣一種狀態(tài):當(dāng)一臺(tái)服務(wù)器的工作負(fù)荷正處于高峰時(shí),另一臺(tái)服務(wù)器的負(fù)荷恰好處于谷底,例如超市白天的交易服務(wù)器相當(dāng)繁忙,而結(jié)算服務(wù)器基本空閑。二者如果能實(shí)現(xiàn)互補(bǔ),將能極大提高系統(tǒng)效用。在這樣的環(huán)境下,動(dòng)態(tài)邏輯分區(qū)能在一定程度上解決這個(gè)問題,尤其是虛擬化所實(shí)現(xiàn)的微分區(qū)技術(shù)能夠瞬時(shí)在微分區(qū)間精細(xì)地調(diào)度計(jì)算力,大幅度提高系統(tǒng)的效用。