“虛擬”是新千年里最為流行的詞語,人們常常會(huì)接觸到虛擬現(xiàn)實(shí)、虛擬醫(yī)院、虛擬圖書館、虛擬大學(xué)等等。還有虛擬的寵物、虛擬博物館、虛擬角色、虛擬……

    虛擬,《美國傳統(tǒng)辭典(雙解)》的解釋是雖然沒有實(shí)際的事實(shí)、形式或名義,但在實(shí)際上或效果上存在或產(chǎn)生的。

    在信息技術(shù)領(lǐng)域,數(shù)據(jù)存儲(chǔ)是最早應(yīng)用虛擬這個(gè)概念的。早在十幾年前存儲(chǔ)系統(tǒng)就被描述為虛擬磁盤機(jī)。隨后針對磁盤組或者多個(gè)磁盤條帶的邏輯卷管理、虛擬磁帶機(jī)和虛擬磁帶也陸續(xù)進(jìn)入應(yīng)用領(lǐng)域。虛擬在存儲(chǔ)領(lǐng)域的發(fā)展目標(biāo)就是虛擬在線存儲(chǔ)。

    什么是虛擬存儲(chǔ)呢?單純從虛擬的概念上來講,對一個(gè)對象的虛擬就是創(chuàng)建一個(gè)新的對象使其具備其源對象的重要屬性和特征,而不是源對象的完全的“拷貝”。那么存儲(chǔ)設(shè)備的公共基本特征是什么呢?標(biāo)準(zhǔn)的數(shù)據(jù)存儲(chǔ)設(shè)備包括了磁盤、磁帶、磁帶機(jī)等。它們公共的本質(zhì)特點(diǎn)就是能夠永久地保存數(shù)據(jù),并保障數(shù)據(jù)能夠被用戶調(diào)用。其它的非公共特征還包括了設(shè)備的大小、能量消耗、性能指標(biāo)、存儲(chǔ)容量等。這些特征根據(jù)設(shè)備的不同而不同,單是其公共特征并沒有隨著設(shè)備不同而改變。因此虛擬存儲(chǔ)就是整合各種存儲(chǔ)物理設(shè)備為一整體,提供永久保存數(shù)據(jù)并提供能被用戶調(diào)用的功能,即在公共控制平臺(tái)下存儲(chǔ)設(shè)備的一個(gè)集合體。

    虛擬存儲(chǔ)設(shè)備在物理上并不村在,它只是在計(jì)算機(jī)中表現(xiàn)出同類物理存儲(chǔ)設(shè)備的特性,并按照這些特性相應(yīng)I/O請求。用戶的數(shù)據(jù)操作在虛擬存儲(chǔ)設(shè)備上完成,并不需要關(guān)心后臺(tái)實(shí)際的物理設(shè)備是什么,如何組織等等。任何種類的計(jì)算機(jī)存儲(chǔ)設(shè)備和數(shù)據(jù)對象都可以被虛擬。下圖描述了SNIA(存儲(chǔ)網(wǎng)絡(luò)工業(yè)協(xié)會(huì))制定的虛擬存儲(chǔ)和數(shù)據(jù)對象分類。圖中第一行表示了虛擬的對象,中間表示在系統(tǒng)的那一層實(shí)現(xiàn)虛擬化,底層表示虛擬的具體技術(shù)選擇。在本文后面將詳細(xì)闡述每一層次的內(nèi)容。



    虛擬存儲(chǔ)的意義

    數(shù)據(jù)存儲(chǔ)設(shè)備用戶基本上都是從性能、可用性、價(jià)格和易于管理幾個(gè)方面評測存儲(chǔ)設(shè)備。虛擬存儲(chǔ)在這四個(gè)方面都能有效地提升存儲(chǔ)系統(tǒng)的性能。

    I/O 性能:數(shù)據(jù)訪問和傳輸速度越來越多地決定了計(jì)算機(jī)應(yīng)用的質(zhì)量。比如說,如果數(shù)據(jù)不能夠按照視頻媒體播放器的要求速度傳遞到客戶端,那么視頻點(diǎn)播系統(tǒng)就不可能實(shí)現(xiàn);如果信用卡數(shù)據(jù)庫信息不能夠及時(shí)更新,那么整個(gè)金融服務(wù)體系將會(huì)陷入混亂。虛擬技術(shù)可以通過“Stripe”實(shí)現(xiàn)數(shù)據(jù)地址在多個(gè)存儲(chǔ)設(shè)備上帶狀分布和拆分實(shí)現(xiàn)并行的讀寫,最終達(dá)到整個(gè)存儲(chǔ)系統(tǒng)面向應(yīng)用的整體I/O性能的提高。

    可用性:信息化的社會(huì)越來越要求信息系統(tǒng)能夠在7*24的條件下保持在線狀態(tài)。系統(tǒng)故障引起的應(yīng)用服務(wù)的不順暢給企業(yè)和個(gè)人帶來的損失和不便將越來越不能容忍,尤其是在重要的部門和行業(yè),如能源、交通、公共安全、金融等,數(shù)據(jù)的價(jià)值已經(jīng)不能夠估量。他們對存儲(chǔ)系統(tǒng)得可用性的要求比以往更高。虛擬技術(shù)可以通過鏡像技術(shù)實(shí)現(xiàn)對單一數(shù)據(jù)在多個(gè)存儲(chǔ)介質(zhì)上創(chuàng)建副本防止因個(gè)別存儲(chǔ)介質(zhì)的損壞對整個(gè)系統(tǒng)得影響,確保系統(tǒng)的高可用性。

    存儲(chǔ)容量成本:著磁盤存儲(chǔ)設(shè)備的價(jià)格降低,在各個(gè)領(lǐng)域存儲(chǔ)系統(tǒng)的消費(fèi)不斷增加。但是由于對數(shù)據(jù)安全的要求的不斷提高,鏡像和遠(yuǎn)程數(shù)據(jù)復(fù)制遷移形式的虛擬存儲(chǔ)應(yīng)用增加更為迅速。從而存儲(chǔ)容量成本依舊是一個(gè)重要的衡量因素。虛擬技術(shù)可以通過聚合多個(gè)存儲(chǔ)設(shè)備的空間和根據(jù)不同服務(wù)器需要重新部署存儲(chǔ)空間的分配實(shí)現(xiàn)現(xiàn)有存儲(chǔ)空間的高利用率,避免不必要的設(shè)備開支。

    可管理性:目前的普遍的信息技術(shù)應(yīng)用都存在著隨著系統(tǒng)復(fù)雜度的增加系統(tǒng)管理開銷遞增,以及由于系統(tǒng)管理原因造成的錯(cuò)誤率的遞增。一般來講,管理成本已經(jīng)達(dá)到了設(shè)備成本的5到10倍。因此管理開銷也是對系統(tǒng)評估的一個(gè)重要的指標(biāo)。高度集成,一體化的管理是最為理想的管理模式。虛擬技術(shù)可以將多個(gè)小設(shè)備整合成一個(gè)大設(shè)備,來降低直接被管理的設(shè)備數(shù)量。由此,提高了容錯(cuò)能力,降低故障率和恢復(fù)次數(shù)。

    虛擬存儲(chǔ)除了在以上四個(gè)作為存儲(chǔ)系統(tǒng)基本的評估指標(biāo)發(fā)揮積極作用外,在現(xiàn)實(shí)應(yīng)用中,通過虛擬技術(shù)在如下十個(gè)方面體現(xiàn)了高效能的存儲(chǔ)系統(tǒng)應(yīng)用價(jià)值:

    1. 提高存儲(chǔ)空間利用率:虛擬化存儲(chǔ)可以提高40%至50%的空間利用率,尤其是在為遠(yuǎn)端設(shè)置鏡像存儲(chǔ)時(shí)更加體現(xiàn)優(yōu)勢。

    2. 災(zāi)難恢復(fù):在沒有虛擬存儲(chǔ)前,數(shù)據(jù)復(fù)制遷移只能在對稱的磁盤陣列或主機(jī)間進(jìn)行。通過虛擬技術(shù),復(fù)制遷移和鏡像可以在不對稱的設(shè)備間部署,不必要在容災(zāi)恢復(fù)端準(zhǔn)備一個(gè)與主站同樣的主機(jī)或者磁盤陣列。

    3. 快速備份:通過文件系統(tǒng)得快照技術(shù),虛擬存儲(chǔ)系統(tǒng)可以避免由于在應(yīng)用服務(wù)器代理軟件和備份服務(wù)器的通訊產(chǎn)生的瓶頸。由于備份將給予快照,備份窗口可以任意選擇,不受時(shí)間限制。

    4. 數(shù)據(jù)移植:大部分的磁盤廠商都提供了特有的工具幫助在其自有平臺(tái)的磁盤間移植數(shù)據(jù)。虛擬存儲(chǔ)可是簡單地實(shí)現(xiàn)在不同平臺(tái)間的數(shù)據(jù)復(fù)制遷移。

    5. 自動(dòng)化的空間擴(kuò)充:在綜合的虛擬化系統(tǒng)中,預(yù)制的管理策略在分配給某個(gè)用戶,如數(shù)據(jù)庫,的存儲(chǔ)空間用盡時(shí)自動(dòng)調(diào)整空間分配為其擴(kuò)容。

    6. 在線基于磁盤的恢復(fù):基于廉價(jià)的SATA陣列整合,管理員可以通過虛擬存儲(chǔ)的快照功能在線地將系統(tǒng)恢復(fù)至錯(cuò)誤發(fā)生前最近的時(shí)間點(diǎn)。

    7. 服務(wù)應(yīng)用程序測試:通過虛擬存儲(chǔ),某些給予實(shí)際數(shù)據(jù)環(huán)境的應(yīng)用測試不必?fù)?dān)心會(huì)破壞重要數(shù)據(jù)資源。虛擬系統(tǒng)可以通過復(fù)制遷移,為測試提供一個(gè)安全的數(shù)據(jù)平臺(tái)。

    8. 提高數(shù)據(jù)庫性能:虛擬系統(tǒng)將數(shù)據(jù)庫的hot files動(dòng)態(tài)地置于某個(gè)solid-state磁盤上可以提高昂貴的solid-state磁盤的使用效率。

    9. 高可用性:虛擬系統(tǒng)將IT系統(tǒng)的存儲(chǔ)和服務(wù)切實(shí)地分離開來,一方面可以有效地單獨(dú)對數(shù)據(jù)進(jìn)行保護(hù),在存儲(chǔ)內(nèi)部后臺(tái)建立起容錯(cuò)機(jī)制;另一方面,也杜絕了應(yīng)用端的錯(cuò)誤對數(shù)據(jù)端的影響。

    10. 在不同服務(wù)器平臺(tái)間的有效資源共享:在一般的SAN中,Windows和UNIX的平臺(tái)間數(shù)據(jù)共享和共存一直都是一個(gè)大問題。目前的SAN通過虛擬技術(shù)可以支持多文件系統(tǒng)在相同SAN中的共存。

    虛擬存儲(chǔ)的實(shí)現(xiàn)

    如SNIA的虛擬存儲(chǔ)的分類所示,一般把虛擬分成如下三類:基于主機(jī)或服務(wù)器的虛擬化、基于磁盤或磁盤子系統(tǒng)的虛擬化和基于網(wǎng)絡(luò)的虛擬化。

    基于主機(jī)層的虛擬化:

    基于主機(jī)(應(yīng)用服務(wù)器)上的虛擬化一般通過運(yùn)行在存儲(chǔ)管理軟件加以實(shí)現(xiàn)。一般常見的管理軟件如邏輯卷管理軟件(LVM)。邏輯卷,一般也會(huì)用來指代虛擬磁盤,其實(shí)質(zhì)是通過邏輯單元號(LUN)在若干個(gè)物理磁盤上建立起邏輯關(guān)系。邏輯單元號,Logical Unit Number(LUN),是在一個(gè)基于SCSI的標(biāo)志符,用于區(qū)分在磁盤或磁盤陣列上的邏輯單元。

    基于主機(jī)的虛擬化中,管理軟件的作用就是向系統(tǒng)輸出一個(gè)單獨(dú)的虛擬存儲(chǔ)設(shè)備(或者可以說一個(gè)虛擬存儲(chǔ)池),事實(shí)上這個(gè)虛擬的存儲(chǔ)設(shè)備后臺(tái)有若干個(gè)獨(dú)立的存儲(chǔ)設(shè)備組成,只不過在系統(tǒng)看來他們是一個(gè)有機(jī)的整體。通過這種模式,用戶不需要直接去控制管理這些獨(dú)立的物理存儲(chǔ)設(shè)備。當(dāng)存儲(chǔ)空間不夠的時(shí)候,管理軟件會(huì)從空閑的磁盤空間中映像更多的空間輸出給系統(tǒng),而系統(tǒng)看來它所使用的虛擬存儲(chǔ)設(shè)備的空間在動(dòng)態(tài)的增加,并沒有影響到它的使用。由此可見,基于主機(jī)的虛擬化可以使系統(tǒng)在存儲(chǔ)空間調(diào)整過程中仍然保持在線狀態(tài)。另外一個(gè)優(yōu)勢體現(xiàn)在,通過虛擬可以實(shí)現(xiàn)主機(jī)上存儲(chǔ)設(shè)備并行使用。但是,由于基于主機(jī)的虛擬實(shí)通過軟件完成,因此會(huì)消耗系統(tǒng)CPU的使用周期,容易造成主機(jī)的性能瓶頸。同時(shí),在每個(gè)主機(jī)上的虛擬化需要為每個(gè)主機(jī)單獨(dú)安裝軟件,從某種意義上講也就降低了系統(tǒng)的可靠性。

    基于存儲(chǔ)設(shè)備和存儲(chǔ)子系統(tǒng)的虛擬化:

    虛擬化技術(shù)也可以在存儲(chǔ)設(shè)備內(nèi)部或存儲(chǔ)子系統(tǒng)內(nèi)部加以實(shí)現(xiàn)。比如說磁盤陣列就是通過磁盤陣列內(nèi)部的控制系統(tǒng)進(jìn)行的虛擬,同時(shí)也可以在多個(gè)磁盤陣列間構(gòu)建一個(gè)存儲(chǔ)池。這種基于存儲(chǔ)設(shè)備或存儲(chǔ)子系統(tǒng)的虛擬通過特定的算法或者映射表把邏輯存儲(chǔ)單元映射到物理設(shè)備之上。最終實(shí)現(xiàn)的就是卷獨(dú)立于其所屬的存儲(chǔ)設(shè)備。根據(jù)采用的方案不同,RAID、鏡像、盤到盤的復(fù)制以及基于時(shí)間的快照都采用了此類虛擬化。通過虛擬化,虛擬磁帶庫、虛擬光盤庫等都得以在存儲(chǔ)子系統(tǒng)中加以實(shí)現(xiàn)。

    與基于主機(jī)的虛擬化不同,基于存儲(chǔ)設(shè)備和存儲(chǔ)子系統(tǒng)的虛擬化對其后臺(tái)所使用的具體硬件的兼容性要求很高,需要參數(shù)相互匹配,因此在存儲(chǔ)設(shè)備升級和擴(kuò)容過程中需要受到某些限制。但是在存儲(chǔ)子系統(tǒng)上的虛擬可以將存儲(chǔ)和主機(jī)獨(dú)立起來,不會(huì)過多地占用主機(jī)的資源,其積極意義就是可以使主機(jī)將其資源有效地運(yùn)用在應(yīng)用服務(wù)上,消極意義就是很難和主機(jī)進(jìn)行一體化管理,需要額外的管理開銷。

    基于網(wǎng)絡(luò)的虛擬化:

    基于網(wǎng)絡(luò)的虛擬化是近來存儲(chǔ)工業(yè)的一個(gè)發(fā)展方向。與基于主機(jī)和存儲(chǔ)子系統(tǒng)的虛擬化不同,基于網(wǎng)絡(luò)的虛擬化功能是在網(wǎng)絡(luò)內(nèi)部完成的。這個(gè)網(wǎng)絡(luò)就是我們常常指的存儲(chǔ)局域網(wǎng)絡(luò)(SAN)。具體的虛擬功能的實(shí)現(xiàn)可以在交換機(jī)、路由器、存儲(chǔ)服務(wù)器進(jìn)行,同時(shí)也支持帶內(nèi)(in-band)或者帶外(out-of-band)的虛擬。

    帶內(nèi)虛擬

    帶內(nèi)虛擬,常常也稱作對稱虛擬(Symmetric),是在應(yīng)用服務(wù)器和存儲(chǔ)的數(shù)據(jù)通路內(nèi)部得以實(shí)現(xiàn)。在標(biāo)準(zhǔn)的設(shè)置中,在存儲(chǔ)服務(wù)器上運(yùn)行的虛擬軟件允許控制數(shù)據(jù)(metadata)和需存儲(chǔ)的實(shí)際數(shù)據(jù)在相同的數(shù)據(jù)通路內(nèi)傳遞。存儲(chǔ)服務(wù)器接受來自主機(jī)的數(shù)據(jù)請求,隨后存儲(chǔ)服務(wù)器會(huì)在其后臺(tái)的存儲(chǔ)設(shè)備中搜索數(shù)據(jù)(被請求的數(shù)據(jù)可能分布于多個(gè)存儲(chǔ)設(shè)備中)。當(dāng)數(shù)據(jù)被找到后,存儲(chǔ)服務(wù)器將數(shù)據(jù)傳送給主機(jī),完成一次完整地請求響應(yīng)。在用戶看來,帶內(nèi)虛擬存儲(chǔ)服務(wù)器好像是直接附屬在主機(jī)上的一個(gè)存儲(chǔ)設(shè)備(或子系統(tǒng))。

    帶內(nèi)虛擬存儲(chǔ)具有很強(qiáng)的協(xié)同工作能力,同時(shí)可以通過集中的管理界面進(jìn)行控制。同時(shí),帶內(nèi)虛擬可以保障系統(tǒng)的安全性,比如說,攻擊SAN系統(tǒng)的黑客很難有效地訪問存儲(chǔ)系統(tǒng),除非他得到了和主機(jī)一樣的卷分配方式。在服務(wù)器層面看,帶內(nèi)存儲(chǔ)容易產(chǎn)生性能瓶頸。盡管許多銷售商們在系統(tǒng)中加入了緩存機(jī)制來縮小延遲,但是響應(yīng)時(shí)間依舊是在部署帶內(nèi)虛擬存儲(chǔ)的一個(gè)重要考慮因素。目前,大部分的產(chǎn)品所采用的都是帶內(nèi)虛擬。



    帶外虛擬:

    帶外虛擬,又叫做不對稱虛擬(Asymmetric),是在數(shù)據(jù)通路外的存儲(chǔ)服務(wù)器上實(shí)現(xiàn)的虛擬功能??刂茢?shù)據(jù)(metadata)和存儲(chǔ)數(shù)據(jù)在不同的數(shù)據(jù)通路上傳輸。一般情況下,metadata存放在使用單獨(dú)通路連接到應(yīng)用服務(wù)器的存儲(chǔ)服務(wù)器上,而存儲(chǔ)數(shù)據(jù)在另外的通路中傳遞(或者直接通過存儲(chǔ)網(wǎng)絡(luò)在服務(wù)器和存儲(chǔ)設(shè)備間傳遞)。帶外虛擬減少了網(wǎng)絡(luò)中的數(shù)據(jù)流量。但是一般需要在主機(jī)端安裝客戶軟件,也容易受到攻擊。

    還有一些廠商在交換機(jī)和路由器上的固件或軟件實(shí)現(xiàn)虛擬功能。還有的通過附屬在交換機(jī)上的服務(wù)器得以實(shí)現(xiàn)虛擬。他們的基本原理就是盡量將虛擬的職能轉(zhuǎn)移到網(wǎng)絡(luò)層。交換機(jī)和路由器處于主機(jī)和存儲(chǔ)網(wǎng)絡(luò)的數(shù)據(jù)通路上,它們在中途可以截獲主機(jī)發(fā)往存儲(chǔ)系統(tǒng)的指令,并加以處理。  



    基于交換機(jī)或路由器的虛擬技術(shù):

    盡管基于交換機(jī)或路由器的虛擬技術(shù)還屬于起步階段,但是在未來也有可能發(fā)展成為替代目前的基于存儲(chǔ)服務(wù)器的虛擬技術(shù)。基于交換機(jī)或路由器的虛擬技術(shù)的優(yōu)勢就是不需要在主機(jī)上安裝任何代理軟件,交換設(shè)備潛在的處理能力可能會(huì)比傳統(tǒng)的模式提供更強(qiáng)的性能,不過這一切還有待發(fā)展?;诮粨Q機(jī)或路由器的虛擬技術(shù)的另一個(gè)優(yōu)勢體現(xiàn)在安全性上,該層次比前面的虛擬應(yīng)用對外來的攻擊有更強(qiáng)的防護(hù)。其劣勢主要表現(xiàn)在單個(gè)交換機(jī)和路由器容易成為整個(gè)系統(tǒng)的瓶頸和故障點(diǎn)。

    幾種常見的虛擬存儲(chǔ)

    虛擬磁盤和塊:

    磁盤和塊虛擬是目前普遍使用的虛擬存儲(chǔ)技術(shù)。磁盤機(jī)的虛擬一般通過物理磁盤機(jī)上的固件實(shí)現(xiàn)。塊虛擬是通過控制軟件為系統(tǒng)提供一個(gè)類似于磁盤機(jī)的虛擬設(shè)備,這個(gè)虛擬設(shè)備構(gòu)建于一個(gè)或者多個(gè)物理磁盤機(jī)之上。控制軟件向下協(xié)調(diào)所管理的物理磁盤設(shè)備的工作,完成系統(tǒng)和具體物理設(shè)備間的地址映像,性能平衡,以及一些其他的后臺(tái)數(shù)據(jù)保護(hù)機(jī)制;向上對系統(tǒng)提供一個(gè)虛擬的塊設(shè)備,系統(tǒng)無需關(guān)心具體的某個(gè)物理磁盤的管理和操作。塊虛擬技術(shù)已經(jīng)廣泛地應(yīng)用于RAID系統(tǒng)和虛擬的卷管理系統(tǒng)里面,隨著網(wǎng)絡(luò)存儲(chǔ)的發(fā)展,也被廣泛使用在網(wǎng)絡(luò)存儲(chǔ)系統(tǒng)中。與物理的磁盤機(jī)一樣,虛擬的塊設(shè)備也包括了若干的塊,數(shù)據(jù)可以在其上離散地或者連續(xù)地讀寫。但是在物理上并不存在著這樣一個(gè)設(shè)備,只不過在系統(tǒng)中看上去去管理軟件為系統(tǒng)提供了一個(gè)磁盤機(jī)而已,對系統(tǒng)應(yīng)用程序的讀寫請求的響應(yīng)和真實(shí)的物理磁盤機(jī)一樣。虛擬磁盤成功的重要原因就是不必修改應(yīng)用程序就可以使用。任何軟件,只要能夠運(yùn)行在物理磁盤上穩(wěn)定運(yùn)行,就可以在虛擬塊設(shè)備上運(yùn)行。

    虛擬文件系統(tǒng):

    一般來講,文件系統(tǒng)的虛擬可以通過兩種方式實(shí)現(xiàn)。遠(yuǎn)端的文件服務(wù)器上的文件系統(tǒng)可以被客戶端應(yīng)用程序感知并在客戶端計(jì)算機(jī)上使用。隨著不斷的發(fā)展,新的技術(shù)使單個(gè)文件服務(wù)器同時(shí)支持多種文件系統(tǒng)。不論上述任何方式,應(yīng)用程序在訪問文件的時(shí)候再也不需要關(guān)心文件具體的物理存儲(chǔ)位置,本地或異地。同時(shí)系統(tǒng)管理員的工作也得到了簡化,僅僅通過控制文件存儲(chǔ)服務(wù)器就可以完成多個(gè)應(yīng)用程序和應(yīng)用服務(wù)器的文件數(shù)據(jù)管理。

    虛擬文件:

    等級式存儲(chǔ)管理軟件可以在一個(gè)文件系統(tǒng)內(nèi)通過透明地移植非經(jīng)常性訪問文件到低速或者離線的存儲(chǔ)設(shè)備上實(shí)現(xiàn)對文件的虛擬。通過這種方式,更加有效地自動(dòng)化地實(shí)現(xiàn)信息生命周期管理的具體操作,并能夠降低在線存儲(chǔ)對空間的需求,提高備份的自動(dòng)化和使用效率。

    虛擬磁帶介質(zhì):

    由于磁帶具有順序讀些的特性,在應(yīng)用中磁帶一直有著不可克服的問題。比如,刪除磁帶中的某些文件,就會(huì)在磁帶中產(chǎn)生某些不可用的間隙,因此導(dǎo)致了在具體應(yīng)用過程中僅對某些特定的單一數(shù)據(jù)集在單個(gè)磁帶上保存,降低了磁帶的使用效率。為了解決這個(gè)問題,大多數(shù)存儲(chǔ)產(chǎn)品采用了在線存儲(chǔ)空間作為緩存,用以模擬磁帶媒體庫進(jìn)行備份和其他的應(yīng)用。通過磁盤緩沖存儲(chǔ)磁帶數(shù)據(jù)大大地提高了介質(zhì)的利用效率,減少了不必要的在磁帶mount,unmount,重新定位等重復(fù)操作的時(shí)間消耗。從設(shè)備價(jià)格角度講,也降低了磁帶機(jī)硬件和磁帶介質(zhì)的需求量,以及管理他們的開銷。

    磁帶介質(zhì)的虛擬可以提高備份性能的可控性。大多數(shù)備份策略的缺陷就是在于磁帶機(jī)的性能。傳統(tǒng)的備份很難做到運(yùn)行平順,數(shù)據(jù)流的不穩(wěn)定導(dǎo)致了磁帶機(jī)反復(fù)地暫停和重新定位,尤其是這一系列操作基于網(wǎng)絡(luò)進(jìn)行的時(shí)候。用磁盤來虛擬磁帶作為緩沖可以保障磁帶機(jī)在備份過程中的運(yùn)轉(zhuǎn)順暢。

    虛擬磁帶機(jī):

    存儲(chǔ)網(wǎng)絡(luò)的發(fā)展促進(jìn)了虛擬磁帶機(jī)的誕生。通過虛擬磁帶機(jī)可以使一組磁帶機(jī)簡便地在多個(gè)服務(wù)器間實(shí)現(xiàn)共享。其最大的使用價(jià)值就是在實(shí)際應(yīng)用中,每個(gè)服務(wù)器只有在進(jìn)行備份的短暫時(shí)間內(nèi)才會(huì)使用磁帶機(jī)。為每臺(tái)服務(wù)器配備專用的磁帶機(jī)在大部分時(shí)間都是處于空閑狀態(tài)。如果能夠?qū)⒚總€(gè)應(yīng)用服務(wù)器所屬數(shù)據(jù)的備份時(shí)間交錯(cuò)開來,那么連接于網(wǎng)絡(luò)存儲(chǔ)設(shè)備上的磁帶機(jī)就可以將其使用權(quán)在不同的服務(wù)器間傳遞。通過這種方式提高了磁帶機(jī)的使用效率。這種模式的虛擬磁帶機(jī)一般通過備份服務(wù)器和專用的存儲(chǔ)網(wǎng)絡(luò)交換機(jī)上的分布式軟件實(shí)現(xiàn)。另外一種虛擬磁帶機(jī)可以在后臺(tái)將不同種類的物理磁帶機(jī)進(jìn)行整合,形成一個(gè)磁帶機(jī)類型轉(zhuǎn)換庫,無論采用何種物理磁帶機(jī),在前臺(tái)向系統(tǒng)提供一個(gè)單一種類的磁帶機(jī),提高系統(tǒng)得適應(yīng)性,簡化了系統(tǒng)管理配置的工作。

    第三種虛擬帶機(jī)的工作原理和虛擬塊設(shè)備類似,由兩個(gè)或者多個(gè)磁帶機(jī)組成磁帶機(jī)陣列,向系統(tǒng)輸出一個(gè)虛擬的磁帶機(jī)。通過這種方式可以增加整個(gè)磁帶系統(tǒng)的讀寫性能和數(shù)據(jù)可用性。同時(shí)可以組成類似于RAID5的冗余存儲(chǔ)模式,一般稱作Redundant Array of Independent Tapes(RAIT)。

    虛擬磁帶庫:

    磁盤價(jià)格的降低帶動(dòng)了基于磁盤介質(zhì)的存儲(chǔ)應(yīng)用的發(fā)展。整合虛擬磁帶技術(shù)和虛擬磁盤機(jī)技術(shù),以磁盤介質(zhì)作為物理媒介建立起一套虛擬的磁帶庫,在系統(tǒng)的在線存儲(chǔ)系統(tǒng)和離線存儲(chǔ)系統(tǒng)(物理磁帶庫)之間提供一個(gè)大的緩沖。虛擬磁帶庫可以將數(shù)據(jù)使用頻度的劃分更加有層次性,一方面可以提高數(shù)據(jù)備份和恢復(fù)的速度,另一方面整個(gè)系統(tǒng)具備更加富有彈性的備份策略。

    WORM

    在計(jì)算機(jī)存儲(chǔ)媒介中,WORM(單次寫入,多次讀取)是為了保障一些數(shù)據(jù)寫入盤片后,防止被修改和刪除,比如一些歸檔信息。長期以來,CD和DVD作為標(biāo)準(zhǔn)的WORM介質(zhì)廣泛地使用。眾所周知,與磁帶一樣,CD和DVD也存在著標(biāo)準(zhǔn)化的問題,目前存在著多種存儲(chǔ)格式標(biāo)準(zhǔn),相互間的兼容性很差。和虛擬磁帶技術(shù)類似,通過虛擬技術(shù),可以實(shí)現(xiàn)多個(gè)應(yīng)用服務(wù)器共享一個(gè)或一組WROM設(shè)備進(jìn)行歸檔管理,也可以實(shí)現(xiàn)應(yīng)用服務(wù)器通過公共的虛擬接口使用多種采用不同標(biāo)準(zhǔn)的WROM設(shè)備,另外就是可以實(shí)現(xiàn)基于磁盤介質(zhì)的WROM設(shè)備。 

    版本文件系統(tǒng):

    版本文件系統(tǒng)是一般的虛擬文件系統(tǒng)的一個(gè)擴(kuò)充,為用戶在后臺(tái)為每個(gè)文件進(jìn)行版本管理。每個(gè)版本可以包括如下信息:修改時(shí)間點(diǎn),修改人,權(quán)限的變更等等。如果某個(gè)文件被刪除,它將被標(biāo)志為“以刪除”,長度為零。管理員根據(jù)需要將其恢復(fù)為止前的某個(gè)版本的文件狀態(tài)。

    小結(jié)

    虛擬化技術(shù)在企業(yè)級存儲(chǔ)中非常非常充分地體現(xiàn)其優(yōu)勢:優(yōu)化了存儲(chǔ)利用率,使得管理更加順暢,提高了系統(tǒng)的可用性和整體性能,降低了存儲(chǔ)系統(tǒng)的管理開銷等等。從目前來講,存儲(chǔ)虛擬化依然缺乏高度的標(biāo)準(zhǔn)化,不同的虛擬產(chǎn)品之間的兼容性還有待進(jìn)一步提高。作為一個(gè)正在發(fā)展的技術(shù),還有很多新的應(yīng)用有待發(fā)掘。當(dāng)然在虛擬技術(shù)體現(xiàn)其優(yōu)越性的同時(shí)我們也不能夠忽視虛擬技術(shù)的一些潛在的問題,這樣更會(huì)有利于虛擬技術(shù)向著智能化的方向發(fā)展。

    案例分析

    Compellent 數(shù)據(jù)分級管理(Data Progression)

    Compellent SAN 系統(tǒng)通過虛擬技術(shù)在數(shù)據(jù)塊層管理整合各種類型的磁盤資源,直接向應(yīng)用系統(tǒng)輸出一個(gè)空間可動(dòng)態(tài)擴(kuò)充的卷,最大化的利用有限的物理存儲(chǔ)空間。并通過其特有的數(shù)據(jù)分級管理技術(shù),利用虛擬化技術(shù)規(guī)避了不同種類磁盤和RAID設(shè)置之間的差異,并根據(jù)其性能價(jià)格比自動(dòng)化地實(shí)現(xiàn)了最小化整個(gè)存儲(chǔ)系統(tǒng)的開銷。根據(jù)數(shù)據(jù)的被訪問頻率將數(shù)據(jù)在不同的數(shù)據(jù)存儲(chǔ)層級間遷移。下面兩幅圖分別顯示了數(shù)據(jù)向下級遷移和向上級反向遷移的情況。


 


    ILM—-信息生命周期管理和DLM—-數(shù)據(jù)生命周期管理的目標(biāo)都是在數(shù)據(jù)的生命周期內(nèi)在不同的存儲(chǔ)介質(zhì)上調(diào)度和管理數(shù)據(jù)。它們的不同在于ILM通過

    智能化地根據(jù)應(yīng)用程序跟蹤文件的內(nèi)容。DLM著重于數(shù)據(jù)的移動(dòng)。

    根據(jù)業(yè)界的分析和SNIA統(tǒng)計(jì),在信息系統(tǒng)中平均有80%的空閑數(shù)據(jù)。由此可見這些非活動(dòng)數(shù)據(jù)可以轉(zhuǎn)移至低性能的磁盤或陣列之上,如下圖所示。因此,我們沒有必要將全部的數(shù)據(jù)都長期占用高昂的高端設(shè)備。利用Compellent的數(shù)據(jù)分級管理可以自動(dòng)地把空閑數(shù)據(jù)遷移至低速設(shè)備之上,將有限的昂貴的存儲(chǔ)介質(zhì)分配給高度頻繁訪問的數(shù)據(jù)塊。



    數(shù)據(jù)分級管理可以將卷構(gòu)件于不同的種類、大小、速度的磁盤以及不同的RAID之上。數(shù)據(jù)分級管理通過監(jiān)控I/O并根據(jù)數(shù)據(jù)訪問模型將數(shù)據(jù)分布在不同的層級之上。

    數(shù)據(jù)分級管理有效的平衡了不同種類的磁盤在價(jià)格和性能之間的差異,允許最大化地使用廉價(jià)的SATA磁盤作為主要數(shù)據(jù)存儲(chǔ)截至,并有效地將高性能的Fiber Channel磁盤響應(yīng)快速數(shù)據(jù)訪問服務(wù)。

    數(shù)據(jù)分級管理充分利用RAID10, RAID5等在不影響性能的條件下最大化可用存儲(chǔ)量。高效地使用RAID5(9盤)結(jié)構(gòu)能夠比一般的全冗余RAID10節(jié)省40%的存儲(chǔ)空間。系統(tǒng)分層矩陣結(jié)構(gòu)如下圖。




    數(shù)據(jù)分級管理的價(jià)值


    數(shù)據(jù)分級管理在保障I/O性能的前提下整合多種磁盤管理技術(shù)最大話存儲(chǔ)空間利用率。

    活動(dòng)數(shù)據(jù),未轉(zhuǎn)入數(shù)據(jù)快照回放系統(tǒng)的數(shù)據(jù),被存放在RAID10存儲(chǔ)子系統(tǒng)能夠中,保障快速的讀寫。通過這種方式保障了RAID10系統(tǒng)能夠更有效的服務(wù)于多個(gè)卷的活動(dòng)數(shù)據(jù)。

    當(dāng)數(shù)據(jù)被系統(tǒng)快照回放捕獲處理后,很自然地轉(zhuǎn)換成為只讀模式。數(shù)據(jù)被遷移至RAID5存儲(chǔ)子系統(tǒng)。RAID5可以保障快速的讀操作。

    快照系統(tǒng)捕獲的數(shù)據(jù)如沒有被重寫或訪問頻度降低將被遷移到低速的廉價(jià)的存儲(chǔ)介質(zhì)上。

    磁盤技術(shù)不斷地提高速度和容量,數(shù)據(jù)分級管理使得用戶能夠靈活的使用最新的磁盤技術(shù),同時(shí)能夠保證不浪費(fèi)原有的舊磁盤。隨著數(shù)據(jù)在不同種類的磁盤上遷移,它們被不斷地重新拆分。當(dāng)用戶增加新的磁盤的時(shí)候,新的寫操作將動(dòng)態(tài)地寫在所有的同級磁盤之上,避免個(gè)別磁盤被過度地訪問。

    數(shù)據(jù)分級管理根據(jù)應(yīng)用的實(shí)際需求動(dòng)態(tài)地分配存儲(chǔ)空間。在相同的數(shù)據(jù)層級上,數(shù)據(jù)分級管理將可用的存儲(chǔ)資源分配給相應(yīng)的RAID結(jié)構(gòu)上,管理員無須人為地在不同的RAID上管理或移動(dòng)存儲(chǔ)。


    訂閱《信息存儲(chǔ)》雜志請 點(diǎn)擊此處鏈接

分享到

多易

相關(guān)推薦