許多組織已經(jīng)發(fā)現(xiàn)在基于文件的存儲(chǔ)上部署虛擬化解決方案可以避免許多和存儲(chǔ)有關(guān)的復(fù)雜性。現(xiàn)在,每個(gè)文件,無論是設(shè)備鏡像還是數(shù)據(jù),都可以分別管理。使用向外擴(kuò)展或向上擴(kuò)展的基于文件的存儲(chǔ)系統(tǒng)可以進(jìn)一步提高及時(shí)配置的能力,帶來更高的資源利用率和合適的性能,以及更高水平的數(shù)據(jù)/系統(tǒng)可用性(見《向外擴(kuò)展與向上擴(kuò)展NAS的對(duì)比》)。
并不是所有的虛擬化平臺(tái)都可以在NFS(網(wǎng)絡(luò)文件系統(tǒng))或CIFS(通用互聯(lián)網(wǎng)文件系統(tǒng))上運(yùn)行。在這些情況下,為了簡(jiǎn)化設(shè)備遷移和獲得高可用性,用戶可以在服務(wù)器集群上部署一個(gè)集群的文件系統(tǒng)。
文件服務(wù)
為了在管理中獲得規(guī)模效應(yīng)以及為了改善資源利用率,許多企業(yè)已經(jīng)發(fā)起了針對(duì)文件和打印服務(wù)以及針對(duì)網(wǎng)絡(luò)共享的合并項(xiàng)目。他們的目標(biāo)是簡(jiǎn)化存儲(chǔ)的管理,更加智能化地管理數(shù)據(jù),提供增值服務(wù)(比如及時(shí)歸檔、數(shù)據(jù)保護(hù)和安全性)。這些合并項(xiàng)目的一些關(guān)鍵要求包括:能夠使管理員在無需增加人數(shù)的情況下管理日益增長(zhǎng)的數(shù)據(jù)量和存儲(chǔ)的管理工具,及時(shí)而準(zhǔn)確的容量配置以及容量回收,無縫且實(shí)時(shí)的升級(jí)和更新,根據(jù)需求來增加容量和提高性能的靈活性。根據(jù)組織自己的要求,可以通過一系列方式來達(dá)成這些目標(biāo)。
• 部署文件虛擬化。文件虛擬化技術(shù)可以將現(xiàn)有的基于文件的存儲(chǔ)設(shè)備合并到一個(gè)命名空間,允許后端存儲(chǔ)獨(dú)立于目錄結(jié)構(gòu)進(jìn)行管理。文件虛擬化還可以使管理員增加容量而無需遷移用戶;容量可以來自文件虛擬化系統(tǒng)所抽象出來的任何存儲(chǔ)設(shè)備。
• 部署向上擴(kuò)展的系統(tǒng),這種系統(tǒng)可以解決理論上有限的容量并可以支持大量的文件。這種系統(tǒng)通常用一臺(tái)服務(wù)器或雙服務(wù)器(在高可用性設(shè)置中),同時(shí)后端采用基于塊的存儲(chǔ)。一些系統(tǒng)可能支持多種類型存儲(chǔ),允許進(jìn)行分層存儲(chǔ)。要部署這種系統(tǒng),需要更換環(huán)境中現(xiàn)有的幾乎所有設(shè)備。向上擴(kuò)展系統(tǒng)同時(shí)還依賴于服務(wù)器的性能設(shè)置。只有在處理器的處理能力擴(kuò)展后,向上擴(kuò)展系統(tǒng)才能擴(kuò)展。
• 部署向外擴(kuò)展系統(tǒng)??梢圆捎孟蛲鈹U(kuò)展NAS的形式。這種NAS是節(jié)點(diǎn)的集群。這些節(jié)點(diǎn)共處于一個(gè)全局文件系統(tǒng)命名空間中。用戶可以根據(jù)需要來擴(kuò)展容量和性能。部署向外擴(kuò)展系統(tǒng)的另一個(gè)方式就是在現(xiàn)有文件服務(wù)器上部署分布式文件系統(tǒng)。分布式文件系統(tǒng)可以作為抽象層,使用戶可以根據(jù)需要來部署容量。
要選中正確的解決方案,關(guān)鍵是你要理解對(duì)你的組織來說最重要的是什么。各個(gè)解決方案在復(fù)雜性、性能、可擴(kuò)展性和支持服務(wù)上有很大的不同。
數(shù)據(jù)保護(hù)
傳統(tǒng)的數(shù)據(jù)保護(hù)系統(tǒng)和最佳實(shí)踐要求數(shù)據(jù)從生產(chǎn)系統(tǒng)復(fù)制到二級(jí)系統(tǒng),這樣即使生產(chǎn)系統(tǒng)發(fā)生故障,用戶還可以使用另一個(gè)數(shù)據(jù)副本。數(shù)據(jù)復(fù)制實(shí)踐已經(jīng)實(shí)行很長(zhǎng)時(shí)間了,不過用于存儲(chǔ)二級(jí)副本的存儲(chǔ)媒介在變化。數(shù)據(jù)保護(hù)范式要求用戶對(duì)變化中的數(shù)據(jù)進(jìn)行每日備份,對(duì)整個(gè)數(shù)據(jù)集做定期備份以防備整個(gè)系統(tǒng)需要恢復(fù)的情況。隨著時(shí)間推移,這種方法會(huì)產(chǎn)生同一數(shù)據(jù)的多個(gè)副本,消耗容量、帶寬和性能。一些數(shù)據(jù)保護(hù)軟件已經(jīng)更加智能化,只復(fù)制在塊層次上發(fā)生變化的數(shù)據(jù),從而減少需要寫入到二級(jí)媒介的數(shù)據(jù)量。其他解決冗余問題的方法則是采用具有容量?jī)?yōu)化功能的二級(jí)存儲(chǔ)媒介。這些容量?jī)?yōu)化功能包括單實(shí)例存儲(chǔ)、壓縮和重復(fù)數(shù)據(jù)刪除。
越來越多的用戶為了數(shù)據(jù)保護(hù)而使用基于文件的存儲(chǔ)。這主要是出于兩大理由。首先,這種存儲(chǔ)易于部署,使用的是標(biāo)準(zhǔn)協(xié)議,支持內(nèi)置復(fù)制功能,而且可以和多種驅(qū)動(dòng)器技術(shù)配合使用。其次,這種存儲(chǔ)解決了許多組織在使用基于塊的存儲(chǔ)系統(tǒng)時(shí)面臨的主要問題。這些主要挑戰(zhàn)包括存儲(chǔ)資源的利用,跨媒介服務(wù)器的資源共享,如何及時(shí)地向媒介服務(wù)器配置存儲(chǔ)。
歸檔與內(nèi)容目錄
歸檔是基于文件的存儲(chǔ)最自然的用途。當(dāng)今數(shù)據(jù)量在不斷迅速增長(zhǎng)。用戶需要保留越來越多的數(shù)據(jù)來滿足合規(guī)和監(jiān)管的要求,同時(shí)他們也需要保留數(shù)據(jù)來支持商業(yè)行動(dòng),并向客戶和合作伙伴提供數(shù)據(jù)支持。鑒于許多數(shù)據(jù)是非結(jié)構(gòu)化的,而基于文件的系統(tǒng)可以做到高成本經(jīng)濟(jì)性,能夠提供無縫的擴(kuò)展, 而且便于使用,因此基于文件的系統(tǒng)是很好的解決方案。在這些使用情境中,可擴(kuò)展性的衡量經(jīng)常不是以TB為單位,在一些情況下,需要以PB為單位。
高性能計(jì)算
高性能計(jì)算是向外擴(kuò)展和向上擴(kuò)展基于文件系統(tǒng)的傳統(tǒng)使用情境。大多數(shù)HPC(高性能計(jì)算)用戶都有性能上的要求。這意味著系統(tǒng)必須能夠根據(jù)應(yīng)用程序的需求進(jìn)行擴(kuò)展。不過,并不是所有數(shù)據(jù)都會(huì)在同一時(shí)間被處理,因此許多HPC用戶可以采用帶有動(dòng)態(tài)分層功能的存儲(chǔ)系統(tǒng)。通過動(dòng)態(tài)存儲(chǔ)分層,系統(tǒng)理解數(shù)據(jù)的使用模式,并根據(jù)性能特征將數(shù)據(jù)遷移到不同的存儲(chǔ)層。數(shù)據(jù)移動(dòng)可以是從高性能磁盤媒介移動(dòng)到低性能磁盤媒介,也可以是反過來,并且對(duì)應(yīng)用程序和用戶來說是透明的。
配置智能分層、容量?jī)?yōu)化、自動(dòng)精簡(jiǎn)配置、基于知識(shí)的數(shù)據(jù)管理以及標(biāo)準(zhǔn)組件的向外擴(kuò)展/向上擴(kuò)展基于文件的存儲(chǔ)系統(tǒng)提供了一個(gè)解決上述使用情境需求的方法。根據(jù)解決方案和架構(gòu)的特點(diǎn),在特定使用情境下要選用更適合的解決方案。
我們?cè)谖恼碌拈_頭給"動(dòng)態(tài)"下了個(gè)定義。如果需求是持續(xù)變化的,那么環(huán)境應(yīng)該要支持它們。無論資源是部署在企業(yè)里面還是從服務(wù)提供商那里訂購(gòu)來的,關(guān)鍵是要在需要的時(shí)候可以使用這些資源。
NOEMI GREYZDORF是IDC的研究經(jīng)理。