近年來存儲數(shù)據(jù)呈現(xiàn)驚人的成長,存儲設(shè)備為了適應(yīng)各種新的運(yùn)用需求??從而使得虛擬帶庫,高清非線編,數(shù)據(jù)化監(jiān)控系統(tǒng)等等不斷出現(xiàn)令人興奮地發(fā)展。存儲設(shè)備不但可支持更高速的傳輸,更大的容量存儲,及更高的I/O存取,而且相對應(yīng)的對數(shù)據(jù)保護(hù)的技術(shù)也有所進(jìn)展??如snap shot、CDP等等。操作系統(tǒng)也增進(jìn)了對存儲設(shè)備的支持,如Microsoft Windows 2003推出了一系列對存儲技術(shù)的支持,如VSS,VDS,MPIO 等。在各廠商的積極創(chuàng)新與努力推展下,各家的儲存設(shè)備功能變得更強(qiáng)大,總體持有成本也有顯著的降低。但性價(jià)比的提供,不代表使用者就能有效地去駕御他所擁有的存儲設(shè)備,就能充分的應(yīng)用其功能去解決所面臨的IT困境。我們希望能提供一些想法與建議去幫助存儲設(shè)備的使用者如何去規(guī)劃適用的盤陣功能。

你的傳統(tǒng)盤陣真的發(fā)揮了它的功能,解決了您的問題嗎?

九成以上盤陣的使用者通常在系統(tǒng)安裝完成后,便不再去進(jìn)行盤陣系統(tǒng)功能的變更了。

我想有幾種原因:


以上幾點(diǎn)有必要進(jìn)行澄清與糾正.


一般傳統(tǒng)盤陣的選擇不外乎取決于幾點(diǎn):


有幾點(diǎn)是我們必須要考慮的:


針對個別的應(yīng)用必須有相對應(yīng)的優(yōu)化參數(shù)設(shè)定

I/O的模式:


減少任何可能造成系統(tǒng)增加MTBF的機(jī)會

○ 使用者可以因任務(wù)的需求來選擇合適的硬盤,在在線的服務(wù)上,需要的是高I/O傳輸,loading會較重,他可以選擇Fibre硬盤及SCSI硬盤,而近線及offline的應(yīng)用,就可以用較經(jīng)濟(jì)的SATA硬盤來配合,SAS的盤陣出現(xiàn)又帶給企業(yè)更具彈性的解決方案,使用者可以在同一個盤陣系統(tǒng)進(jìn)行SAS及SATA硬盤的配置,最后,除了選擇合適容量的硬盤之外,還必須要考慮硬盤與盤陣系統(tǒng)的兼容性;

圖示一:硬盤應(yīng)用示意圖



○ RAID 設(shè)定:提供多種的容錯RAID設(shè)定,以減少硬盤故障可能影響系統(tǒng)的可用性,尤其RAID6可允許同時(shí)有兩個硬盤發(fā)生故障,更大大的提高可用性;

○ 系統(tǒng)的環(huán)境及偵測:企業(yè)的IT環(huán)境必需,一個好的盤陣系統(tǒng)陣RAID的功能外,還必須俱備一個穩(wěn)定持續(xù)的系統(tǒng)環(huán)境.因?yàn)橛脖P在長時(shí)間的高速存取會產(chǎn)生高溫,讀取頭會因些許的振動而導(dǎo)致撞擊盤片而造成數(shù)據(jù)的損毀.好的盤陣必須能夠保持系統(tǒng)散熱,風(fēng)流,電壓,電流的持續(xù)穩(wěn)外,更要能夠偵測整體的狀況,當(dāng)不穩(wěn)定狀況發(fā)生時(shí),還能保持系統(tǒng)及數(shù)據(jù)完整,并能通知管理者清楚的事件反應(yīng),讓管理者能迅速做適當(dāng)?shù)奶幹靡耘懦收弦驗(yàn)椋?br />

I、 二段式風(fēng)扇設(shè)計(jì):溫度過高,風(fēng)扇自動切換高轉(zhuǎn)速

II、事件反應(yīng)機(jī)制:當(dāng)溫度過高,風(fēng)扇故障,控制器故障時(shí)切換快取模式,或執(zhí)行系統(tǒng)關(guān)機(jī),以保護(hù)整體系統(tǒng)

○ 無壞點(diǎn)考慮(無單點(diǎn)故障設(shè)計(jì):由服務(wù)器至盤陣-叢集節(jié)點(diǎn),端口,多路徑,交換機(jī),冗余控制器,冗余電源,冗余風(fēng)扇)。

○ 容易服務(wù)的模塊化的設(shè)計(jì):重要組件的故障常導(dǎo)致系統(tǒng)無法繼續(xù)提供服務(wù),或可能導(dǎo)致系統(tǒng)處于不安全的狀態(tài) ,如盤陣控制器,BBU,電源供應(yīng)器,風(fēng)扇模塊,硬盤模塊等,要讓重要組件能夠被輕易地更換,迅速排除故障,以繼續(xù)提供服務(wù)。

圖示二:無壞點(diǎn)及易維護(hù)的模塊化設(shè)計(jì)


圖示三:系統(tǒng)的環(huán)境及偵測


數(shù)據(jù)安全的保障:

理由:

一般使用者在規(guī)劃RAID時(shí),較常使用的是RAID5,而其它常見的則會有RAID1,RAID3,RAID4 等等,這些RAID level允許至多一塊盤故障,并能重建數(shù)據(jù),可是很不辛的事,常見的情況如下:當(dāng)一個屬于RAID5的硬盤發(fā)生故障時(shí),系統(tǒng)管理者嘗試換上一塊新的硬盤 或以現(xiàn)有的熱備援硬盤進(jìn)行RAID的重建。但是很不幸在重建過程中在另一塊硬盤上遇到壞塊,而根據(jù)RAID的同位運(yùn)算奇偶校驗(yàn)功能,他只允許一個條帶是壞的,才能重新產(chǎn)生原來的數(shù)據(jù),這個壞塊將造成RAID在被重建的硬盤里無法重建數(shù)據(jù),導(dǎo)致這些數(shù)據(jù)永遠(yuǎn)遺失。若只遇到少數(shù)的壞塊,并且這筆數(shù)據(jù)是關(guān)于系統(tǒng)開機(jī)或重要的系統(tǒng)文件的,則可能造成無法開機(jī)的狀況。要避免這種情況發(fā)生可采用下面的方式來避免:

方式:

○ 重建奇偶校驗(yàn)碼:

可使用盤陣的奇偶校驗(yàn)功能,他的原理很簡單,就是將RAID上的數(shù)據(jù)每一個軌道讀出來重新進(jìn)行奇偶校驗(yàn),在讀取的過程中就能先發(fā)現(xiàn)壞塊,而在邏輯硬盤還未處于降級狀態(tài)時(shí),這個壞塊上讀不出來的數(shù)據(jù)是可以重新產(chǎn)生的,將其余硬盤上的數(shù)據(jù)進(jìn)行奇偶校驗(yàn)運(yùn)算去還原數(shù)據(jù),再回寫入壞塊. 通常磁性媒體上的壞塊是所謂的瞬時(shí)的壞塊,可以借由寫的動作將壞塊覆蓋。若該壞塊無法用寫的動作去修復(fù),則盤陣會啟動硬盤的重新分配地址功能,去另行配置保留的扇區(qū)與壞塊的地址進(jìn)行交換,由這個扇區(qū)去取代壞塊,下次存取這壞塊位置時(shí),實(shí)際是存取這個新的扇區(qū)

○ 盤片掃描:

盤陣的奇偶重建功能,原理很簡單,可是有個問題,因?yàn)樗鼤谋P陣控制器的運(yùn)算及占用內(nèi)部頻寬,當(dāng)執(zhí)行奇偶重建等于是對整個邏輯硬盤的重建,會嚴(yán)重影響整體系統(tǒng)的性能. 盤片掃描是一個較好的壞塊偵測方式,是由盤陣控制器下命令叫硬盤自己執(zhí)行校驗(yàn)檢查,當(dāng)硬盤自己檢查過程中就能先發(fā)現(xiàn)壞塊,而在邏輯硬盤還未處于降級狀態(tài)時(shí),這個壞塊上讀不出來的數(shù)據(jù)是可以重新產(chǎn)生的,將其余硬盤上的數(shù)據(jù),和進(jìn)行奇偶校驗(yàn)運(yùn)算去還原數(shù)據(jù),再回寫入壞塊. 通常磁性媒體上的壞塊是所謂的瞬時(shí)的壞塊,可以借由寫的動作將壞塊覆蓋. 若該壞塊無法用寫的動作去修復(fù),則盤陣會啟動硬盤的重新分配地址功能,去另行配置保留的扇區(qū)與壞塊的地址進(jìn)行交換,由這個扇區(qū)去取代壞塊,下次存取這壞塊位置時(shí),實(shí)際是存取這個新的扇區(qū)

圖示四:盤片掃描


○ 預(yù)定盤片掃描:

盤片掃描可以預(yù)先發(fā)現(xiàn)壞塊,避免壞塊造成數(shù)據(jù)在邏輯硬盤處于降級狀態(tài)模式時(shí)丟失,并且只用很少的盤陣控制器來操作。 但我們認(rèn)為若能將其何時(shí)執(zhí)行,持續(xù)執(zhí)行進(jìn)行自動化操作才能對數(shù)據(jù)提供更好的保護(hù). 這是就要有所謂的盤片掃描時(shí)間表,我們可以借由盤片掃描時(shí)間表提供彈性的時(shí)程安排去執(zhí)行盤片掃描,例如可以按排不同部門的數(shù)據(jù)盤,在不同時(shí)段,或非工作時(shí)間去執(zhí)行盤片掃描,可以更充分地利用盤陣控制器的運(yùn)算能力及頻寬,

圖示五:預(yù)定盤片掃描



彈性的RAID設(shè)定:

RAID 的選擇:在安裝盤陣時(shí)就會預(yù)先規(guī)畫應(yīng)該實(shí)行什么樣的RAID來作為數(shù)據(jù)的存儲空間,以下對各種不同的RAID level作一個簡述

RAID Level 0即數(shù)據(jù)分割,是最基本的方式。在一個普通硬盤驅(qū)動器上,數(shù)據(jù)被存儲在同一張盤的連續(xù)扇區(qū)上。RAID 0至少使用兩個磁盤驅(qū)動器,并將數(shù)據(jù)分成從512字節(jié)到數(shù)兆字節(jié)的若干塊,這些數(shù)據(jù)塊被交替寫到磁盤中。第1段被寫到磁盤1中,第2段被寫到磁盤2中,如此等等。當(dāng)系統(tǒng)到達(dá)數(shù)據(jù)中的最后一個磁盤時(shí),就寫到磁盤1的下一分段,以下如此。

分割數(shù)據(jù)將I/O負(fù)載平均分配到所有的硬盤。由于硬盤可以同時(shí)寫或讀,性能得以顯著提高。但是它卻沒有數(shù)據(jù)保護(hù)能力。如果一個磁盤出故障,數(shù)據(jù)就會丟失。RAID 0不適用于關(guān)鍵任務(wù)環(huán)境,但它卻非常適合于視頻生產(chǎn)和編輯或圖像編輯。

RAID Level 1是磁盤鏡像??寫到磁盤1中的一切也寫到磁盤2中,從任何一個磁盤都可以讀取。這樣就提供了實(shí)時(shí)備份,但需要的磁盤驅(qū)動器數(shù)量最多,不能提高性能。RAID 1在多用戶系統(tǒng)中提供最佳性能和容錯能力,是最容易實(shí)施的配置,這最適用于財(cái)務(wù)處理、工資單、金融和高可用數(shù)據(jù)環(huán)境。

RAID Level 3包括數(shù)據(jù)分割,另外,它還指定一個硬盤來存儲奇偶信息。這就提供了某種容錯功能,在數(shù)據(jù)密集型環(huán)境或單一用戶環(huán)境中尤其有益于訪問較長的連續(xù)記錄。RAID 3需要同步主軸硬盤來預(yù)防較短記錄硬盤的性能下降。

RAID Level 5類似于Level 0,但是它不是將數(shù)據(jù)分成塊,而是將每個字節(jié)的位拆分到多個磁盤。這樣會增加管理費(fèi)用,但是,如果一個磁盤出現(xiàn)故障,則它可以更換,數(shù)據(jù)可以從奇偶和糾錯碼中重建。RAID 5包括所有的讀/寫運(yùn)行。它需要三到五個磁盤來組成數(shù)據(jù),最適合于不需要關(guān)鍵特性或幾乎不進(jìn)行寫操作的多用戶系統(tǒng)。

RAID Level 6它使用特別的算法去產(chǎn)生二筆的Redundant 數(shù)據(jù)(我們稱之為P,Q),擴(kuò)展了RAID 5。它能承受多個硬盤同時(shí)出現(xiàn)故障,但是,性能??尤其是寫操作卻很差,而且,系統(tǒng)需要一個極為復(fù)雜的控制器。(Infortrend EonStor 提供了P,Q 同時(shí)產(chǎn)生功能,提供了絕佳的RAID6效用。RAID5,RAID6性能差異近10%)

圖示六:RAID Level 示意圖







RAID 之間的切換

理由:

隨著企業(yè)的成長數(shù)據(jù)勢必也會不斷地增長,相關(guān)的擴(kuò)充及備份方案必需因整體的IT環(huán)境去做調(diào)整,原來的RAID規(guī)劃可能是配合數(shù)據(jù)庫隨意運(yùn)用。而現(xiàn)在的運(yùn)用必需轉(zhuǎn)成對更大條帶大小的支持,或者原有只有RAID5的規(guī)劃,因新系統(tǒng)有RAID6的功能,在原來的做法上必須將原來的數(shù)據(jù)備分,再重建RAID邏輯硬盤,再將數(shù)據(jù)灌回。這樣做不但耗時(shí)而且不具彈性.

方法:RAID Migration:

盤陣可以提供所謂的RAID Migration或者RAID重建功能,RAID Migration可以讓系統(tǒng)管理者來改變邏輯硬盤的RAID級別. 它可以借由進(jìn)行RAID邏輯硬盤數(shù)據(jù)的重新分配達(dá)成,更先進(jìn)的盤陣還能在RAID Migration上提供條帶大小的變更. 可以更有彈性地為系統(tǒng)管者提供強(qiáng)大的功能,以應(yīng)IT任務(wù)的需求。

圖示七:RAID Migration:


特殊運(yùn)用的考慮:

a) 近線存儲的運(yùn)用:在近線存儲的運(yùn)用上,盤陣的角色是處于在線和離線的存儲設(shè)備之間,duty cycle的部分不像在線服務(wù),而是隨時(shí)被叫用,在這種情況下,將硬盤馬達(dá)關(guān)閉的功能啟動,讓盤陣在系統(tǒng)閑置一段時(shí)間后就將硬盤的馬達(dá)關(guān)閉,而當(dāng)服務(wù)器要存取盤陣時(shí),盤陣控制器會自動喚醒馬達(dá),立即回復(fù)服務(wù)功能,硬盤馬達(dá)關(guān)閉功能可以有效地減少電源的消耗,可以有效地節(jié)省總體的電源達(dá)50%以上.

圖示八:近線存儲的運(yùn)用


b) 非線編及影音多媒體的運(yùn)用:影音運(yùn)用要求的系統(tǒng)能夠提供一個穩(wěn)定的性能來輸出,盤陣對每一個I/O的響應(yīng)必須能夠及時(shí)快速,若處理I/O無法在適當(dāng)?shù)臅r(shí)間響應(yīng),則會造成影音電影的播放畫面或影像播放停滯. 如下頁,在讀與寫的I/O可以看到很明顯的性能落差,這在多媒體的播放是不允許的。

c) Spiky read performance 


原因:盤陣的設(shè)計(jì)主要是為數(shù)據(jù)存儲做優(yōu)化處理,故在數(shù)據(jù)的處理上不是以主機(jī)端的最快響應(yīng)速度為目的,其主要任務(wù)是保持?jǐn)?shù)據(jù)的正確性,再將通用型的盤陣運(yùn)用在媒體播放影音的運(yùn)用中,最常見的問題有:

a) 硬盤的壞塊處理導(dǎo)致主機(jī)端來不及響應(yīng);

b) 混合的讀寫需求讓快取的切換來不及響應(yīng);

c) 對單一媒體流(通常是一個大的連續(xù)的的檔案,如電影影片)及多媒體流(如broadcast,IPTV)的優(yōu)化是無法同一對待的。

解決方法:

AV選項(xiàng)通常會有兩種優(yōu)化選項(xiàng):單一媒體流和多媒體流。針對單一媒體流,盤陣控制器可從硬盤預(yù)讀較多的數(shù)據(jù)以供大的媒體流。而多媒體流的優(yōu)化則是盤陣控制器優(yōu)化內(nèi)存機(jī)制,避免讓多個服務(wù)同時(shí)落在同一硬盤,因此多媒體流可以盡可能被滿足。

a) 啟動盤陣的最多響應(yīng)時(shí)間:只要RAID邏輯硬盤不是處于降級狀況,而硬盤本身在處理壞塊,或者其它原因無法在限定時(shí)間內(nèi)響應(yīng),盤陣控制器可立即由其它硬盤去算出數(shù)據(jù),并將其立即響應(yīng)至主機(jī)端。

b) 設(shè)定對單一媒體流的優(yōu)化或多媒體流的優(yōu)化:針對任務(wù)的需求來設(shè)定單一媒體流的優(yōu)化或多媒體流的優(yōu)化,盤陣的內(nèi)存就能依據(jù)設(shè)定來進(jìn)行最佳化管理。

c) 使用RAID 6也可避免因硬盤處理壞塊而導(dǎo)致的主機(jī)端來不及響應(yīng)。

分享到

多易

相關(guān)推薦