目標(biāo)應(yīng)用程序
關(guān)于大容量存儲(chǔ)系統(tǒng),您首先應(yīng)當(dāng)知道的一點(diǎn)是大容量存儲(chǔ)系統(tǒng)受基本驅(qū)動(dòng)器的性能特性限制,并不是適合所有應(yīng)用程序。市場現(xiàn)有的最大容量驅(qū)動(dòng)器都是 SATA 磁盤,而不是高性能的光纖通道磁盤。不管容量多大,現(xiàn)代 SATA 磁盤的轉(zhuǎn)速都相同,提供的吞吐量也相同。此外,為達(dá)到給定存儲(chǔ)容器(文件系統(tǒng)、LUN 等)的理想大小,您將部署更少的磁盤,而磁盤數(shù)目減少通常意味著存儲(chǔ)容器的最大性能降低。
存儲(chǔ)系統(tǒng)和(或)主機(jī)操作系統(tǒng)可能也實(shí)施了大小限制,這進(jìn)而限制了可用于給定存儲(chǔ)容器的軸數(shù)。例如, 默認(rèn) Linux® 文件系統(tǒng) Ext3 的最大大小為 16TB,如果使用的是 1TB 磁盤,并且考慮到格式化等操作造成一定的容量損失,單一文件系統(tǒng)可能被限定為約 17 個(gè)軸。
在考慮大容量系統(tǒng)時(shí),還應(yīng)考慮二級存儲(chǔ),這些系統(tǒng)并不非常適用于 Exchange、數(shù)據(jù)庫或其它需要低響應(yīng)時(shí)間和高吞吐量的應(yīng)用程序。理想應(yīng)用程序包括:
磁盤至磁盤備份
數(shù)據(jù)復(fù)制的目標(biāo)(例如,使用 NetApp SnapMirror®)
電子郵件歸檔
文件或文檔歸檔
法規(guī)遵從存儲(chǔ)
二級存儲(chǔ)本身也非常適用于那些具有大型順序數(shù)據(jù)流的應(yīng)用程序,其中包括:
圖像采集
實(shí)況視頻采集
地震數(shù)據(jù)
數(shù)據(jù)可用性
由于可能具有數(shù)百個(gè) SATA 盤,因此還有幾項(xiàng)關(guān)于大容量系統(tǒng)的數(shù)據(jù)可用性的重要事項(xiàng)需要考慮,其中包括:
RAID
高可用性配置
多路徑 HA
SATA 磁盤的故障率通常比光纖通道磁盤高,因而實(shí)施 RAID 保護(hù)至關(guān)重要。NetApp 通常建議采用 NetApp 高性能的雙奇偶 RAID 6 實(shí)施(即 RAID-DPTM)來避免可能因 RAID 組中雙磁盤故障引起的數(shù)據(jù)丟失發(fā)生。其他供應(yīng)商可能也提供了雙奇偶 RAID 6 解決方案,具體視存儲(chǔ)產(chǎn)品而定。不管選擇哪位供應(yīng)商,任何大容量存儲(chǔ)系統(tǒng)都將因?yàn)?RAID 6 提供的更高數(shù)據(jù)彈性而受益。
盡管大容量存儲(chǔ)系統(tǒng)常用作二級存儲(chǔ),部署了此類系統(tǒng)的 NetApp 客戶常常會(huì)選擇含主動(dòng)/主動(dòng)控制器及無單點(diǎn)故障的全面高可用性配置,以確保大型數(shù)據(jù)倉庫始終可訪問。對于大容量 HA 解決方案,需要考慮的一個(gè)重要事項(xiàng)是,一個(gè)控制器需要多長時(shí)間從另一個(gè)控制器中接管磁盤或?qū)⒋疟P恢復(fù)到另一個(gè)控制器。與通常只采用光纖通道磁盤的解決方案相比,使用大量 SATA 磁盤的解決方案在控制器接管和恢復(fù)磁盤方面所花費(fèi)的時(shí)間略長。這是因?yàn)榕c光纖通道磁盤相比,SATA 磁盤本身速度更慢,執(zhí)行運(yùn)行狀況檢查進(jìn)程的時(shí)間更長。
Data ONTAP® 7.2.4 引入了一些專門針對 SATA 磁盤接管和恢復(fù)的具體優(yōu)化功能,可提高大容量 SATA 系統(tǒng)在故障轉(zhuǎn)移和恢復(fù)方面的性能,使此解決方案與僅使用光纖通道磁盤的解決方案不相上下。為通過優(yōu)化功能獲益,我們建議對任何 NetApp 基于 SATA 的大容量 HA 存儲(chǔ)解決方案使用 Data ONTAP 7.2.4 或更高版本。
有一個(gè) NetApp 存儲(chǔ)配置選項(xiàng)未得到充分利用,那就是多路徑 HA。多路徑 HA 確保從每個(gè)控制器到每個(gè)磁盤有兩個(gè)單獨(dú)的 I/O 路徑,因而在出現(xiàn)線纜問題或其它硬件問題時(shí),磁盤驅(qū)動(dòng)器的訪問不會(huì)中斷。若采用 HA 配置,此類問題的出現(xiàn)會(huì)導(dǎo)致發(fā)生故障轉(zhuǎn)移。多路徑 HA 提供了從每個(gè)控制器到其存儲(chǔ)的冗余數(shù)據(jù)路徑,因此減少了故障轉(zhuǎn)移的發(fā)生機(jī)率。多路徑 HA 還可以通過將存儲(chǔ)工作負(fù)荷分布到兩個(gè)數(shù)據(jù)路徑中,幫助增強(qiáng)性能的一致性。
數(shù)據(jù)保護(hù)
大容量存儲(chǔ)系統(tǒng)的數(shù)據(jù)備份業(yè)已成為所面臨的一項(xiàng)重大挑戰(zhàn)。首推磁盤到磁盤備份方法,因?yàn)檫@樣可能盡量縮短備份時(shí)間。然而,如果使用 NetApp SnapVault® 和 SnapMirror 等工具,創(chuàng)建大容量存儲(chǔ)系統(tǒng)的基準(zhǔn)副本所需的時(shí)間可能相當(dāng)長。NetApp 提供了兩種工具:LREP(邏輯復(fù)制)和 SnapMirror to Tape,以幫助創(chuàng)建可植入到遠(yuǎn)程系統(tǒng)的基準(zhǔn)。自此之后,將只復(fù)制改動(dòng)過的數(shù)據(jù)塊,從而降低對來源和目標(biāo)控制器以及兩者之間網(wǎng)絡(luò)的影響。
RAID 重建
與大多數(shù)其它系統(tǒng)維護(hù)活動(dòng)一樣,RAID 重建時(shí)間會(huì)因采用大量 SATA 驅(qū)動(dòng)器而延長。例如,如果有一個(gè) 1TB 磁盤發(fā)生故障,在沒有其它負(fù)載的情況下,重建 NetApp 系統(tǒng)上的 RAID 大約需要 10 到 12 小時(shí)。此時(shí)間會(huì)隨系統(tǒng)負(fù)載增加而延長。
平均故障時(shí)間 (MTBF) 數(shù)據(jù)表明,在一個(gè)擁有 1,176 個(gè) 1TB 磁盤驅(qū)動(dòng)器的存儲(chǔ)系統(tǒng)中,一個(gè)系統(tǒng)執(zhí)行重建的時(shí)間可能相當(dāng)于正常工作時(shí)間的 5%。而且,重建所花費(fèi)時(shí)間的百分比值會(huì)隨存儲(chǔ)系統(tǒng)的整體工作負(fù)荷增加而增加。
介質(zhì)掃描和 RAID 清理
NetApp 通過定期介質(zhì)掃描和 RAID 清理來確保存儲(chǔ)數(shù)據(jù)的完整性,而且我認(rèn)為其他供應(yīng)商也是提供類似功能來檢測和解決問題。此過程與為一座大橋刷油漆相似,首先從大橋的一端開始刷,天天刷,月月刷,直至刷到大橋的另一端,然后又重新開始。這兩個(gè) NetApp 實(shí)用程序只是跟蹤其進(jìn)度,并繼續(xù)處理存儲(chǔ)子系統(tǒng),直至檢查了所有存儲(chǔ)。后臺介質(zhì)掃描以較低速率連續(xù)運(yùn)行,它使用內(nèi)置的診斷功能來檢測介質(zhì)錯(cuò)誤。默認(rèn)情況下 RAID 清理每周運(yùn)行六小時(shí),它使用奇偶檢驗(yàn)數(shù)據(jù)來檢查數(shù)據(jù)完整性。
在大容量存儲(chǔ)系統(tǒng)中,NetApp 建議提高介質(zhì)掃描的數(shù)據(jù)速率,增加 RAID 清理的執(zhí)行頻率和持續(xù)時(shí)間,以確??梢约皶r(shí)檢查那些不常訪問的數(shù)據(jù)(通常在二級存儲(chǔ)上)。
存儲(chǔ)系統(tǒng)配置
在配置大容量系統(tǒng)時(shí),您首先需要了解存儲(chǔ)系統(tǒng)(以及 SAN 環(huán)境的主機(jī)操作系統(tǒng))實(shí)施了哪些限制,并相應(yīng)制定計(jì)劃。例如,在 NetApp 系統(tǒng)中,您可能規(guī)定單個(gè)存儲(chǔ)控制器上聚合或傳統(tǒng)卷的最大值為 100,而且聚合、傳統(tǒng)卷和精靈卷(FlexVol® 卷)的總值不能超過 500。看上去這些限制值定義得很高,然而有時(shí)仍會(huì)超出這些限制。例如,如果主機(jī)操作系統(tǒng)限定您使用 2TB 文件系統(tǒng),或者您將每聚合的 FlexVol 卷數(shù)統(tǒng)一規(guī)定為一個(gè)較高值,則可能在充分配置最大容量系統(tǒng)之前就達(dá)到 500 個(gè)的數(shù)量限制。
其問題在于,您不能在處理大容量系統(tǒng)時(shí)一蹴而就。您必須了解各個(gè)存儲(chǔ)限制,并制定必需的前期規(guī)劃,以確保既能使用所有容量,又能留出空間應(yīng)對無法預(yù)測的未來需求。
基礎(chǔ)設(shè)施復(fù)雜性
在計(jì)劃部署大容量系統(tǒng)時(shí)不能忽視的一個(gè)因素是整個(gè)磁盤基礎(chǔ)設(shè)施的高度復(fù)雜性。我最近曾與一位客戶合作過,他有 72 個(gè)磁盤架,共安裝了 1,008 個(gè)磁盤。這些磁盤架進(jìn)一步劃分為 12 個(gè)存儲(chǔ)環(huán)路,每個(gè)存儲(chǔ)環(huán)路包含 6 個(gè)磁盤架。
在使用多路徑 HA 存儲(chǔ)連接的主動(dòng)/主動(dòng)環(huán)境下,每個(gè)存儲(chǔ)環(huán)路需要 4 個(gè)連接,因而在這么多個(gè)存儲(chǔ)機(jī)柜中存儲(chǔ)與存儲(chǔ)控制器之間需要 48 個(gè)連接。聽上去布線很復(fù)雜,事實(shí)也如此。您不能首先預(yù)測事事順暢,不做任何規(guī)劃就開始為最大容量存儲(chǔ)系統(tǒng)布線。您有許多前期工作要做,以確保每項(xiàng)工作能夠順利進(jìn)行。前期規(guī)劃、布線圖繪制以及標(biāo)記對大容量存儲(chǔ)部署至關(guān)重要。
總結(jié)
在了解潛在限制,做好前期工作并明智選擇應(yīng)用程序之后,您就可以安全地部署存儲(chǔ)系統(tǒng),這些系統(tǒng)的容量非常大,僅僅在幾年前還認(rèn)為不可能達(dá)到這么大的容量。如果相對于最新 SATA 驅(qū)動(dòng)器的容量與吞吐量性能仔細(xì)考慮了可用性及數(shù)據(jù)保護(hù)需求,并且預(yù)先計(jì)劃了配置及物理需求,則可以避免在進(jìn)一步開發(fā)利用任何技術(shù)時(shí)可能遇到的不愉快問題,并可以享受因管理簡化、直接存儲(chǔ)成本降低以及電力和冷卻要求下降而帶來的好處。