如果思科公司所說的增長速度將保持平穩(wěn),那么到2022年,僅每月產(chǎn)生的移動信息量就將超過2007年全年全球的數(shù)據(jù)存儲總量。當然,其中會包括像“跳舞的小孩”這樣的視頻,但與之相對應地,存儲庫里也會保存銀行數(shù)據(jù),加密健康記錄和銷售網(wǎng)點數(shù)據(jù)庫等非常重要的信息。如果調(diào)出一個“跳舞的小孩”視頻要花15秒,沒多少人會介意。但對于文件讀取請求而言,15秒的反應時間對客戶來說會像是一個世紀那么漫長,長此以往,公司會被 “慢”死掉。有些信息就是要能即用即取,而其他數(shù)據(jù)則可以放在相對更慢更便宜的存儲區(qū)。你可以把它想成溫度,保存最快最重要的數(shù)據(jù)為“熱”,保存最慢最不重要的數(shù)據(jù)為“冷”。
“如果你是一條航線,有人想預定一趟航班,那么讓對方快速查到航班時刻表并完成預定操作會讓客戶心情愉悅。”希捷公司高級產(chǎn)品營銷經(jīng)理Teresa Worth說。 “航班預定一旦成功,航空公司也收到了機票費,那接下來航線數(shù)據(jù)就可以從 ”熱“轉(zhuǎn)為”溫“了。如果客戶想換航班,查詢座位號或其他信息,客戶肯定還是希望速度夠快,但這時就不再是那么”熱“了,因為航空公司和該客戶的交易已經(jīng)完成。航班飛過后,數(shù)據(jù)就可以變”冷“或近線存儲了。當然數(shù)據(jù)仍需保持在可以被查詢的狀態(tài),因為客戶也許想在年末查詢當年的飛行里程,并確定他們的這次飛行拿到了積分,但這時候讓他們稍微等等也沒有什么大問題了”
就像做飯一樣,溫度就是一切?;蛟S還是跟做飯一樣,熱的材料最受關(guān)注,但做飯用到最多的還是那些冷的,放在冰箱冷藏和冷凍室里的材料。熱存儲一般都存在容量較低的驅(qū)動器中,而冷存儲驅(qū)動器通常存儲的數(shù)據(jù)則要多出好幾倍。這就形成了某種動態(tài)的平衡,你必須在設(shè)計分層存儲時考慮到這個因素。T一個公司分層存儲時采用了何種方法對公司的經(jīng)營收益會產(chǎn)生重要影響,甚至關(guān)乎著公司的存亡。
分層模型更新
存儲分層這個想法已經(jīng)出現(xiàn)幾十年了,但因為存儲技術(shù)的不斷發(fā)展,這個想法的細節(jié)也在因此不停的更改。更改集中在中間層和存儲架構(gòu)上。
這里說的中間層是指選用的存儲媒介。磁盤存儲,也就是硬盤驅(qū)動器以前既被用于交易型存儲(熱)也被用于近線存儲(溫),而磁帶則主要被用來歸檔(冷)這三種存儲的具體含義如下:
交易型存儲。指用于高速和大量商務交易的數(shù)據(jù)。交易型數(shù)據(jù)常常和產(chǎn)生利潤的業(yè)務直接掛鉤,對公司生計有著決定性的作用。
近線存儲。以上述航班的例子為例,近線數(shù)據(jù)就是指那些從即時讀取降級成快速讀取的信息。它就像是放在檔案柜的卷宗,而不再是擺在桌子上的棘手文件。你仍然能快速方便的找到它,但得稍微多花點時間。雖然時間成本增加了,但換回來的是存儲媒介成本的大幅下降。
歸檔存儲。不久,你的檔案柜存滿了。這時,企業(yè)常常會找出最老的文件,把它們裝箱然后放到像地下室或倉庫這樣的冷存儲室里。這就是歸檔。如果方法得當,所有的數(shù)據(jù)將仍然被有序存放,但很明顯,想找到具體某個箱子查找到其內(nèi)容會花更長的時間。隨著每GB磁盤存儲價格的下降,磁盤在不斷入侵并占領(lǐng)磁帶的市場,結(jié)果就是近線和歸檔存儲之間的界限越來越模糊了,但磁帶在企業(yè)歸檔市場中,尤其是在備份/故障恢復應用方面仍然處于統(tǒng)治地位。這說明,在基于磁盤的系統(tǒng)當中,磁帶庫也能被虛擬化和使用。
隨著固態(tài)磁盤驅(qū)動器的普及,很多人正在注意到金字塔尖還有一個新的存儲層:Tier 0。
“Tier 0是專屬于SSD的,它涉及到的工作任務最重,占空比、耐久力和性能穩(wěn)定性最大” 希捷公司高級產(chǎn)品營銷經(jīng)理Teresa Worth 說。 “ Tier 0上的信息都是和交易及IOPS相關(guān)的。更快地完成交易能讓公司掙更多錢,或者提升顧客的滿意度,進而增加公司的競爭力。”
如果想完整的解釋存儲架構(gòu),可能需要有一篇專門的文章。小企業(yè)用直連方式和網(wǎng)絡連接(DAS和NAS) 這兩種存儲可能就能很好的運作起來,這兩種存儲一般會分別選擇eSATA 或 USB 3.0再加以太網(wǎng),我們知道這些就夠了。但是這些連接的性能和可擴展性都受到了某種程度的限制,因此不適用于較大的存儲。而事實上,在上世紀90年代及本世紀最初幾年里,存儲區(qū)域網(wǎng)(SANs)的光纖通道技術(shù)已經(jīng)標準化了。光纖通道的成功在很大程度上是源于對協(xié)議的寬容性。IP, iSCSI, ATM和其它協(xié)議都能在該網(wǎng)絡中運行,效率也都一樣。
現(xiàn)在,作為一種網(wǎng)絡技術(shù),光纖通道能產(chǎn)生的最大傳輸速度是8 Gb/s 或16 Gb/s,但驅(qū)動器接口的最大速度則僅為4 Gb/s。對于企業(yè)來說,這樣的帶寬夠用了,但以太網(wǎng)的潛在帶寬是10 Gb/s,而且以太網(wǎng)有價格優(yōu)勢和更廣泛的使用范圍,因此光纖通道將很快面臨壓力。過去高速以太網(wǎng)的致命弱點是它的高價位以及由此對系統(tǒng)資源產(chǎn)生的影響,但網(wǎng)絡適配器中出現(xiàn)了TCP卸載引擎,它與更強有力的CPU結(jié)合后,高成本的問題已經(jīng)基本得到了解決。這項技術(shù)加速了光纖通道在架構(gòu)和存儲驅(qū)動器兩個層面的衰落,為以太網(wǎng)的iSCSI掃清了障礙,最近,因此受益的又變成了串行并列SCSI(SAS)。和光纖通道一樣,驅(qū)動連接器和存儲網(wǎng)絡互聯(lián)都在用SAS,SAS因此變成了現(xiàn)在最高性能分層存儲的最佳解決方案。我們很快將跟進一篇專門講述SAS的文章。
分層存儲服務器選擇
大多數(shù)分層存儲都會用到某種類型的存儲服務器。表現(xiàn)形式一般是:將單機服務器系統(tǒng)連在被稱為JBODs(“就是一摞盤”)的外接存儲箱上。這時,一個JBOD跟一個連在類似SAS接口上的裝有基架的磁盤柜差不太多。The JBOD attaches這個JBOD反過來又跟服務器相連,服務器里會包含一個存儲控制器,該控制器能進行RAID操作并將磁盤陣列連接到一個更大的SAN結(jié)構(gòu)中。下圖展示的Xyratex RS-1600-FC2就是一個JBOD磁盤柜。
還有另外一種方法:有些企業(yè)喜歡把控制器/服務器和驅(qū)動器裝在同一個磁盤柜里。一種常見的設(shè)計是使用12個熱插拔的3.5“驅(qū)動器,配合一個服務器平臺和3 Gb/s 的SAS結(jié)構(gòu),然后把它們裝在一個3U的磁盤擴展柜。存儲器制造商們生產(chǎn)的磁盤柜有7U的,甚至還有能裝載超過60個3.5”驅(qū)動器的8U磁盤柜,見下圖所示的雙面STX XS62-2810。
很明顯,存儲服務器的性能如何以及能否找到正確的目標層取決于使用了哪種存儲處理方法和驅(qū)動技術(shù)。裝有6 Gb/s SSDs 的最先進的Xeon 5600平臺將被應用于Tier 0,而基于SATA的JBOD如果和三年前研發(fā)的單CPU相連之后,則更適用于Tier 2?,F(xiàn)在的分層技術(shù)中有一些模糊的地方,其中大部分都是和Tier 1有關(guān)的。Tier 0需要可觀的預算作支持,才能挖掘其性能的最大潛力,而Tier 2常常被用來平衡可靠性,容量和價格。前些年談到這個話題的時候,我們的選擇似乎還只局限于兩種:也就是只需要在最快的SCSI 3.5“硬盤驅(qū)動器和最大的PATA或 SATA 3.5”硬盤驅(qū)動器之間作權(quán)衡。而現(xiàn)在,需要考慮的因素增加了很多。
這篇文章中表達的想法是和頭三級驅(qū)動器存儲相關(guān)的,也就是從交易存儲到近線存儲。這里的討論中我們可以忽略磁帶,而把目光聚焦在兩種主要存儲類型,它們的形狀系數(shù)及其它一些需要考慮的問題上,這些因素在為分層存儲方案選擇驅(qū)動器時都需要考慮到。應用程序過去一直是被磁帶和光盤統(tǒng)治的,不過,我們應該注意到,把磁盤也納入考慮范疇將越來越有其必要性。一篇由企業(yè)存儲集團撰寫蘋果公司發(fā)起的題為“分層存儲藍圖”的論文說道:在磁盤,磁帶和虛擬磁帶解決方案之中,“故障恢復的失敗率平均為40%。” 究其原因,在部分程度上問題就出在企業(yè)所存的數(shù)據(jù)的量上,以及存儲大量數(shù)據(jù)時非磁帶不選。在Tier 3選擇相對更慢但更可靠的、又能保護RAID的硬盤存儲能顯著降低深層存儲器中數(shù)據(jù)毀壞的風險。
SSD 驅(qū)動器選擇:SSD
梯形存儲的頂層是SSD,它的形狀系數(shù)一般都是2.5”?,F(xiàn)在,SSD將NAND 閃存作為其存儲媒介而不是硬盤驅(qū)動器轉(zhuǎn)盤來使用,對此你肯定已經(jīng)不再陌生了。不過,NAND 存儲器有兩種:單層式存儲(SLC) 和多層式存儲。單層和多層代表的是每個存儲單元里可放置的信息單元(bit)數(shù)。多層式存儲(MLC)的優(yōu)點是每個單元能存儲更多數(shù)據(jù),因此單個NAND芯片的總?cè)萘扛?,但這是以犧牲速度和使用壽命(系統(tǒng)失效前閃存單元可執(zhí)行的寫循環(huán)次數(shù))為代價的。
通常來講,SLC的每個存儲單元里可進行約10萬次讀寫。2-bit MLC每個單元能接受的讀寫次數(shù)只有大約一萬次,而到了3-bit MLC就僅剩一千次了。不過請記住,SSD中能進行數(shù)據(jù)寫入的邏輯單元塊有上百萬個,而且,寫入算法一直在發(fā)展,因此寫入次數(shù)也在不斷增加。隨著容量,速度,讀寫次數(shù)的增加,基于MLC的SSD正在受到企業(yè)界越來越多的青睞,而且有望成為未來Tier 0市場的主力軍。不過,SLC技術(shù)仍然是Tier 0應用程序中的首選。
在企業(yè)存儲市場中,SSD是如何被使用的呢?通過希捷公司的Pulsar系列產(chǎn)品,我們可以對此有個更清晰的認識。目前有三種Pulsar 產(chǎn)品:Pulsar, Pulsar.2和 Pulsar XT.2。早先的Pulsar 驅(qū)動器使用的SLC NAND容量分別有50, 100和200 GB,它們使用的都是3 Gb/s的SATA接口。 Pulsar.2使用MLC,容量從100到800GB不等。接口既可以選擇6 Gb/s SAS 也可以用6 Gb/s SATA,并且希捷還提供了加密功能。對那些對數(shù)據(jù)安全要求較高,尤其是法律上對此有強制性要求的企業(yè)而言,加密功能是非常關(guān)鍵的。加密功能將確保所有寫入磁盤的文件都得到AES的保護,沒有特定權(quán)限的人都不能進入。Pulsar XT.2使用了容量為100, 200和400 GB 的SLC存儲器,接口則只能選用SAS 6 Gb/s,型號有加密和不加密兩種。
Tier 0目前使用的仍然是SLC SSD,因為交易型存儲系統(tǒng)每秒產(chǎn)生的數(shù)據(jù)請求可能會多達幾百,甚至幾千個,因此寫入次數(shù)在這一級至關(guān)重要。這也是為什么盡管SSD性能表現(xiàn)非常高,一些企業(yè)公司在遇到重要應用程序時,仍然依賴硬盤的原因,因為硬盤是業(yè)界公認的MTBF 評級標準較高的產(chǎn)品。一般說來,同樣花一美元,SSD可實現(xiàn)的IOPS是企業(yè)硬盤驅(qū)動器的20倍。 HDD大約是它的10倍。用哪個技術(shù)更好呢?答案不是固定的。不同的公司應該根據(jù)自身的需求和特點,對各項技術(shù)的優(yōu)缺點進行權(quán)衡之后作出選擇。