盡管我們很高興麥當勞已經(jīng)發(fā)誓要取消超大號的快餐食品,但全球的數(shù)據(jù)中心仍然不斷擴展自己的SAN,試圖只用一個存儲網(wǎng)絡連接數(shù)百甚至數(shù)千臺服務器和存儲設備。
標準vs.現(xiàn)實
根據(jù)美國國家標準協(xié)會(ANSI)的標準,光纖通道SAN可在單一fabric中包含最多239臺交換機,并且支持1,500萬臺設備。這些標準是根據(jù)一個3字節(jié)光纖通道地址內(nèi)可獲得的比特數(shù)而設定的,光纖通道地址與每臺交換機的唯一域名ID以及相連節(jié)點(如服務器和存儲目標)的設備標識符相關(guān)。盡管出于競爭的原因,所有的交換機廠商都表明自己符合這些標準數(shù)量,但是沒有一家廠商能夠落實到實際的產(chǎn)品中。
暫時假設一下廠商真的可以支持這些標準,那么要使一個由數(shù)百臺交換機構(gòu)成的SAN穩(wěn)定下來所需的時間,以及對數(shù)萬臺設備注冊的復雜過程,將是任何企業(yè)環(huán)境都難以承受的。不過,許多客戶正在努力構(gòu)建大規(guī)模的fabric,以支持自己的業(yè)務應用,方法是通過連接控制級的fabric或者構(gòu)建復雜的部門級交換機網(wǎng)絡。
為何構(gòu)建大規(guī)模SAN?
存儲經(jīng)理們正試圖構(gòu)建大規(guī)模SAN fabric,原因很多。一般來說,大型存儲網(wǎng)絡的目的并不是提供所有設備之間的連通性,而是大多數(shù)情況下,一個大規(guī)模多交換機fabric的產(chǎn)生是緣于想通過數(shù)百臺服務器共享一個或多個存儲系統(tǒng)–也就是以多連少的連接策略。
例如一個大企業(yè)可能已經(jīng)投資了數(shù)十萬美元創(chuàng)建大型自動磁帶庫,為了和數(shù)百臺設備共享這一存儲資源,就必須通過交換機間鏈路(ISL)連接多臺控制設備或交換機。
同樣的,在500多臺服務器之間共享幾個大規(guī)模存儲陣列也可能需要在10多個控制級fabric之間建立多個ISL。從客戶的角度來看,更有效地共享存儲資產(chǎn)是相當簡單的,不過在技術(shù)上實現(xiàn)這一目標就可能非常復雜。
大規(guī)模SAN有大問題
構(gòu)建大規(guī)模多交換機SAN需要進行細致的網(wǎng)絡設計,以確保交換機之間分配有足夠的帶寬,從而優(yōu)化應用性能。另外,保護不受故障鏈路影響也需要設計一種網(wǎng)狀結(jié)構(gòu),以便提供通過fabric的替換路徑。
為提升性能和設計替換路徑而分配ISL會消耗昂貴的fabric端口,減少連接服務器和存儲目標的總端口數(shù),所以fabric網(wǎng)格結(jié)構(gòu)越緊致,SAN的總生產(chǎn)力越低。
當客戶試圖采用16或32端口的fabric交換機構(gòu)建大規(guī)模fabric時,這顯然是個很棘手的問題。在這樣的配置中,總端口數(shù)的三分之一(或更多)可能會專用于ISL。通常控制器端口數(shù)越多,在擴展至大規(guī)模SAN時就更具效率,因為每個支架上有更多的端口用于設備連接。另外,新的10 Gbps ISL方案簡化了交換機至交換機的連接,并且避免了多ISL的中繼問題,如可能出現(xiàn)的紊亂的幀發(fā)送。
構(gòu)建大規(guī)模SAN時會出現(xiàn)一些可能影響fabric穩(wěn)定性的意想不到的后果。由于光纖通道內(nèi)在的結(jié)構(gòu)化特性,以及具體廠商對設備的實施情況,在單一fabric中連接8臺以上交換機時也許會造成不穩(wěn)定的操作。光纖通道是一種鏈路層架構(gòu),很象橋接LAN。二層網(wǎng)絡擁有最優(yōu)化的性能和最低的協(xié)議管理費用,這很好地滿足了通道上塊數(shù)據(jù)對性能的需求。
因此,連接多臺fabric交換機擴展了扁平的網(wǎng)絡空間,象橋接LAN一樣,扁平的網(wǎng)絡架構(gòu)容易受到整個網(wǎng)絡范圍內(nèi)的干擾。在橋接LAN環(huán)境中,廣播風暴會對所有連接節(jié)點帶來負面影響,而在光纖通道SAN中,同樣的干擾可能來自于fabric內(nèi)意外變化(如在大規(guī)模運作fabric中接入一臺帶電交換機)而產(chǎn)生的狀態(tài)改變通知信號和偶然的fabric重新配置。如下文所說,SAN路由通過網(wǎng)絡分區(qū)解決了大規(guī)模fabric的這些問題。
另外,由于單一fabric中連接了更多的交換機,也需要進行更多交換機至交換機的通信,以便正確分配唯一的地址塊、處理分區(qū)信息、向簡單名稱服務器(SNS)表中添加新條目,以及交換路由信息等。有時候有限的SNS容量可能會限制單一fabric所能支持的設備數(shù)。
大多數(shù)情況下,由于fabric增加至1000多臺設備,如果發(fā)生中斷,那么穩(wěn)定網(wǎng)絡所需的連接時間可能會變得很漫長。第一次構(gòu)建fabric并對服務器和存儲設備進行注冊時,所需的交換機至交換機的對話大量增加,因為有更多的交換機要添加到fabric中。如果不小心超過了SNS的容量限制,那么fabric也許最終會穩(wěn)定下來,但是不是所有的設備都會被識別。
控制超大規(guī)模SAN
令人高興的是,新的fabric技術(shù)已經(jīng)很大程度上推動了大規(guī)模SAN中SNS、ISL、匯合及廣播等問題,這些新技術(shù)包括10 Gbps交換機間鏈路、動態(tài)分區(qū),和SAN路由等。在控制設備之間采用一個或多個10 Gbps ISL不僅簡化了線纜的鋪設,而且克服了中繼和負載平衡問題。
關(guān)于如何提升ISL鏈路的性能同時確保幀的正常發(fā)送,fabric廠商已經(jīng)做了一些時間的努力。例如,通過4個中繼交換機間鏈路發(fā)送的單一序列幀也許會按隨機順序到達目的地。如果不采用復雜的排隊算法,是不可能利用多個交換機間鏈路來增加帶寬的。
另一方面,如果只通過指定的ISL發(fā)送序列,就可能造成一些ISL被過度使用,而另一些ISL卻未得到充分利用。只要用一個10 Gbps ISL替換多個2 Gbps的ISL,即可解決性能和幀發(fā)送等問題。
動態(tài)分區(qū)
動態(tài)分區(qū)(由Sanera開創(chuàng),現(xiàn)在是McDATA產(chǎn)品線的一部分)通過將單一大型控制設備基于硬件技術(shù)分割成不同的SAN分區(qū),解決了SNS表的臃腫問題。例如一個256端口的控制設備可被分成多個獨立的分區(qū),為不同的部門或應用服務。由于每個分區(qū)都有一個更小的SNS,并且獨立于其它分區(qū)進行操作,因而減小了每個分區(qū)的匯合時間。
另外,動態(tài)分區(qū)還允許在每個分區(qū)上運行不同的微碼版本,并且每個分區(qū)可以重新設置而不影響整臺交換機。采用幀標記的基于軟件的方案(如Cisco的VSAN)可將一臺交換機內(nèi)的數(shù)據(jù)流分離,但是無法適應多個微碼版本或有選擇地進行重新設置。
SAN路由
SAN路由技術(shù)(Nishan Systems首創(chuàng))通過提供一個三層路由功能連接SAN,解決了大規(guī)模fabric的問題。SAN路由并不主張創(chuàng)建一個會出現(xiàn)SNS、匯合及重新配置等問題的單一大規(guī)模fabric,而是堅持每個SAN分區(qū)的自主性,并且同時允許SAN分區(qū)之間進行指定的存儲對話。
客戶要求能夠在數(shù)百甚至數(shù)千臺設備之間共享存儲資產(chǎn),并且消除大規(guī)模網(wǎng)狀SAN所具有的扁平網(wǎng)絡問題,SAN路由正與客戶的這些需求相一致。正如IP路由解決了橋接LAN的廣播風暴問題,SAN路由則能夠讓客戶利用多個分離的SAN構(gòu)建穩(wěn)定而大規(guī)模的存儲網(wǎng)絡。
總的說來,這些新方案可以幫助存儲經(jīng)理們達到他們的業(yè)務目標,即以更低成本更有效地共享和管理存儲資產(chǎn)。這樣就能滿足光纖通道架構(gòu)的需求,而不必強迫客戶使他們的業(yè)務目標適應SAN技術(shù)的特殊性質(zhì)。