10.4.1 網(wǎng)站SAN 存儲系統(tǒng)
環(huán)境: 網(wǎng)絡(luò)系統(tǒng)由Web 系統(tǒng)、Mail 系統(tǒng)和數(shù)據(jù)庫系統(tǒng)3 部分組成。Web 系統(tǒng)以Windows平臺為主,Mail 系統(tǒng)以Linux 平臺為主。
存儲系統(tǒng)解決方案: 以SAN 結(jié)構(gòu)實現(xiàn)數(shù)據(jù)的集中和分散數(shù)據(jù)的LAN Free 備份。
分析隱患: 由于網(wǎng)站各系統(tǒng)主機(jī)平臺多種多樣,為了保護(hù)數(shù)據(jù)必須在SAN 中實現(xiàn)LUN隔離功能。為了節(jié)約成本,方案中沒有選擇具有LUN Masking 功能的磁盤陣列系統(tǒng),而是通過主機(jī)端光纖卡中的設(shè)置,手工實現(xiàn)LUN 的屏蔽。同時,光纖交換設(shè)備也采用了成本較低的光纖Hub,而不是具有光纖交換機(jī)制的光纖交換機(jī)。
經(jīng)過復(fù)雜的設(shè)計和配置,磁盤陣列終于可以被主機(jī)識別和訪問了,網(wǎng)站就此開通。
問題: 當(dāng)將備份磁帶庫接入系統(tǒng)時,問題產(chǎn)生了。首先是由于系統(tǒng)結(jié)構(gòu)的變動,主機(jī)端的手工配置需要完全重新來過; 繼而又發(fā)現(xiàn)磁帶庫的光纖接口類型與主機(jī)端的光纖卡無法匹配; 然后是光纖Hub 無法將磁帶庫與磁盤陣列的數(shù)據(jù)分流,致使系統(tǒng)對磁帶庫操作時磁盤陣列不可用……
隨著這一系列問題的出現(xiàn),網(wǎng)站最終決定追加投資,將系統(tǒng)全面升級。但是,整個網(wǎng)站在此半個月期間不能對用戶提供及時有效的服務(wù),其損失是難以估量的。
10.4.2 某氣象單位存儲系統(tǒng)
環(huán)境: 主要是衛(wèi)星氣象數(shù)據(jù)的采集和處理。主機(jī)系統(tǒng)為IBM SP 并行機(jī),數(shù)據(jù)庫為Oracle。
存儲系統(tǒng)解決方案: 主要采用了IBM 7133 磁盤陣列。
問題: 系統(tǒng)在建成并運(yùn)行了一段時間之后,經(jīng)歷了一次意外斷電。結(jié)果Oracle 數(shù)據(jù)庫無法對數(shù)據(jù)進(jìn)行恢復(fù),致使長達(dá)數(shù)月的氣象數(shù)據(jù)丟失。
分析隱患: 事后的調(diào)查分析發(fā)現(xiàn),問題出在IBM 7133 磁盤陣列。由于IBM 7133 的磁盤數(shù)據(jù)容錯校驗并不是硬件實現(xiàn)的,所以主機(jī)端磁盤管理軟件的邏輯錯誤會造成整個磁盤陣列系統(tǒng)的數(shù)據(jù)不可用。即使設(shè)法恢復(fù)出主機(jī)端的磁盤配置方式,但由于IBM 7133 的緩存是基于電池保護(hù)的,當(dāng)意外斷電恰巧發(fā)生在電池電量不足時,會造成對磁盤陣列系統(tǒng)內(nèi)部數(shù)據(jù)完整性的破壞,數(shù)據(jù)仍然無法恢復(fù)。
IBM 7133 屬于部門級產(chǎn)品,在很多環(huán)境中都能表現(xiàn)出突出的性能優(yōu)勢。但是在本案例中,對數(shù)據(jù)安全性的要求是第一位的,另外在主機(jī)系統(tǒng)方面采用了僅次于IBM S/390 的大型服務(wù)器,可見該系統(tǒng)對安全要求之苛刻,因此在投資方面可以采用更高價的高端存儲設(shè)備。
10.4.3 某電視臺非線性編輯系統(tǒng)
該系統(tǒng)環(huán)境及系統(tǒng)結(jié)構(gòu)如下: 5 臺以Windows NT Workstation 為操作系統(tǒng)的非線性編輯工作站,通過光纖交換機(jī)共享連接硬盤塔。
需要解決的問題是: 硬盤塔在存儲業(yè)內(nèi)也稱JBOD,即沒有陣列控制器的磁盤組。由于硬盤塔、交換機(jī)和主機(jī)光纖卡之間配合的問題,系統(tǒng)連接后,主機(jī)端總是無法穩(wěn)定地訪問到磁盤,因此系統(tǒng)不能正常工作。
分析隱患: 經(jīng)過仔細(xì)檢查發(fā)現(xiàn),問題出在交換機(jī)的內(nèi)部交換機(jī)制。是過多的地址轉(zhuǎn)換造成了主機(jī)端的超時報錯。解決的辦法有二,一是增加投資,將硬盤塔換成帶有控制器的磁盤陣列; 二是減少投資,將光纖交換機(jī)換成光纖Hub。在系統(tǒng)性能和并行性壓力不強(qiáng)的情況下,最后決定采取第二種解決辦法,不僅節(jié)省了資金,而且保證了系統(tǒng)的穩(wěn)定性。
當(dāng)然,如果該系統(tǒng)的性能和并行性要求較高的話,還是應(yīng)該采取第一種解決辦法。因為光纖Hub 是共享帶寬的交換方式,而且不支持LIP 的隔離。