從1952年發(fā)明磁帶起,IBM一直引領(lǐng)存儲科技的發(fā)布,IBM存儲架構(gòu)部杰出貢獻(xiàn)科學(xué)家Gail Spear向與會者介紹了她在IBM的三十年,以及與企業(yè)級存儲系統(tǒng)架構(gòu)的發(fā)展。
Gail Spear:早上好,謝謝大家給我這個機會在北京這個美麗的城市與大家見面,我今天要講一下在IBM的經(jīng)歷,我經(jīng)歷了很多的變革,因為在這個公司時間很久了,我還希望向大家介紹一下IBM在存儲方面的領(lǐng)先地位,今天的存儲架構(gòu)和明天的存儲架構(gòu)。我是1979年7月作為可靠性工程師加入IBM,這是很久以前的事了,我加入IBM的時候,IBM在存儲方面的世界領(lǐng)先企業(yè),從那時起出現(xiàn)了無數(shù)難以置信的變化,特別在不同的存儲領(lǐng)域,可靠性、驅(qū)動器接口、緩存算法、數(shù)據(jù)復(fù)制都有不同,在緩存算法、錯誤修整和數(shù)據(jù)復(fù)制獲得很多專利,最近10年我的精力集中在數(shù)據(jù)復(fù)制和災(zāi)難恢復(fù)領(lǐng)域,我們有機會在圣何塞與存儲先鋒一同工作,我們在1956年做了世界第一塊磁盤,同時做存儲研究。
我在IBM快30年了,這30年來發(fā)生了很多的變化,在坐的有一些人可能還記得,這是一個非常老的磁盤驅(qū)動器,這是70年代的產(chǎn)品,這是3420磁帶驅(qū)動器,這里有很多磁帶,還有卷式磁帶容量是160MB,按今天標(biāo)準(zhǔn)存儲量很小的,當(dāng)時沒有自動裝載磁帶的方式,必須有人手工裝帶,尋找磁帶再裝上,所以獲得數(shù)據(jù)很慢,而且管理這些磁帶非常困難,這些磁帶過去都是放在大柜子里面。
當(dāng)時磁盤存儲是這樣的,可以看到有一個老的3380,放在兩個不同的箱子里,比今天DS8000需要占更多的面積,這上面有一個標(biāo)簽說如果你要修改它,一定要找一個朋友幫你,因為非常沉。在控制器中沒有緩存的,我們有很多想法做緩存,比如磁頭,磁頭是動不了的,當(dāng)時還有磁泡存儲,這速度和半導(dǎo)體速度一樣快,成本也很低,最后相反和磁盤存儲速度一樣慢,和半導(dǎo)體同樣的貴。當(dāng)時我們沒有RAID,但是有非常可靠的方式來做,比以前有很高的改善,在這圖上還有一點就是客戶化邏輯,專門為產(chǎn)品設(shè)計的,需要很長的時間來開發(fā)這個產(chǎn)品。
這是現(xiàn)在的存儲,大家可以看到新的虛擬磁盤服務(wù)器,有60GB的磁盤介質(zhì),剛才說達(dá)到200GB,實際上向TB演進(jìn),向60GB又進(jìn)了一大步,大家可以看到300GB DDM,這很輕DS6000有5TB存儲空間,DS8000最大可以實現(xiàn)192TB的存儲。
剛才說單位面積內(nèi)容量巨大飛躍,磁盤密度和轉(zhuǎn)速也有巨大飛躍,第一次來公司的是大概300RPM,現(xiàn)在13000RPM,剛來公司的時候,我想這個速度還會更快,我們控制器都是緩存控制器,所有行業(yè)的控制器都已經(jīng)實現(xiàn)緩存控制器,過去只支持大型主機,現(xiàn)在可以支持多主機的平臺,iSeries,UNIX,Linux、Windows等其他的也都可以支持,存儲不僅可以讀寫數(shù)據(jù),還提供很多先進(jìn)的功能都可以在存儲實現(xiàn),比如復(fù)制數(shù)據(jù)保護,通過RAID實現(xiàn)數(shù)據(jù)保護,我們還看到這個趨勢在存儲方面有更多的功能都可以讓客戶利用。
我現(xiàn)在用很短時間介紹創(chuàng)新,這是IBM存儲的信息,IBM存儲部門的規(guī)模已經(jīng)相當(dāng)于《財富》450強的企業(yè),我們有3千員工在160國家支持存儲系統(tǒng),我們有14個研發(fā)實驗室分布全球,在研發(fā)方面有7.5億美元的投入,存儲方面我們創(chuàng)新具有領(lǐng)先地位,我們專利數(shù)超過所有競爭對手,這使得我們在研發(fā)方面可以采用最先進(jìn)的技術(shù),在實際應(yīng)用中也有最先進(jìn)的技術(shù)。
這張圖介紹了IBM整個公司的專利,我們可以看到在過去幾年我們在各方面都占據(jù)第一,這是我們擁有專利的數(shù)量,這也意味著我們產(chǎn)品創(chuàng)新非常積極。在美國IBM專利數(shù)量也居領(lǐng)先地位,從1993年到2005年,在存儲方面我們今年已經(jīng)提交了286個專利的申請。這是關(guān)于存儲方面專利的比較,IBM和一些主要的存儲廠家的比較,每年申請的存儲專利都比我們?nèi)魏我粋€競爭對手都要多。 我談一下存儲的架構(gòu)和現(xiàn)在的進(jìn)展,因為我負(fù)責(zé)這一塊的。
我們有很多的存儲產(chǎn)品線,以前可能有一個磁盤控制器,一個磁帶的產(chǎn)品,現(xiàn)在有一系列的產(chǎn)品了,我想今后這兩天你們會聽到更多的,還有中端的存儲網(wǎng)絡(luò),還有剛才提到的產(chǎn)品,以及企業(yè)界的,還有DS6000/DS8000,還有自動磁帶庫,另外非常好的使用,性能也非常高,把它都擱在一起就是存儲軟件提供了虛擬化,以及便于管理的性能。
這是DS產(chǎn)品家族,這產(chǎn)品從低端DS300到DS400,一直到DS8000企業(yè)級的產(chǎn)品。我們用共同的平臺來管理這些產(chǎn)品,我們有數(shù)據(jù)復(fù)制的功能,這樣的話這些存儲的控制器,另外還可以虛擬化的管理所有產(chǎn)品。我們以前有控制器的時候有邏輯,這個邏輯專門針對這個產(chǎn)品的,在過去幾年中我們和其他公司一起利用協(xié)同的效力,這樣利用PC服務(wù)器的技術(shù)放在存儲服務(wù)器上,這樣它的每次處理就快,我們可以放在存儲控制上,這樣性能就快了,因為我們這個架構(gòu)是基于這個建造起來的,所以從一個控制器到另外一個控制器很容易移動并且有很高控能的處理,并且可以重新使用我們的微碼,我們有時候也開玩笑,如果存儲時間夠,而且有很多的硬件,最終會不行,但是我們微碼有時間的話最終還是有用的,我們想確保把微碼技術(shù)的東西放在產(chǎn)品上,我們可以看到75%DS8000的碼都是從以前ESS800產(chǎn)品中拿出來的,97%DS6000跟DS8000中也有。
這是我們使用的拓?fù)浼夹g(shù),我們可以看到DS8000,也就是我們重新使用它的東西,把微碼也重新利用,有時候是重復(fù)存儲的盒子,這是存儲最基本的要求,存儲要保持,現(xiàn)在我們可以看到是一致性的記憶,這樣的話使得我們能夠有備份的數(shù)據(jù)。我們也可以看到這里還有RAID適配器,還有后端。
在DS8000有一個智能的適配器,使得性能從主機中來的,然后放到存儲控制器中,使得性能更好,另外提供端對端的檢查,一旦進(jìn)入存儲控制器,我們確保一直到后端都是好的數(shù)據(jù),我們從磁盤的存儲中要確保存儲是一致的。
這圖看起來和前面的圖非常像,這是一個設(shè)備接口卡,我們可以我們使用的是PowerPC的技術(shù),同時提供的東西使得能夠確保從后端到存儲的控制器都是對的,每次要對它進(jìn)行檢查。在早些時候的產(chǎn)品中,在后端使用這樣一種技術(shù),這樣可以跟SSA來對話,我們認(rèn)為是最快最可靠的技術(shù),為什么不用光纖的系統(tǒng)呢?我們很多競爭對手這么使用了,我們之所以沒這么做,因為光纖的通道可靠性以及性能不是我們所要的,直到我們有了這么一個設(shè)計,也就是有了光纖環(huán),這樣就有很多好處,同時如果其中一個連接掉了,我們很難知道哪兒壞了,有了交換式的光纖通道,我們有了這樣的方法,這樣我們還有富余的連接,我們不會有延遲,如果一個連接壞了,還有另外一個,使得你能夠接入每一個DDM,而且很容易查出來哪一個不好。
我前面提到有很多的功能,先進(jìn)的功能放在存儲里面,一個是彈性組,這樣可以很好地使我們保護這個數(shù)據(jù),而在27年前沒法很好的保護,另外就是城域鏡像,我們可以在300千米左右進(jìn)行同步鏡像。另外比如ESS800和DS80000和DS6000的產(chǎn)品還有一個SVC,這樣我們可以提供更多的,另外在行業(yè)方面也是領(lǐng)先的性能,特別進(jìn)行同步數(shù)據(jù)鏡像的時候非常重要的。另外還有全球鏡像,這可以從一個存儲的控制到另外一個在很多很多公里以上的距離上有三到五秒數(shù)據(jù)延遲,同時可以使你在數(shù)據(jù)中心遭受災(zāi)難的時候可以恢復(fù)它,而且在很遠(yuǎn)的地方就可以進(jìn)行恢復(fù)。另外還有一個全球鏡像主要配合z系列,這是一個最好的異步解決方案,幾秒鐘數(shù)據(jù)延遲,如果對它進(jìn)行鏡像,如果邏輯方面不行,這樣我們就有兩個數(shù)據(jù),所以我們要保護自己不會刪除錯誤的數(shù)據(jù),或者數(shù)據(jù)受到病毒的污染,我們要保護他們。我們就有FlashCopy,就有基于時間點的拷貝,一般一有什么不好我們馬上可以恢復(fù)它。
下面我們談一下未來的存儲架構(gòu),因為我們不斷地在做存儲方面的創(chuàng)新,以后會怎么樣呢?Elly在前面談到很多的挑戰(zhàn),我們未來要面臨很多的挑戰(zhàn),數(shù)據(jù)是迅猛發(fā)展的,我們都有這方面的感受,還有物理空間的限制,同時要更有效地利用管理存儲,要加強數(shù)據(jù)的保護,這些都是非常重要的,除了保護我們的業(yè)務(wù),要確保我們能恢復(fù),在災(zāi)難時候恢復(fù)數(shù)據(jù)的時候,政府規(guī)定也有很高的要求,這要重新考慮恢復(fù)的程序和離數(shù)據(jù)中心比較遠(yuǎn),還有數(shù)據(jù)安全性的問題,我們怎么樣保護數(shù)據(jù)的安全不受任何人威脅呢?另外有很大的數(shù)據(jù)中心,里面有很多存儲,有很多服務(wù)器,我們怎么管理這些呢?我們怎么跟蹤這些呢?
我們利用了為p系列處理器8路的系統(tǒng),利用p系列的服務(wù)器,利用邏輯,我們使用了一些放在存儲控制器上,這樣有多功能,現(xiàn)在我們可以很好地利用它,除此之外我們還可以想像除了使用這些存儲控制器還有虛擬的存儲控制器都放到一個盒子里面,同時我們還可以放在不同的應(yīng)用,同時不用一個虛擬的處理器,或其他的處理器,我們把處理器分成微處理,微分區(qū),這樣進(jìn)行進(jìn)一步的分區(qū),因為有些時候有些應(yīng)用不需要整個處理器,在以后存儲LPAR等有一個動態(tài)的應(yīng)用,如果你有八個虛擬存儲控制器放在一個地方,你決定其中一個需要更多處理能力,你可以把處理能力或者記憶放在這里,改進(jìn)這個虛擬存儲控制器的功能。
我們?yōu)榱藨?yīng)對數(shù)據(jù)的增長,利用LPAR,把不同的應(yīng)用除了存儲控制器和微碼放在存儲控制器里面,這些應(yīng)用可能是這樣的應(yīng)用,它跟存儲特別接近,比如NAS系統(tǒng),SFS系統(tǒng),和其他的系統(tǒng),我們可以把目標(biāo)服務(wù)器和其他東西方在這里面,另外我們可能有一個數(shù)據(jù)庫加速器,有了這個數(shù)據(jù)庫以后,要做檢索搜尋的時候,要把所有的數(shù)據(jù)都讀一遍,在數(shù)據(jù)庫選出你想要的這些東西,但是如果這個搜索在存儲控制器中就可以做完,而不是一直到主機上做這個數(shù)據(jù)的話會好一些,因此我們這個應(yīng)用是一個DB2或Oracle數(shù)據(jù)庫有這樣的能力,還可以做其他的搜索、備份、TSM,Legato Veritas以及其他的,這會給你提供磁盤到磁帶的備份,還有醫(yī)學(xué)影像使用都可以,還有數(shù)據(jù)的管理和控制。我們可以看到集成的功能有HMC和SVC,這樣減少中心的復(fù)雜性,因為減少了盒子的數(shù)量。
我們談一下數(shù)據(jù)的保護,有存儲的復(fù)制,有短距離或長距離的復(fù)制,我們想把這兩功能合在一起,這樣有高可用性,并且有災(zāi)難恢復(fù)的保護,因此有一個三點復(fù)制,我們在這里可以看到A、B是同步的復(fù)制,如果丟掉一個存儲的控制器,或者因為維修的關(guān)系拿走,幾秒之內(nèi)整個會挪用到另外一個控制器上,而且數(shù)據(jù)不會損失,也不會影響到你。如果你有現(xiàn)場的災(zāi)難,你可能在遠(yuǎn)處C點,對它進(jìn)行恢復(fù),也就耽誤幾秒鐘數(shù)據(jù),這紅線表明不管哪一個存儲控制器,或哪個地點壞了,可以和另外兩個合在一起,這樣備份也是不受影響的。
現(xiàn)在正在做的是一個持續(xù)性的數(shù)據(jù)保護,有時候要用Flashcopy,這是24小時或48小時以前的了,有了這持續(xù)保護,可以把每一個數(shù)據(jù)版本留下來,是連續(xù)記錄的,我們可以在以前任何一個版本進(jìn)行恢復(fù),比如有一個病毒把你數(shù)據(jù)弄壞了,你想一下可能10點病毒攻擊我的,你可以從9:59恢復(fù)這個數(shù)據(jù),這樣數(shù)據(jù)損失非常小的,正好在數(shù)據(jù)不行的時間進(jìn)行恢復(fù)。再有數(shù)據(jù)的安全有一些擔(dān)心,有人可能利用我們的數(shù)據(jù),或者修改我們的數(shù)據(jù),比如磁帶有時候會丟了,或者被人偷了,除此之外磁帶的存儲會受到影響,我們要對它進(jìn)行加密,這樣的話磁帶加密以及磁盤的加密可以確保它的安全性。
數(shù)據(jù)保護冰立方產(chǎn)品是在一個研究中心做的,它包括積木、我們可以看到藍(lán)色的連接器,這些連接器把每一個RAID和另外一個連在一起,而且是沒有線的,這樣我們可以把很密的放在一起,而且比較可靠,機架里任何東西都可以使用,這樣我們就可以有這么一個存儲的產(chǎn)品,你不會去更改它的DDM,它本身已經(jīng)有足夠東西都可以使用,你不需要去替代它,而且我們可以在這里添加這個模塊,添加這個積木,但是你不會修復(fù)它也不會從中間取出一塊,這樣整個系統(tǒng)的穩(wěn)定性和可靠性就增加了。
我們有數(shù)據(jù)爆炸式的增長,我們有很多很多的服務(wù)器,我們有SAN,我們還會有所有IBM的存儲,也可能你沒有,也可能有除IBM以外的存儲,那我們未來怎么管理呢?這表明一個單一整合后的存儲管理,這樣的話我們就可以對于服務(wù)器、應(yīng)用,SAN,存儲都是從一個地方管理的,你要保護數(shù)據(jù)還有一些政策為基準(zhǔn)的服務(wù)器、網(wǎng)絡(luò)、應(yīng)用等等,而且是在不同的平臺上。這個數(shù)據(jù)使得我們能夠更好地利用它,而且可以從40%利用率增加到60%的利用率,我想以后會達(dá)到90%或100%利用率,以后會有災(zāi)難備份和恢復(fù),以及故障結(jié)環(huán)在同一個地方或不同的地方。在下一個圖中關(guān)鍵性的數(shù)據(jù)性能是非常好來進(jìn)行存儲,而且非??煽?,另外不那么貴。我們用了一些時候的數(shù)據(jù)就自動存檔了,和生命信息周期管理。
我的發(fā)言到此結(jié)束,感謝大家聽我的發(fā)言,希望能夠在會議期間與大家有機會見面!