NetApp E540支持19.2TB或9.6TB配置,也就是24(滿配)或12個(gè)(半配)800GB SSD,本圖中的EF540樣機(jī)即半配,從露出的SSD開(kāi)始向左是12個(gè)
區(qū)別在于,EF540支持多達(dá)24個(gè)2.5英寸SAS SSD——雖然它也保留了SAS擴(kuò)展接口(連磁盤柜),但我認(rèn)為,主要是留著比去掉更省事。因?yàn)橹辽俚侥壳盀橹?,EF540支持SSD的數(shù)量為12個(gè)(半配)或24個(gè)(滿配),不可擴(kuò)充。E5424呢?支持的驅(qū)動(dòng)器數(shù)量可達(dá)384個(gè),高一個(gè)數(shù)量級(jí)還多,并能解釋兩者型號(hào)上一位數(shù)字之差,蠻科學(xué)的嘛。
EF540樣機(jī)的控制器,配備4個(gè)8Gb FC主機(jī)端口,6Gb SAS擴(kuò)展端口純屬擺設(shè)
就一款中端磁盤陣列來(lái)看,E5400的架構(gòu)很高效,實(shí)際輸出帶寬超過(guò)6GB/s,但在24個(gè)SSD面前,算不了什么,甚至24個(gè)高速的15K RPM SAS硬盤也能接近這一水平。
當(dāng)然,堆疊數(shù)百個(gè)硬盤可以錄得更高的IOPS,但就E5400系列而言也很難超過(guò)10萬(wàn)。至于EF540,官方數(shù)據(jù)是30萬(wàn)IOPS,以我見(jiàn)到的SanDisk LB 806M(原屬Pilant)而言,單盤指標(biāo)讀10萬(wàn)IOPS,讀寫(xiě)混合(數(shù)據(jù)庫(kù)典型七三開(kāi))亦在2萬(wàn)以上,就是下降到1萬(wàn)出頭,24個(gè)已經(jīng)夠多的了。如果擴(kuò)充SSD數(shù)量得到的只是容量,那不如再接點(diǎn)硬盤驅(qū)動(dòng)器啦——那還能叫全閃存陣列么?
EF540采用的800GB Pilant Lightning系列6Gb/s SAS企業(yè)級(jí)SSD(現(xiàn)屬于SanDisk,型號(hào)仍為L(zhǎng)B 806M),但也支持Intel等知名廠商的產(chǎn)品
硬件沒(méi)變化,軟件呢?EF540推出時(shí)采用的操作系統(tǒng)是SANtricity 10.84,與E5400系列的最新版本一樣。有何不同?NetApp公司產(chǎn)品市場(chǎng)高級(jí)總監(jiān)Mark Welke在接受我們采訪時(shí)表示,EF540在四個(gè)方面對(duì)SSD進(jìn)行了優(yōu)化:
前三個(gè)都屬于SANtricity操作系統(tǒng)的功能,算不算升級(jí)還不好說(shuō),因?yàn)镋5424支持SSD Cache功能已有一段時(shí)間。I/O性能是SSD相對(duì)硬盤驅(qū)動(dòng)器的最大優(yōu)勢(shì),支持更大的隊(duì)列深度實(shí)屬正常(單個(gè)SAS HDD在隊(duì)列深度超過(guò)64之后,I/O性能就很難提高了,256基本是個(gè)擺設(shè));倒是EF540作為全閃存陣列,需要較長(zhǎng)期的保留數(shù)據(jù),對(duì)SSD的可用性和可靠性有很高的要求。
總之這些優(yōu)化都可視為在陣列操作系統(tǒng)(固件)上打的“補(bǔ)丁”,往簡(jiǎn)單里說(shuō),無(wú)論磁盤驅(qū)動(dòng)器還是固態(tài)盤,EF540就提供一個(gè)版本的OS,如果判斷出用的是固態(tài)盤,開(kāi)啟相應(yīng)的設(shè)置就可以了。很多閃存相關(guān)的底層功能(如FTL等),由SAS/SATA SSD上的控制器實(shí)現(xiàn),交給了Intel、SANdisk、Seagate、SMART Modular Technologies、STEC、Toshiba等SSD供應(yīng)商。譬如質(zhì)保方面,在EF540的SSD列表中的希捷Pulsar.2,就提供了5年的有限保障。
從這個(gè)角度來(lái)說(shuō),EF540與之前的HP P4900或EMC全閃存配置的VNX類似,是在傳統(tǒng)磁盤陣列的基礎(chǔ)上,為一種特殊的驅(qū)動(dòng)器(SSD)做優(yōu)化而已。這樣的所謂全閃存陣列,側(cè)重點(diǎn)在“陣列”上——整體而言,無(wú)論硬件架構(gòu),還是軟件功能,長(zhǎng)期的積累都圍繞磁盤展開(kāi)。雖然也對(duì)閃存不耐寫(xiě)等特性加以調(diào)整,但能做的終歸有限……
那么,是不是從一開(kāi)始就完全圍繞閃存設(shè)計(jì),沒(méi)有考慮過(guò)磁盤的全閃存陣列,就可以說(shuō)側(cè)重點(diǎn)在“全閃存”上呢?
傳統(tǒng)的存儲(chǔ)系統(tǒng)也被稱為“磁盤陣列”,眾所周知是因?yàn)镽AID的緣故。與單個(gè)驅(qū)動(dòng)器/模塊相比,RAID可以提高性能(并發(fā)訪問(wèn))和可用性(避免單點(diǎn)故障),這對(duì)閃存也是有價(jià)值的,所以能有“全閃存陣列”這個(gè)對(duì)應(yīng)的概念。由于閃存與磁盤的特性非常不同,一款真正圍繞閃存設(shè)計(jì)的全閃存陣列,肯定不能簡(jiǎn)單照搬基于磁盤的RAID技術(shù),但是否完全與磁盤時(shí)代的積累(如SAS)“劃清界限”,就是正確的選擇呢?
Violin Memory的vRAID技術(shù),RAID控制器與VIMM的組合,與常規(guī)的磁盤RAID類似,差異在于RAID算法和VIMM
我們不妨先來(lái)看看,全閃存陣列代表性廠商Violin Memory在介紹其專用的閃存RAID算法vRAID時(shí),列舉了閃存解決方案在算法上面對(duì)的一些挑戰(zhàn):
不難看出,這些算法不一定都要在RAID控制器層面解決,閃存控制器就可以做到。不過(guò),那些不提供SAS/SATA SSD的廠商認(rèn)為不應(yīng)該引入這兩種協(xié)議,原因包括SAS/SATA接口最初也主要是為磁盤開(kāi)發(fā)的,帶寬不夠給力(12Gb/s SAS綜合起來(lái)與PCIe 3.0有一拼,劣勢(shì)是剛開(kāi)始產(chǎn)品化),更重要的是增加了(到PCIe)協(xié)議轉(zhuǎn)換的延遲。但是,考慮到要經(jīng)過(guò)FTL(不管這層在哪兒實(shí)現(xiàn))、各種接口(如PCIe)的控制器、RAID(不論磁盤RAID還是所謂vRAID)、主機(jī)端口(PCIe、InfiniBand、FC或iSCSI)等多個(gè)環(huán)節(jié),SAS/SATA的這點(diǎn)延遲,貌似也算不了什么。舉例來(lái)說(shuō),Violin Memory的3000/6000系列全閃存陣列的延遲指標(biāo),使用SLC閃存的型號(hào)低于250微秒(μs),MLC閃存的型號(hào)低于500微秒,與NetApp EF540宣稱的“亞毫秒級(jí)”(ms,1000微秒)相比并無(wú)明顯優(yōu)勢(shì)。
閃存芯片封裝后做在形似內(nèi)存條的VIMM上,再形成vRAID組
在閃存模塊的層面上,Violin Memory全閃存陣列沒(méi)有選擇常見(jiàn)的SAS/SATA SSD,而是采用了專有的VIMM(Violin Intelligent Memory Module)。正如其名稱所顯示的,VIMM看起來(lái)很像內(nèi)存條,但作用與SAS/SATA SSD相當(dāng),其組成部分包括高性能閃存控制器、管理處理器、DRAM(保存元數(shù)據(jù))和NAND閃存芯片,完成閃存轉(zhuǎn)換層(Flash Translation Layer,F(xiàn)TL)的工作,充分利用每個(gè)閃存芯片并給予精心保護(hù),其板載DRAM保存元數(shù)據(jù)的做法又降低了vRAID控制器模塊的負(fù)擔(dān)(源自Violin Memory的資料)。
Violin認(rèn)為其vRAID相對(duì)基于磁盤的傳統(tǒng)RAID優(yōu)勢(shì)明顯
基于硬件的閃存vRAID以4+1的方式使用VIMM,閃存的容量利用率能夠達(dá)到80%,據(jù)稱有類似RAID 6的數(shù)據(jù)丟失率(4+1像RAID 5,但RAID 6的數(shù)據(jù)保護(hù)更好)。按照Violin Memory的說(shuō)法,vRAID通過(guò)兩種途徑降低4K塊讀取的延遲:
拋開(kāi)這些技術(shù)細(xì)節(jié)不論,最終結(jié)果如何?Violin Memory宣稱其全閃存陣列可以在3U機(jī)架的空間內(nèi)提供高達(dá)100萬(wàn)的IOPS,而延遲低至100微秒。指標(biāo)不錯(cuò),但與幾乎沒(méi)特別為閃存考慮的EF540相比,并沒(méi)有拉大到數(shù)量級(jí)的差距。如果將全閃存陣列分解為陣列控制器(負(fù)責(zé)RAID)和閃存模塊(提供內(nèi)部接口、FTL和閃存存儲(chǔ))兩個(gè)部分,那么所謂傳統(tǒng)的磁盤陣列硬件架構(gòu)也完全可以針對(duì)閃存而改造:RAID算法充分為閃存優(yōu)化,加寬內(nèi)部傳輸通道,SAS/SATA SSD的控制器實(shí)現(xiàn)更好的FTL……除了SAS/SATA協(xié)議層不宜過(guò)分夸大的延遲,貌似沒(méi)有什么是無(wú)法逾越的。
Violin 6000的VIMM和RAID控制器
Violin Memory不會(huì)認(rèn)同上述推斷,或許實(shí)際的性能表現(xiàn)也能證明他們?nèi)匀皇菍?duì)的。但是在現(xiàn)在這個(gè)時(shí)代,兩倍以內(nèi)(超出幅度<100%)的硬件性能優(yōu)勢(shì),很容易被成本等方面的劣勢(shì)所消解——畢竟不計(jì)代價(jià)追求所謂“極致性能”的用戶是少數(shù)。不難想見(jiàn)的是,在沒(méi)有足夠用戶規(guī)模支撐的情況下,Violin Memory要維護(hù)其專有的VIMM,硬件成本會(huì)很高。
EMC認(rèn)為,在(寫(xiě)?)延遲的數(shù)量級(jí)上,PCIe閃存卡的優(yōu)勢(shì)沒(méi)有傳說(shuō)的那么明顯
構(gòu)筑相對(duì)于SAS/SATA SSD“優(yōu)越感”的另一種替代方案是采用PCIe閃存卡來(lái)搭建全閃存陣列,譬如EMC去年在推出其PCIe閃存卡VFCache(現(xiàn)已更名為XtremSF,SF代表Server Flash)的同時(shí),也宣布了基于VFCache的全閃存陣列“Thunder項(xiàng)目”(Project Thunder)。
2012年2月EMC公布的“雷電項(xiàng)目”(Project Thunder)的設(shè)計(jì)概念,“低延遲、高帶寬硬件,輕量級(jí)軟件堆?!北砻鬟@是一款幾乎純硬件的產(chǎn)品
從VFCache到XtremSF,硬件主要都來(lái)自Micron(美光)。Micron的RealSSD P320h也是原生PCIe架構(gòu),不存在PCIe轉(zhuǎn)SAS/SATA的問(wèn)題。如果你覺(jué)得傳統(tǒng)PCIe插卡的形式不夠popular、不易維護(hù),P320h也有2.5英寸驅(qū)動(dòng)器外形(接口還是PCIe)的型號(hào)。
可是,不管哪一種,在相對(duì)大量的SAS/SATA SSD面前,PCIe閃存卡/SSD目前仍屬小眾產(chǎn)品,成本很難降下來(lái)。如果你認(rèn)同(至少)對(duì)全閃存陣列而言,在商品化的硬件上,通過(guò)軟件提供核心價(jià)值是發(fā)展方向——那么,在各種形式的PCIe閃存產(chǎn)品具有足夠的出貨量及成本競(jìng)爭(zhēng)力之前,看不出全閃存陣列有非用其不可的必要。
有了上面的認(rèn)識(shí),就不難理解,EMC會(huì)收購(gòu)采用“傳統(tǒng)”SAS SSD的XtremIO,并放棄Thunder項(xiàng)目是基于怎樣的考慮了。
EMC企業(yè)存儲(chǔ)產(chǎn)品部高級(jí)產(chǎn)品經(jīng)理李君鵬對(duì)放棄Thunder項(xiàng)目的解釋,基本驗(yàn)證了我的分析。至于XtremIO……
一年前EMC透露Thunder項(xiàng)目時(shí),提到將為其配備“輕量級(jí)軟件堆?!薄H绻阒豢粗赜布笜?biāo),或許會(huì)欣賞它的“簡(jiǎn)潔”,可實(shí)際上,Thunder項(xiàng)目毀就毀在這了。不然,EMC隨后收購(gòu)XtremIO干啥?
這個(gè)世界存在不少事后看起來(lái)很愚蠢的收購(gòu),但EMC絕對(duì)不傻。他們不是刻意想把全閃存陣列的軟件堆棧輕量化,而是缺乏必要的軟件積累。既然可以收購(gòu)XtremIO,也就沒(méi)必要費(fèi)力繼續(xù)開(kāi)發(fā)Thunder這么一個(gè)幾乎純硬件的產(chǎn)品了。
從前面板不難看出,XtremIO用的是“傳統(tǒng)”SSD
硬件商品化意味著盡可能采用標(biāo)準(zhǔn)化、通用的硬件,在保證基本要求的前提下,標(biāo)準(zhǔn)越普及、通用性越好(譬如企業(yè)級(jí)SSD領(lǐng)域SAS就比PCIe門檻低,SATA又差點(diǎn)兒意思),則越受歡迎。體現(xiàn)價(jià)值的軟件呢?維持閃存產(chǎn)品正常運(yùn)轉(zhuǎn)的底層軟件如FTL層,或者驅(qū)動(dòng)程序當(dāng)然有價(jià)值,但它們更傾向于作為必不可少的組成部分而劃歸硬件范疇。
EMC列出了XtremIO的重要軟件功能,包括線內(nèi)重復(fù)數(shù)據(jù)刪除和自動(dòng)精簡(jiǎn)配置,沒(méi)有實(shí)時(shí)壓縮
在充分為閃存優(yōu)化的陣列應(yīng)該具備的上層軟件功能中,我認(rèn)為自動(dòng)精簡(jiǎn)配置、實(shí)時(shí)壓縮和重復(fù)數(shù)據(jù)刪除是排在前三位的。
這三位不是新技術(shù),乃磁盤陣列時(shí)代的成果,通過(guò)不同方式節(jié)省存儲(chǔ)空間。不過(guò),對(duì)閃存來(lái)說(shuō),它們還有其他重要作用——延長(zhǎng)壽命。譬如實(shí)時(shí)壓縮和線內(nèi)重復(fù)數(shù)據(jù)刪除都可以減少閃存的寫(xiě)入量,收到延長(zhǎng)閃存壽命的效果。需要注意的是,必須是實(shí)時(shí)(或in-line)處理,有些磁盤備份產(chǎn)品采用后處理(post-process)的方式來(lái)去重,即先把數(shù)據(jù)寫(xiě)入到磁盤上,然后再加以比對(duì),刪去重復(fù)數(shù)據(jù),這對(duì)閃存產(chǎn)品來(lái)說(shuō)是不可接受的:非但起不到減少寫(xiě)入量的作用,反而增加了大量擦除的工作。
我想了解一下……實(shí)時(shí)壓縮?
非實(shí)時(shí)壓縮和后處理方式的重復(fù)數(shù)據(jù)刪除,很大程度上是當(dāng)時(shí)配置計(jì)算能力不夠的產(chǎn)物,因?yàn)閴嚎s和消重算法都需要大量的計(jì)算工作。完整的自動(dòng)精簡(jiǎn)配置功能也需要一定的計(jì)算資源,像EF540只具備有限的自動(dòng)精簡(jiǎn)配置能力,連NetApp自己的人,都認(rèn)為那不能算自動(dòng)精簡(jiǎn)配置——運(yùn)行Data ONTAP的FAS系列才夠格。
EF540的自動(dòng)精簡(jiǎn)配置受限于其以ASIC為主的控制器架構(gòu)。ASIC和PCIe閃存卡中常見(jiàn)的FPGA為特定的簡(jiǎn)單重復(fù)性工作(如搬運(yùn)數(shù)據(jù))而設(shè)計(jì),速度快、效率高,缺點(diǎn)是計(jì)算能力差,難以勝任多種任務(wù)。廠商可以為特定的工作設(shè)計(jì)特定的電路,譬如3PAR獨(dú)有的ASIC可以加速自動(dòng)精簡(jiǎn)配置,但總不能每種功能都來(lái)一個(gè)ASIC或FPGA吧?那復(fù)雜性和成本就……
如果基于通用但有很強(qiáng)計(jì)算能力的商用硬件(如x86),在軟件堆棧中加入不同的軟件功能,就可以實(shí)現(xiàn)不同的用途。而這,不僅是軟件定義存儲(chǔ),也是軟件定義數(shù)據(jù)中心(SDDC)的精髓。
從這個(gè)角度來(lái)說(shuō),EMC也可以在Thunder項(xiàng)目中采用x86硬件平臺(tái),然后將Data Domain的重復(fù)數(shù)據(jù)刪除改造為適合全閃存陣列。不過(guò)這需要更多時(shí)間來(lái)開(kāi)發(fā),且結(jié)果未知,而XtreamIO的線內(nèi)重復(fù)數(shù)據(jù)刪除顯然是專門針對(duì)閃存開(kāi)發(fā)的,用錢換時(shí)間,可謂明智之舉。
Greenbytes、Pure Storage、Nimbus、SKyera、SolidFire、Violin Memory和Whiptail等初創(chuàng)多數(shù)全閃存陣列都用SSD,只有Violin是獨(dú)有閃存模塊(VIMM,見(jiàn)第二列)。不過(guò),這些全閃存陣列并不都支持重復(fù)數(shù)據(jù)刪除,支持的也不全是In-line,但NetApp EF540幾乎是軟件功能最貧乏的(最右列)
再來(lái)看看NetApp計(jì)劃中的FlashRay都有哪些特性:
除了壓縮與去重,文件服務(wù)等功能現(xiàn)在也是以x86平臺(tái)為主流的。對(duì)軟件功能的需求促使全閃存陣列采用以x86為代表的所謂商用硬件,而x86的快速更新又方便加入更強(qiáng)大的軟件功能,形成了良性的互動(dòng)。
EMC認(rèn)為企業(yè)級(jí)閃存產(chǎn)品應(yīng)該具備的軟件功能
需要說(shuō)明的是,硬件商品化、通過(guò)軟件體現(xiàn)存儲(chǔ)價(jià)值,并非始自閃存的引入。在統(tǒng)一存儲(chǔ)等風(fēng)潮推動(dòng)下,這幾年新推出的磁盤陣列已經(jīng)全面過(guò)渡到x86平臺(tái),像自動(dòng)精簡(jiǎn)配置已經(jīng)成為標(biāo)配。正如前面提到的,一定程度上,全閃存陣列繼承了之前磁盤陣列發(fā)展的成果。但是,在磁盤陣列產(chǎn)品中,采用實(shí)時(shí)壓縮的很少(如IBM Storwize V7000),線內(nèi)重復(fù)數(shù)據(jù)刪除就更沒(méi)有,部分原因是必要性不夠大。閃存則不然,算法對(duì)性能的要求可能進(jìn)一步推進(jìn)陣列控制器的服務(wù)器化,更緊的追趕x86處理器的換代步伐。
我們是不是可以說(shuō),既完全圍繞閃存設(shè)計(jì)(全閃存),又具備豐富陣列軟件功能,才是合格的“全閃存陣列”呢?
更高層次的輪回:仍混合陣列,以閃存之名
對(duì)NetApp來(lái)說(shuō),除了加緊開(kāi)發(fā)FlashRay,還有一個(gè)戰(zhàn)略調(diào)整的問(wèn)題需要妥善解決——如何建立一個(gè)有效的分級(jí)存儲(chǔ)體系?
與所謂自動(dòng)分層存儲(chǔ)(可以把陣列內(nèi)部叫分層,外部或之間叫分級(jí),宏觀來(lái)說(shuō)只是維度不同)相比,將閃存作為緩存,具有算法簡(jiǎn)單、應(yīng)用中立竿見(jiàn)影等好處。NetApp CEO Tom Georgens很早就宣稱分層存儲(chǔ)沒(méi)前途,而到目前為止與NetApp FAS/V系列相關(guān)的幾種閃存技術(shù)如Flash Cache、Flash Pool和Flash Accel,都是將閃存作為緩存(Cache)來(lái)使用。
NetApp會(huì)建立這么一個(gè)龐雜的體系么?
那么,EF540和未來(lái)的FlashRay呢?不可能整個(gè)陣列就用來(lái)給FAS家族做緩存吧?如果要將全閃存陣列納入整個(gè)產(chǎn)品體系而不是飄零在外,那么在全閃存陣列與傳統(tǒng)陣列之間建立一個(gè)有效的數(shù)據(jù)移動(dòng)機(jī)制,是很有必要的。
全閃存陣列采用橫向擴(kuò)展架構(gòu),更多的是解決性能問(wèn)題。若縱向擴(kuò)展的話,控制器很容易成為瓶頸(如EF540、VNX等傳統(tǒng)陣列)
在一些全閃存陣列的狂熱支持者看來(lái),全閃存陣列很快就會(huì)取代磁盤陣列,所以不用考慮分級(jí)問(wèn)題??蛇@不現(xiàn)實(shí),至少在5年內(nèi)這一幕不會(huì)出現(xiàn)。全閃存陣列如FlashRay、XtremIO都支持橫向擴(kuò)展,能夠在一定程度上彌補(bǔ)閃存容量不足的問(wèn)題,但比磁盤陣列還差得遠(yuǎn)。成本更不容忽視,一則閃存盤的單位容量?jī)r(jià)格仍然比大容量SATA/NL SAS盤高很多,二則相當(dāng)大比例的數(shù)據(jù)并不需要很高的I/O性能,用閃存未免浪費(fèi),保存在硬盤上經(jīng)濟(jì)性更好。
在傳統(tǒng)企業(yè)應(yīng)用中,需要高I/O的熱點(diǎn)數(shù)據(jù),所占容量比例較低。而在互聯(lián)網(wǎng)行業(yè)中,大部分?jǐn)?shù)據(jù)產(chǎn)生后,也會(huì)迅速變“冷”
既然閃存與磁盤混合存儲(chǔ)的局面仍將繼續(xù)維持相當(dāng)長(zhǎng)的時(shí)間,在前面提及的一干全閃存陣列初創(chuàng)企業(yè)被NetApp、EMC、IBM的強(qiáng)勢(shì)殺入掩蓋住光芒的同時(shí),Nimble Storage、Tegile與Tintri等新一代混合存儲(chǔ)供應(yīng)商又得到了業(yè)內(nèi)人士的熱捧。之所以說(shuō)是新一代,在于它們無(wú)論是像NetApp FAS系列一樣將閃存作為磁盤的緩存(Nimble Storage和Tegile),還是像EMC VNX/Symmetrix一樣可以在閃存與磁盤間自動(dòng)分層存儲(chǔ)(Tintri),都是從一開(kāi)始就充分圍繞閃存的特性設(shè)計(jì),兼顧大容量的NL SAS磁盤(傳統(tǒng)混合存儲(chǔ)還是建立在磁盤基礎(chǔ)上,后加入閃存),并且也全部支持前面提到的實(shí)時(shí)壓縮和線內(nèi)重復(fù)數(shù)據(jù)刪除,自動(dòng)精簡(jiǎn)配置更是不在話下。
面對(duì)多種閃存相關(guān)的產(chǎn)品/解決方案,根據(jù)具體應(yīng)用選擇合適的
在混合陣列中,閃存是用作緩存,還是與磁盤分層,我認(rèn)為不是非此即彼,而要看應(yīng)用需求。緩存方案固然有相對(duì)簡(jiǎn)單等優(yōu)越性,但隨著閃存容量的不斷攀升(增長(zhǎng)幅度明顯快于磁盤),不分青紅皂白地都用作緩存,未免過(guò)于浪費(fèi),也不符合人們對(duì)閃存比重逐漸提升的預(yù)期——只用作緩存,而非數(shù)據(jù)的永久存儲(chǔ),能說(shuō)足夠重視嗎?
閃存無(wú)處不在,硬盤仍是基石……市場(chǎng)很大,不可輕棄
Fusion-io本周宣布斥資1.19億美元收購(gòu)混合存儲(chǔ)系統(tǒng)廠商N(yùn)exGen Storage,可以作為上述觀點(diǎn)的注腳。我們知道,F(xiàn)usion-io最初的宣傳,是強(qiáng)調(diào)以其插在服務(wù)器中的PCIe閃存卡ioDrive,取代外部的磁盤陣列。上市后不久收購(gòu)了ioTurbine,以及推出的ioCache和directCache,都是將閃存用作緩存。去年推出的ION,則更像是把服務(wù)器變成一種閃存陣列。
NexGen的混合存儲(chǔ)方案是分層而非緩存,至于重復(fù)數(shù)據(jù)刪除……那是——必須的!
NexGen Storage的不同之處在于,采用僅把活動(dòng)數(shù)據(jù)存在SSD上的“實(shí)時(shí)分層”(real-time tiering)技術(shù)。換言之,1月中旬其CEO David Flynn還在Open Compute峰會(huì)上鼓吹“全閃存數(shù)據(jù)中心”,僅僅3個(gè)月之后,F(xiàn)usion-io就向現(xiàn)實(shí)低頭,以實(shí)際行動(dòng)承認(rèn),不與磁盤更緊密的協(xié)作是不行的。收購(gòu)消息一出,1月下旬開(kāi)始便一路走低的Fusion-io股價(jià),上漲幅度接近20%。
看起來(lái),NexGen Storage的方案是在陣列控制器內(nèi)部使用PCIe閃存卡(如Fusion-io的ioDrive),與控制器外接的大容量硬盤之間“實(shí)時(shí)分層”。在新興的混合陣列方案中,幾乎都是用閃存和低轉(zhuǎn)速大容量NL SAS/SATA磁盤結(jié)合,舍棄了10K/15K RPM高轉(zhuǎn)速磁盤,這也是與傳統(tǒng)混合陣列不同之處。2010年初Tom Georgens也持此觀點(diǎn),但當(dāng)時(shí)他否定了分層的價(jià)值
當(dāng)然,NexGen的存儲(chǔ)架構(gòu)中,使用的SSD是PCIe接口,并著力宣揚(yáng)了較之于接在存儲(chǔ)控制器后面的SAS/SATA SSD的“巨大優(yōu)勢(shì)”,而我也認(rèn)為如果在存儲(chǔ)控制器中使用閃存,PCIe接口可能更為合適。但是,正如前面已經(jīng)分析過(guò)的,如果控制器一開(kāi)始就為閃存設(shè)計(jì)并輔以相應(yīng)的算法,用SAS也差不到哪里去。NexGen的硬件架構(gòu)集成ioDrive具備天然優(yōu)勢(shì)固然是Fusion-io選擇它的重要因素之一,線內(nèi)重復(fù)數(shù)據(jù)刪除和實(shí)時(shí)分層等軟件功能才是更值得關(guān)注的。
至于David Flynn在Fusion-io收購(gòu)ID7之后說(shuō)要提供開(kāi)放的解決方案,和不直接銷售NexGen產(chǎn)品,而是“把NexGen作為技術(shù)平臺(tái),允許第三方的集成商來(lái)構(gòu)建系統(tǒng)”的表態(tài),屬于商業(yè)模式的范疇,這里就不討論了。
從微觀的層面來(lái)看,優(yōu)先圍繞閃存來(lái)設(shè)計(jì)陣列,是存儲(chǔ)行業(yè)已經(jīng)發(fā)生的革命;而從宏觀的層面來(lái)看,在數(shù)據(jù)中心的規(guī)模上,閃存與磁盤更好的協(xié)同,則是更高水平的輪回……