西瓜哥認(rèn)為現(xiàn)當(dāng)前磁盤技術(shù)快速發(fā)展50年,現(xiàn)在基本停滯,沒有什么新的技術(shù)。而現(xiàn)階段閃存發(fā)展又很快,MLC的SSD的價(jià)格逐漸接近SAS SSD。估計(jì)2018年左右,可能閃存的成本,跟1.5萬轉(zhuǎn)的硬盤差不了多少。借著這個(gè)高速硬盤,很多廠商說過幾年以后閃存的成本跟硬盤成本一樣,不要聽錯(cuò)了,不是跟硬盤成本一樣,是跟高速硬盤成本一樣。
西瓜哥認(rèn)為內(nèi)存是最快,壽命也非常好,但是內(nèi)存有一個(gè)問題就是不能作為一個(gè)永久的介質(zhì)。第二可以看到SLC,閃存剛出來的時(shí)候基本上都在這里,SLC他寫壽命比較長,現(xiàn)在我們發(fā)現(xiàn)閃存像儲(chǔ)存用以后,直接用MLC。通過算法的優(yōu)化,也能滿足大部分的需求。閃存重點(diǎn)看兩個(gè)指標(biāo),一個(gè)讀,閃存很快。但是寫的話,閃存的優(yōu)勢(shì)并不特別明顯,單獨(dú)編程寫的蠻快。閃存有一個(gè)垃圾回收的問題,他要?jiǎng)h除,每個(gè)閃存寫的時(shí)候,以前東西要?jiǎng)h除。這個(gè)東西處理不好,會(huì)影響整個(gè)系統(tǒng)的性能。還有壽命。就算用SLC的話也是上萬次,最高十萬次。
西瓜哥認(rèn)為閃存在互聯(lián)網(wǎng)方面應(yīng)用多一些,而在金融領(lǐng)域應(yīng)用比較保守,擔(dān)心什么問題?首先現(xiàn)在架構(gòu)基本能夠滿足他的需求,多加一個(gè)硬盤差不多能滿足。第二個(gè)成本,沒有必要買那么貴的東西,基本要求可以滿足。第三就是可靠性,普通的客戶考慮閃存的最主要的一個(gè)考慮。但是我們應(yīng)該從整個(gè)TCO和購買成本來看這個(gè)問題。用戶關(guān)心的成本只是說購買成本,閃存陣列不貴,這是成本。但是我們要看整體的成本。比如說你用閃存陣列的話,你就可以節(jié)省下來數(shù)據(jù)庫兩個(gè)License。
西瓜哥又談了一些廠商解決系統(tǒng)可靠性的一些方法。用戶擔(dān)心是一個(gè)介質(zhì)可靠性,閃存的話要看系統(tǒng)可靠性。介質(zhì)可靠性不夠高,看系統(tǒng)可靠性,有很多方法去解決,“現(xiàn)在廠商使用方法列了一下,一個(gè)是超供,100G閃存硬盤,可能128G,超供180G給你,里面只有100G容量,他說我一定要超供,超這么多,給你補(bǔ)上去,這個(gè)壽命沒有問題,這是一方面。第二是磨損均衡,兩個(gè)級(jí)別,一個(gè)是SSD級(jí),一個(gè)系統(tǒng)級(jí)。如果說你均衡來寫,整個(gè)閃存壽命就上去了,需要算法去完善這個(gè)東西。針對(duì)整個(gè)系統(tǒng)就更好了,所有閃存硬盤均衡的寫,我跟賴總聊了一下,他用了三四年閃存了,沒有壞過一塊硬盤,所以可靠性還是比較好。還有就是技術(shù)的反磨損均衡,什么意思?我看廠商里面主要是華為提出這個(gè)技術(shù)。帶閃存在壽命后期,假如說5年壽命,4年的時(shí)候,我采用反磨損均衡。你這個(gè)全是磨損均衡的話,壽命一致的話,到五年以后硬盤可能全部都?jí)?,同時(shí)換兩張盤代價(jià)高了,數(shù)據(jù)丟了。后期這個(gè)數(shù)據(jù)是一致,你的風(fēng)險(xiǎn)很大。想用硬盤,又不想花錢,還要換新的硬盤,我用反磨損均衡。我這時(shí)候只寫一塊硬盤,把這個(gè)寫壞,再寫別的,逐步替換,充分利用閃存硬盤,這是一種方式。還有容錯(cuò),在知道閃存硬盤跟普通硬盤最大的區(qū)別,企業(yè)級(jí)閃存硬盤是多核CPU,有強(qiáng)大的軟件功能,垃圾收集等等。這些容錯(cuò)的技術(shù),你顆粒壞了,他內(nèi)部可以做修復(fù),可以容錯(cuò)。還有前面講的很多的數(shù)據(jù)壓縮和重刪和數(shù)據(jù)減少的技術(shù)。把這個(gè)寫大量的減少的話,就會(huì)造成你的硬盤的可靠性的提高,相對(duì)用的時(shí)間更長。算法的優(yōu)化,4K的顆粒跟我的顆粒對(duì)應(yīng)起來,內(nèi)存里面全部算好了,減少寫放大。還有壽命可預(yù)測,你用閃存更放心就是閃存壽命可以預(yù)測。閃存顆粒是5000次壽命,我寫了多少次是可以知道。有的公司沒有做這個(gè)功能,但是用戶可以要求他做,我要知道我的硬盤壽命到什么時(shí)候了,我硬盤是3000次壽命,我寫了2000次了,可以知道。”西瓜哥講到。
Flash for All,閃存無處不在,通過這些閃存常見的領(lǐng)域,內(nèi)存計(jì)算、實(shí)時(shí)分析、OLTP、VDI、虛擬化是閃存應(yīng)用最多的場合。很多場合也都用到,比如說Facebook要建立一個(gè)冷閃存,用戶希望廠商能提供只能寫3次的閃存,因?yàn)楹芏嘤脩魝魃蟻淼恼掌粫?huì)刪了。還有一個(gè)是歸檔存儲(chǔ)。以后歸檔的數(shù)據(jù)最節(jié)省的還是元數(shù)據(jù)的閃存,很快找到用戶需要的東西。把所有的查詢和管理都放到閃存里,很好的歸檔。所以說閃存可以無處不在。
回歸到主題Flash for All=All Flash?西瓜哥個(gè)人有點(diǎn)保留意見,因?yàn)楝F(xiàn)階段來說閃存陣列占的比例還是很小。但是未來發(fā)展?jié)摿薮蟆?ldquo;2013年SSA收入6667M。企業(yè)級(jí)的SSD收入是40多億。這是真正的主流,全球占的比例不是非常多。這個(gè)市場最熱的地方是美國,北美的地方SSD美洲占了57%。最新的數(shù)據(jù),全閃存陣列SSD占了5%,按流量來說占的比例更少,可能2%,3%。這個(gè)市場占全球來說閃存陣列占全球磁盤陣列市場是小眾,增長很快,還是非常小眾市場,沒有成為主流。如果是磁盤陣列的市場,美國占了41%,全閃存陣列市場美國占了57%,這兩個(gè)數(shù)字可以對(duì)比出美國這個(gè)市場他對(duì)全閃存陣列的需求是最旺盛。中國的比例還可以,相對(duì)整個(gè)市場不是特別強(qiáng)。”西瓜哥講到。
西瓜哥有個(gè)觀點(diǎn)認(rèn)為不建議全閃存陣列,比較傾向的觀點(diǎn)是混合陣列。“為什么說不建議全閃存陣列,首先容易形成系統(tǒng)孤島,把數(shù)據(jù)放到上去,你備份之后,過一兩年之后,我計(jì)費(fèi)了,這個(gè)月花費(fèi)可能需要很多的I/O,但是交完費(fèi)之后,兩個(gè)月之后這個(gè)數(shù)據(jù)就變了。這個(gè)數(shù)據(jù)放到全閃存陣列成本就浪費(fèi)了。你需要做遷移,一個(gè)基金公司會(huì)估計(jì)一個(gè)遷移成本,數(shù)據(jù)的話假設(shè)你買一個(gè)陣列,把舊的陣列換掉,數(shù)據(jù)遷移,會(huì)算一個(gè)成本。會(huì)購買陣列成本的54%,他算的比較多,遷移成本,還有提前購買陣列,遷移完了之后還有運(yùn)行一段時(shí)間他把這個(gè)成本算進(jìn)來。不管怎么算,有一個(gè)概念就是遷移成本,現(xiàn)在的遷移技術(shù)不是特別的成熟。”
混合陣列有幾個(gè)關(guān)鍵特性,首先我認(rèn)為是在線重刪和壓縮你必須要有。小于1毫秒時(shí)延,在全閃存情況下。假設(shè)我需要小于1毫秒時(shí)延你必須要達(dá)到。第三就是加密,為什么強(qiáng)調(diào)加密?大家知道閃存是要操作的,有操作就有一個(gè)問題,這個(gè)閃存盤以為刪除了,但是你拿走了以后你會(huì)發(fā)現(xiàn)其實(shí)沒刪除,你超供的部分有一個(gè)數(shù)據(jù),全部可以恢復(fù)臨時(shí)的數(shù)據(jù)。你給100G閃存硬盤,里面有28G超供,那個(gè)地方你沒有加密功能,你可能保留不了你的數(shù)據(jù)安全,這是金融行業(yè)特別關(guān)注。還有就是閃存是必須的,元數(shù)據(jù)在內(nèi)存和閃存中。針對(duì)閃存LUN的流程優(yōu)化。自動(dòng)遷移,生命周期管理,和HDD深度融合。如果硬盤做了,系統(tǒng)級(jí)就不用做了。現(xiàn)在很多廠商都做閃存硬盤。
混合陣列我們客戶其實(shí)更關(guān)心的是如何保證性能,怎么區(qū)別傳統(tǒng)陣列+SSD,形態(tài)都是一樣,怎么知道你好,你說的技術(shù)會(huì)那么復(fù)雜,我也搞不清楚。這是他最大的問題。大家很多講陣列,講I/OPS,有人說100萬,有人說60萬,這個(gè)數(shù)據(jù)比較意義不大。I/OPS不知道你讀多少,寫多少,不知道你是6K還是8K,模式不一樣,所以值不一樣。第三方測試跟測試程序一樣,這個(gè)I/OPS前十名列出來了,前面是閃存陣列,混合陣列,性能方面混合陣列差距不是非常大。差距比較大,關(guān)鍵用戶需要不需要這么多容量。如果你又需要容量和又需要性能的時(shí)候,我這邊他是一個(gè)選擇。如果你需要性能不需要容量,純閃存陣列是你的選擇。
西瓜哥舉例美國一家混合陣列的初創(chuàng)公司的理念架構(gòu),混合陣列必須要有閃存,因?yàn)樵獢?shù)據(jù)在里面?;旌详嚵泻唵蔚揭粋€(gè)硬盤,元數(shù)據(jù)處理加速必須在閃存陣列完成。中間那一層,沒有必要?,F(xiàn)在高速硬盤成本跟閃存成本很接近。美國的這個(gè)調(diào)查公司在美國閃存峰會(huì)發(fā)布的品牌調(diào)查結(jié)果,混合陣列里面認(rèn)可度各大廠商最好,用戶很難認(rèn)可,沒有幾個(gè)客戶是技術(shù)大拿。如果你講一個(gè)混合陣列,跟傳統(tǒng)廠商有什么區(qū)別,不是什么可以講得清楚。這種形態(tài)的話對(duì)他沒有利,所以說我發(fā)現(xiàn)很多原來只有混合陣列的公司,現(xiàn)在慢慢推出包裝出來他們的純閃存陣列。
最后西瓜哥對(duì)于閃存應(yīng)用的憧憬,“以后買一閃存陣列,用戶不要限制我配什么盤,我剛開始配全閃存硬盤,過了兩年我發(fā)現(xiàn)老的數(shù)據(jù)越來越多,還是一個(gè)陣列,不想再買一個(gè)陣列,加一個(gè)磁盤框,你通過自動(dòng)遷移方式,自動(dòng)判斷方式,你系統(tǒng)自己會(huì)判斷。像買個(gè)汽車一樣,3D模式,雪地模式,無極變速,自己變速就可以。你沒有必要讓我的用戶去考慮這么多,據(jù)統(tǒng)計(jì)一般的企業(yè)不超過20%,你配20%的閃存硬盤很奢侈了。第二個(gè)是一鍵啟動(dòng),我配所有的介質(zhì)在里面,用戶只需要告訴我,我這個(gè)要多少容量,同時(shí)我要什么,要多長時(shí)間的時(shí)延。用戶說我這個(gè)需要100T容量,需要時(shí)延是毫米級(jí)。我混合陣列怎么判斷,我直接去算。如果我說時(shí)延要求到2、3毫秒,我可以給你配,20%的閃存就夠了。這是我的一個(gè)想法,能不能實(shí)現(xiàn)不知道了。”西瓜哥講到。