EMC公司亞太及日本地區(qū)的首席技術(shù)官Par Botes先生
由于很偶然的機會,我們見到了來北京為EMC中國研發(fā)中心北京的員工做技術(shù)講座的Par Botes先生,作為EMC公司亞太及日本地區(qū)的首席技術(shù)官,Par Botes在IT行業(yè)工作了17年,而他的前一個身份,則是存儲架構(gòu)、大型商用系統(tǒng)以及超大型數(shù)據(jù)庫存儲方面的行業(yè)評論家。恰逢見到Par Botes,我們也有了一次更為深入的了解固態(tài)硬盤的機會。
構(gòu)建"0"層存儲
Par Botes在談到固態(tài)硬盤的發(fā)展時指出,越來越多的集中購買存儲的趨勢,產(chǎn)生一個必然的現(xiàn)象,那就是越來越多的計算機,或者說是終端使用同一個存儲設(shè)備,存儲越集中,一個存儲設(shè)備所要提供存儲能力的終端也就越多。他認(rèn)為,對于需要支持的系統(tǒng)來說–無論是幾個還是數(shù)千個系統(tǒng),其對存儲系統(tǒng)的性能要求是不一樣的,因為這些終端所存儲在存儲設(shè)備上的數(shù)據(jù)價值是不一樣的,舉例來說,在一個存儲系統(tǒng)中,存儲了銀行的事務(wù)數(shù)據(jù)庫和人力資源部的資料,可以很簡單預(yù)見的是,大部分的工作負(fù)載都來自于銀行的事務(wù)數(shù)據(jù)庫,而不是人力資源部制度規(guī)定和人才儲備資料,而與此同時,信息的價值也隨著時間的變化在變化,數(shù)據(jù)需要在不同的存儲系統(tǒng)之間流動。
因此,Par Botes認(rèn)為,用戶在考慮存儲系統(tǒng)時,硬盤并不是其唯一要考慮的因素,Cache、處理器都是用戶需要考慮,用戶需要也必須根據(jù)不同的需求對存儲系統(tǒng)的資源進行合理分配,以支持不同的應(yīng)用,而在廠商這個層面說來,存儲廠商也因此必須要提供適合用戶需求,成本更低的,具有最佳性價比的解決方案,與此同時,在節(jié)能降耗日趨主流的今天,能耗也是不得不考慮的問題。
于是,問題也就擺在了眼前,對于類銀行事務(wù)數(shù)據(jù)庫后面所支持的諸如外匯買賣、在線證券交易以及大量的數(shù)據(jù)讀寫操作來說,用戶必須擁有一套能夠高效的支持這些在線事務(wù)處理應(yīng)用的存儲系統(tǒng),只有這樣才能夠保持在線交易業(yè)務(wù)的順暢–相比誰也不會在賣出股票時看到電腦顯示出如下的字樣:后臺繁忙請稍后。
對于EMC來說,在Symmetrix DMX-4存儲系統(tǒng)中添加固態(tài)硬盤,目的就是為了構(gòu)建一個更加"分層"的存儲系統(tǒng),在引入了固態(tài)硬盤之后,Symmetrix DMX-4也就擁有了所謂的"第0層"存儲,從而獲得了交付實時的容量分配,增強的管理靈活性,并同時提高了總體系統(tǒng)利用率和能源效率。由于這個"固態(tài)存儲層"響應(yīng)時間更短,能夠服務(wù)的計算機更多,讀寫速度都比傳統(tǒng)的系統(tǒng)要高,這些都對于更加細分的用戶需求和市場來說具有"每10到15年才出現(xiàn)一次的殺手級優(yōu)勢"(分析機構(gòu)企業(yè)策略集團創(chuàng)始人兼高級分析師Steve Duplessie語)。
而Par Botes相信,正是因為用戶的應(yīng)用的多樣性,以及對高性能的需要,用戶才會去關(guān)心速度更快,響應(yīng)時間更短的存儲產(chǎn)品,而固態(tài)硬盤恰好給了用戶一個絕好的選擇。
在聆聽問題時,Par Botes總帶著的微笑,好像沒有什么問題能難道他
壽命與價格 二者無憂
在固態(tài)硬盤走進企業(yè)存儲的反對者中,Stephen Foskett是最堅定的人之一,他認(rèn)為,在壽命方面,固態(tài)硬盤還未到走進企業(yè)存儲的時候,確實,對于固態(tài)硬盤來說,壽命仍然是一個桎梏,現(xiàn)在的固態(tài)硬盤基于Flash閃存技術(shù),而Flash閃存的每一個寫入扇區(qū)具有的可寫入次數(shù)基本上在一萬到兩萬次左右,而對于一個在線事務(wù)處理系統(tǒng)來說,可能一分鐘就會處理萬次的交易數(shù)據(jù),因此,在許多業(yè)界專家看來壽命是固態(tài)硬盤走進企業(yè)存儲不可逾越的一道山峰。
但是,Par Botes卻并不這樣認(rèn)為,因為EMC的Symmetrix DMX-4絕不僅僅是"裝上了固態(tài)硬盤"那么簡單,據(jù)Par Botes介紹,在Symmetrix DMX-4中,EMC提供了兩大關(guān)鍵技術(shù),一是分布式的隨機寫入算法,二是Cache。
據(jù)Par Botes介紹,首先,與消費市場使用的固態(tài)硬盤不同,EMC在企業(yè)存儲中所采用的固態(tài)硬盤性能更好而且壽命更長,與此同時,EMC通過分布式的隨機寫入算法,將數(shù)據(jù)隨機分布寫入固態(tài)硬盤中,雖然用戶并不會察覺到數(shù)據(jù)的分布式寫入,但是對于Symmetrix DMX-4來說,系統(tǒng)控制的寫入位置是分布的–無論是在寫入某一個固態(tài)硬盤還是固態(tài)硬盤內(nèi)部的每一個寫入扇區(qū)上,由于這樣的分布式寫入,用戶的讀寫實際上都避免了在某一塊固態(tài)硬盤或固態(tài)硬盤的某一個寫入點上進行集中操作,由此,在Symmetrix DMX-4中,EMC首先避免了寫入和讀取熱點的問題–這對于壽命來說肯定是有好處的。
而第二步,就是Par Botes重點向我們介紹的Cache部分了,Par Botes表示,在Symmetrix DMX-4中存在一個Cache部分,對于這個部分,Par Botes用了"Key Point"這個詞,可見這部分對于Symmetrix DMX-4的重要性。他表示,對于固態(tài)硬盤和SATS磁盤來說,寫入性能肯定是不一樣的,因此,為了提高固態(tài)硬盤的寫入速度,EMC在系統(tǒng)中加入了高速的Cache,數(shù)據(jù)在寫入Symmetrix DMX-4的時候,數(shù)據(jù)首先寫入到了Cache中,由于Cache是高速的,因此,這部分寫入是完全同步的,隨后數(shù)據(jù)從Cache寫入到固態(tài)硬盤中,這部分的寫入時異步的,我們看到,實際上,Symmetrix DMX-4的寫入是同步+異步的,正是這種模式,使得存儲系統(tǒng)的寫入時間很短,而存儲過程也不會拖累整個系統(tǒng)的寫入–"實際上,當(dāng)數(shù)據(jù)到達Symmetrix DMX-4的Cache之后,寫入就完成了。" Par Botes補充到。我們認(rèn)為,這樣的寫入方式,實際上這樣就可以滿足用戶的在線事務(wù)系統(tǒng)對于固態(tài)硬盤在寫入速度上的要求,而異步的寫入,實際上也為分布式寫入提供了時間,從而間接的保證了固態(tài)硬盤的壽命。
而另一方面,在讀取時,固態(tài)硬盤則有天然的優(yōu)勢–不需要Cache,由于傳統(tǒng)硬盤的尋道時間問題,因此傳統(tǒng)硬盤需要Cache保證讀取速度,但是固態(tài)硬盤的讀取速度很快,無需Cache,Par Botes表示,在Cache一樣多的情況下,固態(tài)硬盤與傳統(tǒng)硬盤在寫入時都需要Cache,而讀取時固態(tài)硬盤不需要,這會得出一個什么樣的結(jié)論呢?那就是實際上Cache的"數(shù)量"增多了,用戶在寫入時獲得的"可用Cache"增多了,寫入性能和讀取性能自然比傳統(tǒng)設(shè)備要高。
在Stephen Foskett眼中,價格也是一大阻礙因素,確實,固態(tài)硬盤的價格即使是與同等容量的FC硬盤相比,也要高出十幾倍,對于用戶來說,這樣高的價格確實是有些不可接受的,不過Par Botes的看法卻與Stephen Foskett不同,"你的存儲系統(tǒng)中不可能只有固態(tài)硬盤。"他認(rèn)為,固態(tài)硬盤的作用就是構(gòu)建一個"第0層"存儲,而不是全部替代傳統(tǒng)硬盤,因為即使這樣,用戶已經(jīng)能夠獲得高出之前不少的性能了,而價格并未上漲過多(配備4~5個固態(tài)硬盤的Symmetrix DMX-4系統(tǒng)價格差不多提高不到10%)。而與此同時,許多用戶確實有這方面的需求–實際上,在我們的調(diào)查中就有銀行表示,由于他們的存儲響應(yīng)時間是毫秒級的,時間要求很高短,往往一年的數(shù)據(jù)算下來,延遲帶來的股票交易損失可多達一億美元,從這個角度來看,固態(tài)磁盤還是相對便宜的。
不過,Par Botes也承認(rèn),固態(tài)硬盤還存在著CPU占用率過高的問題,一個處理器只能帶動4~5個固態(tài)硬盤,不過Par Botes并未確認(rèn)Symmetrix DMX-4中的處理器是單核還是多核處理器,我們相信,在多核處理器日益普及的今天,隨著四核甚至八核處理器的出現(xiàn),固態(tài)硬盤的CPU占用率過高的問題,會逐步得到緩解,更何況據(jù)Par Botes表示,"每個系統(tǒng)有5到10個固態(tài)硬盤就足夠了。"而一個Symmetrix DMX-4中最高128個CPU的超高端配置,自然也能夠讓性能和可擴展性保證用戶的需求。
而對于我們提到的混合硬盤(hybrid hard drive, H-HDD),Par Botes顯得并不在意,他表示,固態(tài)硬盤有確實可靠的性能提高,而混合硬盤不是這樣的,混合硬盤有時好有時壞,更多時候還是用在消費級產(chǎn)品上比較合適,對于企業(yè)存儲來說,混合硬盤還是不太合適的。
在與Par Botes的溝通之后,我突然想到,事實上,固態(tài)硬盤技術(shù)幾乎和虛擬化技術(shù)一樣古老,日本東芝公司于1984年發(fā)明了閃存而INTEL公司在1988年正式將閃存形成商品,而在此之前,固態(tài)硬盤在早期的大部分時間里,主要用在軍用嵌入系統(tǒng)中,或者高性能計算的研究實驗室中,而基于RAM的固態(tài)硬盤(我們現(xiàn)在所說的固態(tài)硬盤,多數(shù)是基于Flash閃存技術(shù)的)歷史更是悠久,美國軍方在其嵌入式設(shè)備總早已有所應(yīng)用。
就像虛擬化技術(shù)一樣,蟄伏多年的固態(tài)硬盤,在現(xiàn)在如爆發(fā)式的成長,在技術(shù)與產(chǎn)品日趨成熟的原因之下,我們不得不承認(rèn),對于固態(tài)硬盤,對于更低能耗更高速度的存儲的要求"古已有之",正像Par Botes所說的,用戶是有這方面需求的。對于固態(tài)硬盤走進企業(yè)存儲的前景,我是看好的,Par Botes是看好的,EMC也是看好的,即使是Stephen Foskett這樣堅定的懷疑論者也在自己的blog中承認(rèn),他是希望固態(tài)硬盤能夠早日走進企業(yè)存儲中去的,可以說,固態(tài)硬盤走進企業(yè)存儲,前途光明。