王彥飛:現(xiàn)在是處于數(shù)字化轉(zhuǎn)型的2.0階段,我們1.0的時代,各個組織和用戶在做自己的創(chuàng)新。2.0時代的到來,大家對于創(chuàng)新的共識,使得我們對于人工智能、物聯(lián)網(wǎng)、區(qū)塊鏈信息技術(shù)的使用急劇地膨脹。
五代存儲的演進
將來還有3.0階段,可能更多的是側(cè)重于創(chuàng)新的持續(xù)化和創(chuàng)新的制度化??匆幌卢F(xiàn)在所處的2.0階段的三大特征:
1、最主要的特征,數(shù)字化鴻溝已經(jīng)形成,對于個人或者是企業(yè)來講,面前這條溝越來越深、越來越寬。對于企業(yè)來講,如果你能成功地跨過去,可能就會上一個新的發(fā)展階段。很多百年老店突然倒了,都是栽到這條溝里面了。把這個概念提出來,更多地引起大家對這個事實的認可和對這個事實的澄清。
2、規(guī)?;?。不管是數(shù)據(jù)量也好,還是用戶數(shù)也好,包括物聯(lián)網(wǎng)上的數(shù)據(jù)節(jié)點也好,都會爆炸式地增長。而爆炸式地增長所帶來的另外一個結(jié)果,就是所謂第三點。
3、創(chuàng)新速度越來越快,這是IDC總結(jié)的,中國互聯(lián)網(wǎng)每分鐘都會產(chǎn)生大量數(shù)據(jù),都會產(chǎn)生大量的交易,而這種數(shù)據(jù)和交易,對于存儲來講,有了新的要求。這是我們第五代存儲引入的一個切合點。數(shù)字化轉(zhuǎn)型過渡到2.0階段,原有的一些存儲,可能的一些特性已經(jīng)不足以滿足新的業(yè)務(wù)的要求。大家看一下,這個圖是我們幾代存儲迭代演進的過程。下面大家看到這三個大圈,是我們業(yè)務(wù)模式的更新迭代。我們認為,作為信息基礎(chǔ)架構(gòu)最核心的基礎(chǔ)設(shè)施存儲來講,它的更新迭代主要來自于業(yè)務(wù)模式的推進。比如說,我們在所謂的第一平臺的時候,只有IBM的大機+終端模式的時候,存儲也很簡單,直聯(lián)就可以,因為服務(wù)器數(shù)量很少。隨著計算機網(wǎng)絡(luò),應(yīng)用過渡到第二平臺,存儲更多是向統(tǒng)一存儲角度過渡,強調(diào)共享。隨著移動互聯(lián)網(wǎng)技術(shù)、大數(shù)據(jù)發(fā)展,現(xiàn)在的應(yīng)用基本上跨度到了第三平臺,對于存儲的要求進一步提升?,F(xiàn)在所有的存儲基本上都在講閃存,閃存是解決存儲性能問題的關(guān)鍵組件?,F(xiàn)在數(shù)字化轉(zhuǎn)型2.0階段,閃存已不足以應(yīng)對現(xiàn)有的業(yè)務(wù)帶來的挑戰(zhàn),有更新的一些特征的存儲會出現(xiàn)。這個存儲的主要特征,就是智能化,這是第五代存儲的主要的關(guān)鍵字。
第五代存儲的主要特征
在今年,我們和IDC聯(lián)合發(fā)布了關(guān)于第五代存儲助力數(shù)字化轉(zhuǎn)型的白皮書,大家可以從IDC網(wǎng)站上下載到。在白皮書里面,著重闡述了第五代存儲的一些概念,以及它的主要特征。我們認為第五代存儲是數(shù)字化經(jīng)濟發(fā)展的一個必然產(chǎn)物。因為第五代存儲作為基礎(chǔ)架構(gòu)的核心,作為數(shù)據(jù)資產(chǎn)的主要的附著點,應(yīng)該幫助前端的業(yè)務(wù),進行更多的轉(zhuǎn)型,所以它應(yīng)該具有一些新的特征。這個新的特征,包括面向云的架構(gòu),能承載AI,能承載IOT,能承載5G這樣一些新興技術(shù)。
作為一個企業(yè)或者組織來講,當我們在選擇存儲平臺的時候,不管是集中存儲、分布式存儲,還是云存儲,大家可以根據(jù)第五存儲這5條具體特征來比較全面地考核存儲的前瞻性、對新興技術(shù)的適應(yīng)性,給大家提供一個思路和框架。
第一個特征是敏捷高速,翻譯成簡單的字就是要“快”,因為現(xiàn)在的數(shù)據(jù)也好,應(yīng)用模式也好,更新迭代地越來越快。衡量敏捷高速最主要的特點,就是要采用NVMe的技術(shù)?,F(xiàn)在閃存基本上已經(jīng)跨度到NVMe,IDC認為2018年是NVMe的元年,不支持NVMe技術(shù)的設(shè)備,不管是存儲還是網(wǎng)絡(luò)設(shè)備,基本上已經(jīng)落后了一代。
NVMe只是一個數(shù)據(jù)傳輸?shù)膮f(xié)議,NVMe主要的價值在于檢索介質(zhì)的性能,如果只是換了NVMe,而存儲介質(zhì)沒有大的更新,性能的提升有限。可以理解為,NVMe是一個信息的通道,而這個通道上面,跑什么樣的車,取決于采用什么樣的最新的介質(zhì)技術(shù)。這個介質(zhì)技術(shù),我們論壇的主題就是SCM,SCM就是最應(yīng)該跑在NVMe通道上的一個最極致的介質(zhì)。各個廠商的技術(shù)發(fā)展應(yīng)該都是圍繞著NVMe和SCM這兩項技術(shù)來展開。
NVMe給我們帶來的好處,就是一個持續(xù)的優(yōu)化和敏捷的性能。關(guān)鍵點是NVMe如何發(fā)揮出NVMe最大的效率,關(guān)鍵在于SCM。我們相對于機械硬盤來講已經(jīng)很快了,現(xiàn)在各個廠商都在把SCM引到存儲平臺的建設(shè)中,但思路不太一樣。因為SCM就是一個介質(zhì),可以存在存儲的各個位置,現(xiàn)在各個廠商把SCM放在Cache這一側(cè)。我們的PowerMAX,是唯一把SCM當做存儲層,當做磁盤這一層來用的產(chǎn)品,基本上都是當做 Cache 來用,設(shè)計思路不一樣,倒也無所謂,關(guān)鍵是要把SCM在現(xiàn)階段,讓它幫助我們解決什么樣的問題,我們把它當做盤來用的主要思路,因為SCM比SSD的性能要好很多,所以我要用一個比SSD盤性能好很多的東西,來彌補SSD盤性能的短板。
第二個特征是有效容量。我們之前推全閃的時候,數(shù)據(jù)不停地壓縮、解壓縮,對性能的延時一定有影響,尤其是當IO特別密集的時候,影響會放大。我們講第五代存儲的特征,有效容量,更多的強調(diào)性能無損。如果只是壓縮消除,第四代的閃存陣列里面,已經(jīng)具有這個技術(shù)。
有效容量是什么?如果我們是一個20T的物理容量,消除掉了必要的冗余之后,可能變成17T。你開4倍的壓縮,它就變成68T,開5倍就變成了85T,只有20T的物理資產(chǎn),承載了數(shù)倍于物理資產(chǎn)的容量。這個方式帶給我們最大的好處,除了性能的提升之外,機房空間、能耗、冷卻的費用降低?,F(xiàn)在數(shù)據(jù)爆炸式增長,我們解決爆炸式的方式,應(yīng)該更智能一點。有效容量是幫助我們解決這個問題的最主要的一個方式。
我們第五代存儲有效容量的計劃,這是針對用戶推出的。這個計劃是為了促進用戶能使用有效容量。對于用戶來講,有兩個好處,一個好處是說你可以降低運營成本,因為不需要很多的機房空間。另外一個好處,可以間接地對于自然環(huán)境的保護,做一份貢獻。大家看比較量化的計算,如果100T的有效容量跟100T的物理容量,它的耗電量所產(chǎn)生的溫室氣體的排放,大概可以減少700多公斤二氧化碳的排放。一棵樹一年會消耗掉10公斤二氧化碳,我們相當于在環(huán)境里面種了700多棵樹。
第三個特征是無縫接云。數(shù)字化轉(zhuǎn)型兩大出發(fā)點:一個是以數(shù)據(jù)為核心,第二個是一定要依靠于云的力量。無縫接云,現(xiàn)在的設(shè)備,存儲平臺,不管是集中平臺、分布式平臺,一定要有一個對于云原生業(yè)務(wù)的支持能力,對于多云業(yè)務(wù)共存的配合能力。概括起來講就是云連接系統(tǒng)、云數(shù)據(jù)服務(wù)、云數(shù)據(jù)洞見。
云連接系統(tǒng),要求現(xiàn)在的存儲不會成為一個新的信息孤島。因為我們在所有的組織當中,應(yīng)該都有云設(shè)施,不管是私有云,還是公有云,不管是自建的,還是購買的。這個存儲平臺,如果不能跟現(xiàn)有云進行整合,進行關(guān)聯(lián),它會變成一個新的信息孤島。將企業(yè)內(nèi)部的設(shè)備連接到云當中,是我們第五代存儲所具備的一個最基本的要求。這個連接實現(xiàn)了之后,可以實現(xiàn)數(shù)據(jù)中心內(nèi)部的數(shù)據(jù)跟各種云的資產(chǎn)數(shù)據(jù)之間自由流動,對于我們數(shù)據(jù)的維護來講,是非常重要的一點。
另外一個是云數(shù)據(jù)服務(wù)。以前提供的數(shù)據(jù)服務(wù)都是在設(shè)備內(nèi)部自己的。我們希望這個數(shù)據(jù)服務(wù)能擴展到這個數(shù)據(jù)之外,最好能擴展到更加廉價、管理更加簡單的云資產(chǎn)之上。新的第五代存儲里面,應(yīng)該具有一些和云數(shù)據(jù)服務(wù)做對接的一些新的解決方案。比如說做容災(zāi),以前需要一個對等的設(shè)備在災(zāi)備中心,現(xiàn)在災(zāi)備中心可以直接建在云上,當成一個虛擬的災(zāi)備中心,或把核心資產(chǎn)的一些數(shù)據(jù)備份在云上,從云上快速恢復(fù)回來。
除了云連接和云服務(wù)之外,還有云數(shù)據(jù)洞見,要從云層有一個宏觀的自動化的、對數(shù)據(jù)和對于存儲運維管理的平臺。我們主要的工具就叫CloudIQ,可以對DELL EMC的存儲平臺進行云化管理,建構(gòu)在自身的一個PaaS平臺上的云原生應(yīng)用,可以把設(shè)備上面,可能希望得到的一些信息,如報警、容量的使用、健康管理的信息,下發(fā)到各個移動設(shè)備上,可以實時掌握數(shù)據(jù)情況。這個是我們認為第五代存儲,從云的自動化運維角度來講,應(yīng)該具備的一些特點。
第四個特征是數(shù)據(jù)護航。數(shù)據(jù)的安全性,數(shù)據(jù)的可靠性是第一位的。數(shù)字經(jīng)濟,數(shù)據(jù)作為企業(yè)的資產(chǎn)越來越成為第一生產(chǎn)力。存儲,不管如何地擴展它的一些額外的功能也好,一些新興的技術(shù)也好,數(shù)據(jù)資產(chǎn)的可靠性是存儲最應(yīng)該具備的第一優(yōu)先級的問題。
我們看存儲具備能力的最直接指標,應(yīng)該提供6個9的可靠性,6個9是應(yīng)該具備的最低要求。6個9是30秒,7個9是5秒鐘,對于一個故障,或者對于一個業(yè)務(wù)連續(xù)性來講,6個9和7個9、8個9差別不大,所以把6個9定義為最基本的門檻。
數(shù)據(jù)從邊緣到數(shù)據(jù)中心,到云里面都有流動,我們對處于各個階段的數(shù)據(jù)進行比較完善的保護,我們提供一個全面的數(shù)據(jù)保護的方案。這個金字塔里面,越往上對數(shù)據(jù)的連續(xù)性和重要級別,要求越高。越往下,要求的相對來講會低一點。除了歸檔數(shù)據(jù)備份和恢復(fù)之外,最重要的是提供基于復(fù)制的容災(zāi)的技術(shù),基于CDP連續(xù)數(shù)據(jù)保護的容災(zāi)技術(shù),可以實現(xiàn)RPO、RTO等于0的連續(xù)的可用性。就是常說的雙活系統(tǒng)或者是多活系統(tǒng),這是整個數(shù)據(jù)資產(chǎn)保護的金字塔的塔尖。這個塔尖,現(xiàn)在越來越多的應(yīng)用都需要這樣一個技術(shù),因為我們以前絕大多數(shù)的業(yè)務(wù)都是5×9,大家去銀行辦業(yè)務(wù)的時候,銀行一關(guān)門,大家就都只能等到明天了?,F(xiàn)在銀行關(guān)門之后,還有很多用戶,通過互聯(lián)網(wǎng),通過手機銀行去訪問它的系統(tǒng)。大家會發(fā)現(xiàn),很多數(shù)據(jù)庫的業(yè)務(wù)基本上都是要7×24小時提供服務(wù)。我們前面講塔尖的這一部分應(yīng)用得以大規(guī)模地去使用,而這一部分方案,恰恰是我們作為存儲廠商比較在意的,比較擅長的。
剛才講單機可靠性,就算是100%,對于大家來講,依然是遠遠不夠的。為什么要有容災(zāi)系統(tǒng),為什么要有雙活系統(tǒng)?因為單機系統(tǒng)100%,數(shù)據(jù)中心一定要有跨距離、跨空間的容災(zāi)系統(tǒng),這才是實現(xiàn)連續(xù)可用性關(guān)鍵的點。這個點考察的就是連續(xù)可用性的解決方案。
第五個特征是AI賦能。有的是通過更高的性能,比如說有的是通過AI來提高命中率,有的是通過AI實現(xiàn)數(shù)據(jù)正確擺放,也有的通過AI來實現(xiàn)自動化的運維,減少運維的復(fù)雜性。第五代存儲AI運維,不管用在哪個領(lǐng)域,希望這個設(shè)備是基于人工智能的技術(shù)來進行一些故障及運行趨勢的預(yù)測,一定要有預(yù)測的功能。因為機器學(xué)習(xí)、AI也好,最主要的功能就是做預(yù)測。
我們現(xiàn)在在存儲里面用得比較完善的一個機制,有一個機器學(xué)習(xí)的機制,是配合SCM來使用最新的技術(shù)。因為SCM雖然性能很好,但是它的價格依然很高。如果我們把它當做盤來用,一定要有一個分層的機制,我們是引入了機器學(xué)習(xí)的算法,主要的作用,就是通過對以往數(shù)據(jù)的分析進行統(tǒng)計和預(yù)測。我每一個數(shù)據(jù)塊在未來某一階段的冷熱程度,可以保證把熱的數(shù)據(jù)塊放在SCM上,一定是現(xiàn)在和未來一段時間,肯定會熱。這個分層的機制,相對于以前的分層機制來講,有了一個很大的本質(zhì)不同,它可以預(yù)測未來數(shù)據(jù)塊的冷熱程度。以前所有的分層機制基本上都是事后統(tǒng)計的功能。大家發(fā)現(xiàn)每家都有分層,但實際上各個用戶用得非常少,分層的機制,對于優(yōu)先介質(zhì)的使用效率并不高,當統(tǒng)計到這個數(shù)據(jù)塊是熱的時候,把它遷移到SSD上,是有個時間的,大概是小時級,遷上去之后,可能已經(jīng)不熱了,還要再遷下來。如果作為用戶,一定會發(fā)現(xiàn),我們最簡單的使用SSD的方法,是直接固定到SSD上,不用分層。我們最新的機器學(xué)習(xí)引擎,可以幫助大家解決這個問題。通過預(yù)測,如果有一些周期性的業(yè)務(wù)特征,比如說每天早上8點鐘,有一些數(shù)據(jù)是需要進行大規(guī)模的訪問,這個機器學(xué)習(xí)引擎,通過一段時間的學(xué)習(xí)之后,會識別到特征,在每天8點之前,把要訪問的數(shù)據(jù)提前放在SCM上,這就是機器學(xué)習(xí)給整個分層帶來的最本質(zhì)的變化。它可以預(yù)測數(shù)據(jù)的冷熱程度,把數(shù)據(jù)進行正確的實時的擺放。這也是把SCM當做盤來用的一個最重要的技術(shù)基礎(chǔ),如果沒有這個技術(shù),我們把SCM當做盤來用的效率也好、效果也好,就會大打折扣。