英特爾中國區(qū)非易失性存儲事業(yè)部總經(jīng)理劉鋼在軟件定義存儲峰會上發(fā)表主題演講
我們一直生活在數(shù)據(jù)智能化的時代,要求有更多的數(shù)據(jù)、智能化,數(shù)據(jù)是非常寶貴的財富。英特爾中國區(qū)總裁楊敘說過 “數(shù)據(jù)是新時代的理由”,所以如何存儲數(shù)據(jù)、處理數(shù)據(jù)變得非常重要。
在數(shù)據(jù)存儲部分,在過去很長一段時間內(nèi)相對滯后于數(shù)據(jù)計算,所以在數(shù)據(jù)存儲方面有相當多的瓶頸,也可以說有相當多機會去發(fā)展。發(fā)展數(shù)據(jù)存儲這部分,我們要從軟件和硬件的角度進行推動,提供創(chuàng)新性的技術(shù)和方法,英特爾作為一家偏向硬件的公司,我們參加軟件定義存儲峰會,就是因為我們要同時推動其發(fā)展。
現(xiàn)在看一組數(shù)據(jù),以數(shù)據(jù)為中心的智能化時代,數(shù)據(jù)發(fā)展的速度非??欤魑贿^去幾年可能已經(jīng)體會到了數(shù)據(jù)爆發(fā)式增長,不僅是手機微信產(chǎn)生的數(shù)據(jù),或者說語音產(chǎn)生的數(shù)據(jù),有的時候不知不覺當中會產(chǎn)生了很多數(shù)據(jù),以前在沒有物聯(lián)網(wǎng)的時候,你可能沒有意識到或者沒有記錄這些數(shù)據(jù),舉一個簡單的例子,上個周末讓我印象非常深刻,我周末參加了千島湖的鐵人三項比賽,我?guī)е遗畠哼^去的。因為我?guī)е粋€比賽的手環(huán),我發(fā)現(xiàn)我女兒總能出現(xiàn)在賽道適當?shù)奈恢?,為我加油鼓掌。她是用我的手環(huán)產(chǎn)生的數(shù)據(jù),通過組委會云服務,在她手機APP上她能隨時看到我在哪個位置,然后給我加油。
這里產(chǎn)生了很多數(shù)據(jù),包括我自己戴的運動手表,里面有心率、爬升高度、速度,由于人工智能和物聯(lián)網(wǎng)的發(fā)展,我們在產(chǎn)生了越來越多你自己想不到的數(shù)據(jù)。我們也聽到有一些領先的健康醫(yī)療的公司,他們甚至在用這些數(shù)據(jù)做到“比你更懂你”,來提供更好的健康管理服務。中國在這部分有非常多的優(yōu)勢,無論數(shù)據(jù)產(chǎn)生量,還有聯(lián)網(wǎng)設備方面的數(shù)量,可以看到有非常大的優(yōu)勢,現(xiàn)在大家看到2018年這么快的數(shù)據(jù)增長,其實相對于整個數(shù)據(jù)洪流的爆發(fā)。這只是剛剛開始而已。
傲騰和分層存儲
并不是所有數(shù)據(jù)都是一樣的,并不是所有的數(shù)據(jù)都需要實時處理,或者是持續(xù)需要實時處理,有些數(shù)據(jù)你的確需要實時的分析與處理,包括工廠里機床監(jiān)控的以及控制的數(shù)據(jù),包括自動駕駛的數(shù)據(jù)、導航的數(shù)據(jù),這些數(shù)據(jù)都需要實時處理,還有金融交易數(shù)據(jù)也需要實時處理。
但還有很多數(shù)據(jù)你只是記錄下來,很長一段時間再去看,這叫冷數(shù)據(jù),前面的叫熱數(shù)據(jù)。而且越來越多數(shù)據(jù)在溫數(shù)據(jù)部分,有的時候需要快速處理,有的時候只是存在那里。所以不僅要看到數(shù)據(jù)量大,而且還要看到在不同應用場景里數(shù)據(jù)是分層的,分成熱數(shù)據(jù)、溫數(shù)據(jù)和冷數(shù)據(jù),那你能不能用一種技術(shù)滿足這些爆發(fā)式數(shù)據(jù)的需求,無論是存儲還是需求?顯然是做不到的。
那怎么樣用不同的存儲技術(shù)來處理不同數(shù)據(jù)分層的需求?這是個非常值得關注的問題,也是現(xiàn)在有很多新技術(shù)。
數(shù)據(jù)分層就需要異構(gòu)存儲,對于不同數(shù)據(jù)層,存儲方式和存儲介質(zhì)也會不同,這部分有很多創(chuàng)新。
英特爾在其中針對熱數(shù)據(jù)和溫數(shù)據(jù)有兩項最新的創(chuàng)新,??? 一項是針對大容量的、溫數(shù)據(jù)部分的,這個時候用戶需要的是低成本、高密度,要做到這點我們有最新的64層的QLC NAND存儲,這是針對溫數(shù)據(jù)層的。針對熱數(shù)據(jù),用戶需要低延遲、高性能的存儲,我們?yōu)榇颂峁┝税硫v系列產(chǎn)品。
這兩項技術(shù)可以更好的滿足數(shù)據(jù)分層的需求,而且新技術(shù)的發(fā)展其實跟軟件定義存儲又緊密相關。
大家知道SDS最大的特點,尤其是最重要的兩個優(yōu)勢開放性和創(chuàng)新性,開放性使你不必擁有傳統(tǒng)昂貴的技術(shù),不必依靠單一廠商供應,一個標準的硬件就可以讓你實現(xiàn)軟件定義存儲的基本硬件架構(gòu);創(chuàng)新性就是它能最快集成和擁抱最新的技術(shù)發(fā)展,無論是處理器技術(shù)還是存儲技術(shù)。
這兩項新技術(shù)被合作伙伴越來越多地采用,今天也會有更多的分享。我們分別看一下這兩個技術(shù)和產(chǎn)品。
一個是傲騰,傲騰就是我剛才講到的低延遲、高性能。這個產(chǎn)品它是過去十幾年以來在存儲介質(zhì)上非常大的躍進、進步,因為它不同于傳統(tǒng)的NAND,在介質(zhì)方面就有很大的新的提升。
除了介質(zhì)以外,傲騰的讀寫和插入方面跟NAND不同,NAND是按照頁(Page)讀寫塊、垃圾回收、遷移的策略,傲騰讀寫方式是按字節(jié)來的,適應于軟件定義存儲源數(shù)據(jù)部分存儲的需求,大家可以想象一下當你在做軟件定義存儲的時候,在源數(shù)據(jù)部分需要這樣的讀寫方式。
新的傲騰存儲介質(zhì)和新的讀寫方式對于用戶有四大好處:高耐用性、負載響應低延遲、可預測的快速服務以及突破性的性能。?? 這里強調(diào)一下低延遲,在傳統(tǒng)的存儲系統(tǒng)里,藍色是硬盤本身帶來的延遲,當從硬盤進化到固態(tài)盤的時候,你發(fā)現(xiàn)盤的延遲減少了,但是借口延遲SAS/SATA延遲還在那里,最下面才是軟件的延遲。其實軟件的延遲跟硬件延遲比起來都可以忽略了,是非常少的。
從互聯(lián)網(wǎng)服務商的反映來看,從去年開始80%以上的互聯(lián)網(wǎng)服務商采用NVMe固態(tài)盤,不是SATA固態(tài)盤,所以業(yè)界的固態(tài)盤已經(jīng)很快速的切換到NVMe了,所以你看橘色部分不見了,只有藍色的部分。
當我們采用傲騰的時候,由于傲騰介質(zhì)和讀寫方式的改變,接口的延遲沒有了,盤的延遲已經(jīng)變成跟軟件同等規(guī)模,所以這個時候做到延遲性能的極大改善。傲騰的低延時,加上高耐用性,是原來耐用性的20倍以上。這兩項特性加到一起,就讓傲騰在軟件定義存儲作為緩存層它是最有效的。
??英特爾QLC
針對溫數(shù)據(jù),我們有最新64層的QLC。
大概在2015年的時候,當時我們采用2 DMLC NAND跟現(xiàn)在3D 64層QLC NAND比,同樣單位面積硅片大小,它的容量提高了10倍。
3D QLC是非常適合溫數(shù)據(jù)存儲的,此前固態(tài)盤密度不如硬盤,但是QLC固態(tài)盤密度遠超硬盤,你甚至能夠在1U的服務器里,能實現(xiàn)1PB的存儲容量。QLC我們的期望值是它能夠在溫數(shù)據(jù)層更大規(guī)模的去代替硬盤。
對應我們的產(chǎn)品,在一個2.5寸的盤里可以做到8TB,甚至做到16/32TB。還有新的外觀尺寸的固態(tài)盤,它是條狀的,這種條狀的更好的散熱,不僅盤本身是高密度的,你在機箱里你還可以做到高密度,它改進了機箱設計,讓機箱通風、散熱更高,讓1U機箱做到1PB的容量。
加上前面我們講到的傲騰用到熱數(shù)據(jù),再加上QLC用到溫數(shù)據(jù),加到一起應用到軟件定義存儲的場景,比如Ceph的場景之下,大家可以看到這是一種新的架構(gòu)的改進,你可以用傲騰,如果很高性能需求,你可以用QLC 3D NAND降低成本。在對象存儲可以用傲騰加速硬盤,當然我講的成本是達到同樣的性能總體的用戶成本,后面的例子會讓大家更清楚了解到這部分是怎么樣實現(xiàn)的。
事實上在國內(nèi)存儲公司有不少公司做了這方面的嘗試,有非常令人驚喜的進展,下面我們想請英特爾在存儲和計算領域的重要合作伙伴浪潮存儲產(chǎn)品線總經(jīng)理李輝總經(jīng)理,給我們分享浪潮在軟件定義存儲的探索和經(jīng)驗分享。
浪潮的分享
李輝:在過去我們對英特爾的介質(zhì)、傲騰的介質(zhì)和QLC的介質(zhì),以及傳統(tǒng)的TLC的介質(zhì)做了兩方面的測試。
第一方面的測試是我們關注怎么花錢,假如我們有同樣的錢的話,我們對兩種配置進行比較。第一種是我們?nèi)?D TLC介質(zhì)做分布式的軟件定義存儲,當然是全閃存儲。第二種配置是我們用傲騰做熱數(shù)據(jù),QLC做溫數(shù)據(jù)的情況下,我們會得到什么樣的結(jié)果?
我們把這種3D TLC作為介質(zhì)作為基準,然后再來衡量新的傲騰+QLC介質(zhì)之后,我們可以從幾個方面得到更大的價值。
第一個是我們的容量,因為剛才也介紹到有8TB、32TB,同樣一筆費用我們可以在容量上提升2.9倍,當然這個容量還都是閃存的介質(zhì)。
第二個是在時延上,得益于傲騰的幾個數(shù)量級時延的提升,所以我們把整個系統(tǒng)的時延,這里大概99.99%的4K的讀寫的時延優(yōu)化,進一步優(yōu)化到整個把時延進一步降低52%。
在IOPS上,同樣我們也有提升,大概提升了3%。
在空間和節(jié)能降耗上,我們用新的介質(zhì)組合去做熱數(shù)據(jù)和溫數(shù)據(jù),介質(zhì)空間從11個節(jié)點降到8個節(jié)點,在整個機房空間上和節(jié)能降耗上,也會有非常好的價值的體現(xiàn)。也就是說在同樣一筆錢,英特爾這種新的方案組合,傲騰+QLC新組合情況下,在容量、空間、性能、空間、數(shù)據(jù)中心、節(jié)能降耗上得到非常好的價值。
當然,另外一個緯度不是花錢的緯度,我們要性能的緯度。我們希望在怎么樣達到性能的情況下,來節(jié)省錢。也是同樣的兩種配置QLC、TLC+傲騰,我們同樣需要的是性能,新的組合不僅僅得到性能,在性能之外可以更多得到東西,這想這也是英特爾傲騰+QLC帶來的,不僅僅是性能,容量也得到很大提升。延時上面,也是一樣的,這也是傲騰。
同時在集群費用方面,大概有9%的費用下降。然后在空間和能耗上,可以降低33%。這是我們在過去一段時間跟英特爾在結(jié)合新的介質(zhì)技術(shù),在分布式存儲上我們做的研究、探索和實驗與驗證。
劉鋼:謝謝浪潮在最新的存儲技術(shù)用到軟件定義存儲方面的嘗試和探索,大家看到這是非常令人驚喜的成果。
當你把傲騰和QLC結(jié)合到一起,應用到軟件定義存儲上起到這么好的效果,不僅提高了性能,而且還降低了成本,甚至提高了總的容量。這都來源于什么?來源于我們采用了異構(gòu)存儲儲,讓傲騰發(fā)揮它低延遲、高性能的優(yōu)勢,讓QLC發(fā)揮它的低成本和高密度的優(yōu)勢,所以實現(xiàn)了組合起來的更好的效果。
在云服務商部分,很多公司也做了很多嘗試,這個是青云在云存儲方面的服務,他用傲騰加入他的固態(tài)盤,用傲騰加速他硬盤存儲,同樣獲得很好的效果,甚至一些金融行業(yè)客戶也選用這樣的服務了。
其實不只青云,阿里也在自己數(shù)據(jù)里采用傲騰,一個是他們內(nèi)部的數(shù)據(jù)庫,就是在進行交易的,大家知道阿里的交易數(shù)據(jù)量是很大的,他的數(shù)據(jù)庫里有采用傲騰來加速整體的性能。另外他進一步的把服務推廣到阿里云的服務,讓他的企業(yè)客戶也能享受到傲騰能夠加速云存儲,阿里云服務提供最快的ESSD塊數(shù)據(jù)存儲服務,背后就用傲騰,比以前傳統(tǒng)存儲快3.8倍,所以這個是系統(tǒng)級的,給用戶帶來服務的,不是存儲介質(zhì)速度提升,也是盤的速度提升,而是應用到產(chǎn)品上的性能提升。
除了云服務商以外,我們在軟件部分非常緊密的合作伙伴是VMWare,在性能大幅度提高的時候,成本反而有所降低,當然成本降低的不多,但是我們強調(diào)的是性能提升,性能提升了幾乎2倍,成本降低了1.4倍,所以性能提高了成本下降了,就是來自于剛才我講的異構(gòu)方法,各自發(fā)揮優(yōu)勢,針對不同層發(fā)揮方案。這套方案在美國用到很多銀行,在銀行業(yè)有非常多的應用,因為那邊有很多VSAN行業(yè)客戶在那里。
小結(jié)
在過去1、2年中我們看到越來越多的基于傲騰的方案在成功的落地,再加上QLC的搭配,這兩種結(jié)合到一起,就能發(fā)揮非常多的優(yōu)勢。不同分層的數(shù)據(jù)需要用不同的存儲介質(zhì)、不同的處理方式進行存儲和處理,我們有了低延遲、高性能的傲騰來滿足熱數(shù)據(jù),需要實時處理的需求,同時我們也有了3D? QLC它的低成本和高密度來滿足溫數(shù)據(jù)層的需求,所以異構(gòu)存儲是最佳的組合。當我們采用這種新的存儲突破性的技術(shù),我們來幫助突破存儲瓶頸,來很好的以軟件定義存儲的開放性和創(chuàng)新性結(jié)合起來,全面提速軟件定義存儲。