以下為速記整理,未經(jīng)演講人審核:

存儲技術(shù)的發(fā)展演變

簡單回顧存儲發(fā)展的歷程。我做存儲大概從2003年開始到現(xiàn)在2019年, 16年時間。從80年代開始的DAS、NAS到SAN,2000年以后開始做Scale,2010年多了云存儲以后,最近的全閃存、軟件定義存儲還有云存儲雖然發(fā)展速度不是特別快,但是一個新的技術(shù),創(chuàng)新相對較多。最近這兩年我們覺得熱門的是全閃存或者說分布式全閃存。

我關(guān)注的是AI技術(shù)和存儲相結(jié)合,AI管理存儲相對較多一點。

存儲人關(guān)于軟件定義存儲、分布式存儲、超融合存儲、智能存儲定義可能會混淆,這里我們不講定義,只澄清以下幾點。

軟件定義存儲,我們現(xiàn)在默認是分布式存儲,但并非如此。首先第一點軟件定義存儲不一定是分布式的。以前我們認為存儲是大的硬件盒子,大家交付的就是這個。但現(xiàn)在不是,我們有標準服務(wù)器架構(gòu),不管X86還是國產(chǎn)化平臺,它的核心從硬件轉(zhuǎn)變到軟件定義存儲,第一點我們要明確,軟件定義存儲并不一定是分布式存儲。

第二點什么是分布式存儲?我從2000年開始接觸分布式存儲,以前很多年沒有熱起來,在2010年之后趕上云計算火起來了。分布式存儲現(xiàn)在可以是對象存儲、塊存儲,以前狹義的存儲概念。

第三點是超融合,我們稱2010年是超融合元年,現(xiàn)在SDS和全閃存勢頭略蓋過它,國內(nèi)有做超融合的廠商,也有做SDS的,界定清晰。但我要說的一點是,超融合里核心東西是軟件定義存儲。它與軟件定義存儲密不可分。

因此,大家都在討論什么叫超融合,我說了三個完全——完全軟件定義、完全虛擬化、完全分布式。其實現(xiàn)在很多架構(gòu)我們都叫超融合,但按這個概念不是,它要求你啟一個虛擬機都可以,但是我們的存儲軟件和虛擬化軟件是并行存在的,按照目前的架構(gòu)首先必須有虛擬化,然后才是超融合。

第四點智能存儲,最近我們跟學術(shù)界、工業(yè)界結(jié)合比較緊密,我在讀書的時候叫數(shù)據(jù)挖掘,現(xiàn)在大家更多提AI,所以我們最近考慮一個事情把人工智能技術(shù),深度學習、機器學習,包括統(tǒng)計和數(shù)據(jù)挖掘,智能化運維,包括怎么構(gòu)建安全的存儲體系,以及智能化調(diào)度,目前我們關(guān)注點在這個角度多一點。

SDS軟件存儲已經(jīng)成為市場主流

SDS軟件存儲已經(jīng)成為主流,大家說SDS超融合要“革”傳統(tǒng)存儲的命,通過IDC的報告說明幾個問題,軟件定義存儲包括超融合,這兩個占比接近35%,已經(jīng)占到1/3。一個狀態(tài)是軟件定義存儲已經(jīng)成為市場主流,從前我們沒有明確,但現(xiàn)在浪潮也在明確說軟件定義存儲成為市場主流。

如圖客觀來看,文件存儲已經(jīng)很多年,過去、現(xiàn)在、未來,仍在市場中占大頭,大家的預測也是如此,未來占一半以上。未來文件+對象是存儲的主力軍。

塊存儲,以前我們講的是SAN數(shù)據(jù)庫要有,應用系統(tǒng)要有。未來虛擬化、虛擬機、數(shù)據(jù)庫要快,其他更多是非研發(fā)數(shù)據(jù)。我們看這張圖,紅色部分永遠也不消失,在一些非常核心的系統(tǒng)里,金融、電信核心系統(tǒng)里,這個系統(tǒng)仍然保留,關(guān)注核心是穩(wěn)定性,包括性能平穩(wěn)性。

這張圖是中國軟件市場預測,每年大概有十幾個億,但增長速度很快,就像一個小孩一樣,不怕它現(xiàn)在很小,長的速度很快,這幾個代表為什么SSD成為市場主流。

我們做SDS,不能天天只認識自己,要對外邊世界有了解。這張圖我比較喜歡用,2017年的圖,有點老但基本狀態(tài)還是挺對的。剛才和大家講的廠商基本都在里邊。不管傳統(tǒng)廠商、軟件定義、新型廠商也好,在開源系統(tǒng)里大家都在講SDS,目前在開源里占了比較重的比例。

我們感興趣的幾個公司在文件(FILE)這個象限里,像WEKA? IO是代表下一代SDS的公司,它們可能有的關(guān)注高性能計算,有的關(guān)注混合云,有的關(guān)注全閃存。國內(nèi)這樣的企業(yè)反正我沒看見,我們的創(chuàng)新能力還遠遠不夠,而且我們國內(nèi)有一個特點,開源基礎(chǔ)上做的比較多,美國公司開源部分占了很小的部分,大部分都是自己做。因此必須要認清美國領(lǐng)先我們的形勢,如果沒有開源大家可以想象,我們今天有沒有這個會還不確定。

關(guān)于開源SDS系統(tǒng)

開源存儲有哪些系統(tǒng)?現(xiàn)在比較熱門是標紅的四個,Minio非常有特點,它們覺得以前的架構(gòu)有很多問題,做了很多深刻變革,大家可以關(guān)注一下。Lustre在高性能運算上,目前誰都替代不了。BeeGFS有段時間特別想替換Lustre,但不行。我是2008年博士畢業(yè),當時天天看Swift,那時候還不成熟,最開始是想做軟件系統(tǒng)。

GlusterFS比較早一點,后來什么都有,軟件優(yōu)勢可能好一點,它想替換Lustre和TFS,但發(fā)現(xiàn)性能跟Lustre和TFS還是有一點區(qū)別。Lustre我之前也一直在研究,但覺得太復雜了。我比較喜歡簡單的東西,當然復雜的東西也有人喜歡。

除了這四個,Alluxio和OpenSDS大家也可以關(guān)注一下,Alluxio,全類型的分布式系統(tǒng),之前中興把Alluxio加在前端。OpenSDS用于數(shù)據(jù)治理,后端可以對接很多存儲系統(tǒng),傳統(tǒng)的、非傳統(tǒng)的、非主流的都可以,主要進行數(shù)據(jù)處理,包括調(diào)度、分析等。

標藍部分是大家還在用,但熱度已經(jīng)不如以前了。像HDFS還是不錯的,幾個灰色部分像FastDFS、TFS是以前淘寶的, Swift現(xiàn)在用戶越來越少了,這個是開源架構(gòu)的情況。包括MongoDB是文檔型數(shù)據(jù)庫,MongoDB前段時間爆發(fā)了很多安全問題,被黑客攻擊了,這是整個開源SDS系統(tǒng)狀態(tài),大家可以了解一下。

分布式存儲的優(yōu)勢

為什么我們要選擇分布式存儲,傳統(tǒng)存儲不好嗎?的確傳統(tǒng)存儲有傳統(tǒng)的好處,分布式有分布式的好處,在我看來有幾點。

第一點傳統(tǒng)存儲容量,性能有上限。一個柜子空間有限,但分布式有一千個、一萬個節(jié)點,雖然沒有這么多,但整體擴展性遠遠高于傳統(tǒng)存儲,從這一點來講容量性能比傳統(tǒng)存儲有更高的表現(xiàn)。

第二點高可靠性。不存在任何單點故障,尤其在冷存儲里,可以做12+4,甚至更多,他的可靠性比較高,尤其在對象存儲里,包括視頻間里。

第三點彈性擴展。最小部署,按需擴容,但是擴展也是比較痛苦的,不是一下就可以完成的,好在彈性擴展是OK的。

第四定降低成本。你跟領(lǐng)導說的很好,都很好就是很貴,肯定不干,秒秒鐘把你的方案否了,因此成本是決定你方案能不能采納的關(guān)鍵因素。

為什么SDS大行其道?

第一,硬件成熟了,放在十年以前,放在2011年以前,那時候大家覺得X86不是很靠譜,那時候跟他說軟硬件存儲,還無法實現(xiàn),但現(xiàn)在不一樣了。

第二點高速網(wǎng)絡(luò)發(fā)展,最開始中國第一條互聯(lián)網(wǎng)帶寬是64KB/s,對比現(xiàn)在,10兆、百兆、千兆、萬兆,10萬兆都有了,網(wǎng)絡(luò)是一個很重要的支撐。帶寬也很重要,帶寬不行一切免談,網(wǎng)絡(luò)瓶頸消除之后分布式也沒問題了。

第三點閃存的革新性。以前硬盤是瓶頸,網(wǎng)絡(luò)也快了,硬盤也快了,那就剩下存儲了。我記得96年的時候是80兆的硬盤,現(xiàn)在隨便弄個U盤都比它大很多。硬盤的發(fā)展速度是非常非常慢的,也就是這些年SSD出來了以后有了突破,但是那么多年都沒有太大的變化。因此閃存是一個革新的進展,前面這三個跟硬件都有關(guān),主機、網(wǎng)絡(luò)、SSD。

第四點云化數(shù)據(jù)中心,你需要彈性、性能、融合、管理,這是一個比較軟的東西,沒有這些東西行不行?也行。但人總有更高的需求,希望這個東西越來越靈活、越來越簡單、成本越來越低。其實如果沒有這些我們的運維復雜一點也是OK的,但我們還是希望有,包括從裸機到虛擬機到現(xiàn)在的容器,使整個運維、業(yè)務(wù)系統(tǒng)越來越輕,越來越簡單,這也是為什么大家愿意用SDS。

SDS的應用場景

SDS應用場景有哪些?哪些場景比較適合?大家關(guān)注的什么場景都可以,那總是有些場景比較適合,有些場景不大適合。我覺得我們跟IDC報告比較統(tǒng)一,目前從三塊來看,第一塊是文件存儲,典型的VSS視頻監(jiān)控、Media? Streaming、HPC,主要是這三個場景,圈比較大,說明它的市場占有率比較高。

然后增長率比較快,廣電以前一直很多圖片、音頻、視頻,但是它的增長速度慢下來。最近AI、大數(shù)據(jù)、科學計算都在不斷增長,所以HPC又熱起來了。我以前在中科院的時候我們做高等物理的高清計算,現(xiàn)在是做實時運算,所以對存儲要求越來越快。

還有視頻監(jiān)控,室內(nèi)路外各種監(jiān)控且保存時間越來越長,清晰度要求越來越高,因此要求你的容量、性能會越來越高,這個是需求比較大的問題。目前主要以軟件為主,有些已經(jīng)支持定向存儲了,比如電信的全球眼、移動的千里眼,廣電里有些系統(tǒng)也開始對接定向存儲,所以目前仍然以軟件為主,以及有些局部應用在跟對象存儲對接。

前面也有同事講到,你切到什么對象業(yè)務(wù)是要變化的,因為以前接口是這樣的,傳到對象存儲很多業(yè)務(wù)要改,尤其傳統(tǒng)業(yè)務(wù)好幾十年,誰都不愿意動,我以前一個代碼寫了好幾十年了,沒有人敢動,業(yè)務(wù)也是一樣的。

第三點是塊存儲,目前我們覺得主要在DB和VDI領(lǐng)域應用較多,從中可以看到占比,這個是SDS目前主要應用場景。

關(guān)于SDS新的市場,未來有沒有新的應用場景?包括最近講的比較多的容器,以及混合云和多云環(huán)境,全棧云、行業(yè)云、邊緣計算。行業(yè)對存儲要求越來越高,傳統(tǒng)存儲行不行?估計可以,但可能沒有SDS做的更好,尤其存儲還提出了更多要求。

比如說全棧云,基礎(chǔ)設(shè)施要解決好,有了全棧云,你不僅要管存儲基礎(chǔ)架構(gòu),還要將底層硬件、生態(tài)做好,上面的應用也要管,因此小型企業(yè)可能做不了,大型企業(yè)會從上到下垂直全做,有時候你的計算要找廠商做,存儲找另外的廠商做,業(yè)務(wù)再找個廠商做,而全棧云全包。最典型的應用是行業(yè)云,針對某一個行業(yè)。

其實解決基礎(chǔ)設(shè)施相對容易,那搞一個行業(yè)應用,我們對存儲很懂,但對應用不懂,因此全棧云經(jīng)常也會有很多生態(tài)合作,一家很難做到很好,但未來這是一個比較新的產(chǎn)品形態(tài),之前我們說自己是SDS、全閃存、超融合。這種一般小型廠商玩不起,怎么跟阿里、華為、浪潮PK?因此這種全棧云不適合我們,我們小型企業(yè)還是把自己的部分做好。但是對于存儲來說是機會。

因為產(chǎn)品形態(tài)發(fā)生變化,所以整個場景也有變化,比如說邊緣計算,尤其是5G,帶寬突破后,各種移動設(shè)備全都活了,現(xiàn)在都講5G,實際的場景就是邊緣計算。比如說帶寬大了以后,邊緣計算可以直接反饋到數(shù)據(jù)中心。比如說電信有些監(jiān)控,直接回到數(shù)據(jù)中心。

SDS應用典型誤區(qū):別自己挖坑把自己坑了

下面講一些SDS應用典型誤區(qū),我們實踐中經(jīng)常遇到這種情況,我們老說別自己挖的坑把自己埋了,因此給大家一些建議,也是我們實踐中遇到的問題。

第一個需求過剩,本來需要一個釘子,結(jié)果非要搞一個非常全面的東西,本來只需要定向存儲,結(jié)果看到文件也要,看到塊也要,一定要抓住關(guān)鍵需求,但是大家總是想有總比沒有好,但是有的時候有也是負擔。

第二個選型錯誤,我剛才列了120家企業(yè),實際上更多,你是選開源還是商業(yè),因此選型要選對,選不對是因為你需求定義錯誤。常有客戶說要存儲,要1T,其它什么都不跟你講。跟他慢慢聊,然后他說不知道。所以不管是客戶還是廠商,可能都犯過這樣的錯誤,我們也犯過。

第三個配置不對。各種東西一堆,軟件有軟件的操作,硬件有硬件的操作,你不是專家很難搞定,有些操作我也搞不清楚。碰到很多客戶,開始跑的時候沒問題,結(jié)果跑了一段時間反映跟預測的不一樣,跟預測一樣就怪了,因為本身就不對。

大家經(jīng)常喜歡改一些東西,可能針對某個東西有幫助,但可能會給其它部分帶來變化,所以你不懂不要動,尤其對存儲,改了之后可能會有大事發(fā)生,因此對存儲一定要有敬畏之心,不要沒事瞎調(diào)。

第四點是運維,大家用傳統(tǒng)存儲都習慣了說不行重啟一下,人生病了多喝開水,大家都喜歡重啟,完了發(fā)現(xiàn)后面就出問題了。而且有的運維對產(chǎn)品根本不了解,他很隨意的關(guān)機、重啟,我也遇到過很多出問題的,好多都是人為的。所以現(xiàn)在為什么用AI,因為要輔助你做一些事情。

機器相對穩(wěn)定,人是根據(jù)自身的經(jīng)驗和情緒判斷,差別很大。

SDS需求分析

接下來說從需求分析開始,日常提問用戶的是應用場景是什么?應用負載有什么特點?容量是多少?文件大小是多少?是小塊的東西還是大塊的東西,是虛擬化應用還是傳統(tǒng)應用?

因此經(jīng)常用戶上來就說我要個存儲,然后你的合作伙伴告訴你他要個存儲,然后添油加醋的跟你說。因此想要了解用戶最初要什么?場景要搞清楚。有時候他直接說性能是幾千萬還是一個億,你想前面客戶端來1億,來10萬個,你肯定達不到,保證你崩潰掉,因此性能是有條件的,在某些條件下是完全達不到的。

存儲的特點是什么?你需要什么特性,你需要做軟件復制嗎?你需要做快照、克隆、重刪、壓縮、加密、歸檔嗎?是不是都需要?用戶總會需要新的需要,尤其是開放的合作,要了這個又要那個,有時候是你沒有的,所以你一定要搞清楚。

配置包括軟件配置和方案配置,一定要根據(jù)需求提供你的方案。

然后是部署,你是裸金屬、超融合還是分離部署,資源怎么分配?超融合的時候資源是什么樣的?一定要在前期想清楚。

再是選型,現(xiàn)在很多人問選擇,第一點是你主要需求是什么?你需要單一的還是統(tǒng)一的,如果都需要就分清楚類型。我發(fā)現(xiàn)80-90%用戶需要單一存儲,要不然需要一個對象、需要塊兒,同時需要的有沒有?有,但比例很小,其實有些用戶可以分開,從最佳實踐來看還是建議分開。

然后架構(gòu),現(xiàn)在好多架構(gòu)有中心的和無中心的,有分布式中心的,不同特點要搞清楚。所以我們經(jīng)常說局部有中心,比方說塊有中心、無中心差別不是特別大,但是如果是文件有中心和無中心差別很大,尤其對源數(shù)據(jù)的保護。

關(guān)于協(xié)議,大家爭論比較多的標準協(xié)議,經(jīng)常國內(nèi)我們見到更多的是私有協(xié)議,私有協(xié)議在安全和性能方面要好一點,但有兼容性問題。所以大廠經(jīng)常用標準接口多一點,國內(nèi)企業(yè)用私有協(xié)議比較多一點。我的建議是能用標準協(xié)議就用標準協(xié)議,別給自己找麻煩,有特定條件下用私有協(xié)議。

然后存儲特性,你的存儲特點是什么?I/O特性以及數(shù)據(jù)服務(wù),這些是存儲選型關(guān)注的,有些是不同產(chǎn)品的特性。可能每個產(chǎn)品無法百分之百達到這個要求,要抓住主要矛盾和主要需求。

另外是開源存儲or商業(yè)存儲,國內(nèi)覺得開源獲取比較容易,不需要什么成本。其實搞錯了,開源需要你對用人的要求,定制開發(fā)需要專業(yè)技術(shù)人員來做,我們發(fā)現(xiàn)成本不低,你做開源要能折騰,要有專業(yè)的技術(shù)人員來做。

因此選擇開源存儲需謹慎,必須要有自己專業(yè)的團隊,或者有廠商支持。比如說我提供開源軟件提供服務(wù)支持,如果你自己的團隊你沒有支撐你要謹慎,商業(yè)產(chǎn)品給你提供的就是這些東西,保證你的質(zhì)量,保證你的服務(wù)。

SDS集群配置,有節(jié)點配置、系統(tǒng)配置、存儲集群。節(jié)點有CPU、Core、Mem,網(wǎng)絡(luò)資源有三網(wǎng)、高速、綁定,存儲網(wǎng)絡(luò)建議分開,因為前端后端會形成干擾,所以要三網(wǎng)分離。你需不需要更高速的網(wǎng)絡(luò),需要多網(wǎng)絡(luò)綁定。以及硬盤資源,你是全硬盤HDD、SSD還是RAID。

集群也是,在能控制情況下盡量多個集群,壓力是不一樣的。剛才也說了上一定數(shù)量級是不一樣的,一般我們需要最佳實踐,我覺得一個集群控制在128個左右是比較舒服的,多了是給自己找事。

命名空間也是,有的是大空間池化,進來一個節(jié)點全部池化,開始做均衡,有些是分多組的,有些是聯(lián)合的,比方說你用亞馬遜是分中國區(qū)還是美國、歐洲的,是分區(qū)的。策略也是冗余或者高可用,尤其是標準協(xié)議。

系統(tǒng)配置分硬件配置、軟件配置和存儲最佳實踐,這個完全是要靠你實踐。

幾個SDS應用實踐建議:

關(guān)于SDS新發(fā)展方向探索,這張圖是2018年的,大家一般喜歡看上升,大家最不喜歡是下降的,一般創(chuàng)業(yè)公司都在上升的坡上,下面這個是成熟的生態(tài),上到高峰之后有一部分企業(yè)會垮掉,這張圖看不看都可以,有一個趨勢前面友商也講到,就是全閃存,分兩種趨勢,一種是全閃存,一種是分布式全閃存,我們要做很多重構(gòu),包括傳統(tǒng)編制方法都要改變。比方說以前我們是一個隊列,之前用的一些類似于新的介質(zhì)比方說NVMe,現(xiàn)在整個都變了,所以門檻100微秒以內(nèi)的,以前是500微秒、200微秒,所以它是有一定門檻的。

第二點,智能存儲,全球都在講這個事情,最簡單的就是智能化運維,這是傳統(tǒng)廠商都在做的事情。把存儲引擎智能化,實現(xiàn)功能,通過人工智能技術(shù)來做,這個講的比較虛,因為現(xiàn)在還沒有人定義標準,各家廠商做的都不一樣。

第三點,安全。以前是被動式的,現(xiàn)在想基于這個東西做主動防御。比如說數(shù)據(jù)庫應用,哪一天覺得不對,覺得有異常,我可能保護,我稱之為主動式防御,目前我們在做這方面的工作,首先要識別正常的I/O模型,異常的時候,觸發(fā)主動措施。

關(guān)于TaoCloud/大道云行

最后簡單做一下廣告,我們做什么事情,我們公司也是做軟件存儲,我們跟其他廠商不一樣我們用三種產(chǎn)品做到存儲,我們的文件是用S3/API、Object和EOSS,我們也有標準接口,文件提供標準接口,所以我們的接口比較全。

同時支持X86/飛騰、申威、龍芯,目前來看飛騰不錯,申威比它差一點,目前我們做的工作是從數(shù)據(jù)到網(wǎng)卡,繞開CPU,突破總帶寬,達到GB級的帶寬要求。

除了做正常管理還做了智能化運維系統(tǒng)。上面也有幾個趨勢,EB級存儲,智能存儲、國產(chǎn)化存儲、混合云存儲。

我們現(xiàn)在做的工作,存儲的數(shù)據(jù)冷了以后可以歸檔到公有云存儲,比方說亞馬遜、阿里云,比方說專注藍光存儲的華錄、紫晶,所以是一個分級和歸檔的功能。

但是我們也跟一些廠商直接把公有云存儲直接當成我們軟件定義存儲的介質(zhì)來用。所以達到混合云生態(tài),這是我們整個生態(tài)目前,我們的特點是我們文件相對于做的好一點,對象存儲做的比較有特點,塊存儲主要是在行業(yè)里國產(chǎn)化的來做。

最后跟大家分享一下這兩張圖,前段時間我們公司開一個技術(shù)會議也是這樣的,前途是光明的,道路是曲折的,SDS的發(fā)展之路是這樣的,想象很美好,但是中間有各種問題要解決。但是也沒什么問題,趨勢就是這樣的,趨勢是不可阻擋的,我們遇河搭橋,遇山開路,但我們對存儲要有敬畏之心,存儲是很嚴謹?shù)氖虑?,我就講這么多,謝謝大家!

分享到

崔歡歡

相關(guān)推薦