趙帥:大家都知道現(xiàn)在在整個大的社會環(huán)境下,各行各業(yè)都在推進著數(shù)字化轉(zhuǎn)型,在數(shù)字化轉(zhuǎn)型的過程當中,客戶也好還是廠商也好,會遇到一系列的問題,比如說精細化的問題,我們追求數(shù)據(jù)的時候,越來越多的去追求數(shù)據(jù)的在空間和時間上的精細化,精細化問題出現(xiàn)以后,對于業(yè)務(wù)訪問層面,對后端存儲層面都提出來不小的壓力。在有即時性問題,有一些交易需要實時交易,需要我們有很低的延遲。再一個整合化問題,我相信在座各位如果要是客戶的話大家的機房當中一定有各種各樣的業(yè)務(wù),而且有不同廠商的設(shè)備,不同廠商設(shè)備之間如何統(tǒng)一管理,業(yè)務(wù)和業(yè)務(wù)之間能不能打通數(shù)據(jù)能否自由流動這是整合化帶來的問題。再有就是不確定性,有一些熱點話題,熱點話題一旦觸發(fā)之后,對我們最終用戶來說產(chǎn)生一個無法預(yù)測式的訪問,你的IT系統(tǒng)能不能承接突發(fā)大流量訪問,這是不確定性帶來的挑戰(zhàn)。新數(shù)據(jù)時代下我們挑戰(zhàn)和機會是并存的,IDC最新預(yù)測2025中國會成為全球最大的數(shù)據(jù)圈,我們未來還是要更多關(guān)心數(shù)據(jù)的存儲與管理相關(guān)的話題。

浪潮在分布式存儲這一塊提出了一個概念,叫分布式存儲平臺,為什么叫平臺,是說我們希望通過一個產(chǎn)品一個平臺來解決用戶的很多的問題,甚至說未來我們目標是為了解決整個數(shù)據(jù)中心的問題,我們叫分布式存儲平臺,我們分布式存儲平臺在今年三月份發(fā)布的,有一個概念5+X,分為兩個層面,一個硬件5+X,一個軟件的5+X,硬件的5+X我們硬件基于浪潮強大的服務(wù)器產(chǎn)品線支持五種不同類型的硬件服務(wù)器,包括機架式機柜式多節(jié)點異構(gòu)式種種類型服務(wù)器和分布式存儲軟件進行適配,每種服務(wù)器配置非常靈活,根據(jù)業(yè)務(wù)需求業(yè)務(wù)特點配置不同的CPU,IO卡以及GPU卡,所以這是硬件層面的5+X,為什么這么注重硬件,我們相信做一款產(chǎn)品的時候,無論任何領(lǐng)域的產(chǎn)品都有一句話,硬件是基礎(chǔ)軟件是靈魂,我們在業(yè)內(nèi)和其他公司有硬件級的合作,大家也都聽說過。

我們說一下浪潮分布式存儲軟件,AS13000G5前身,在2013年上市的時候,提出了多合一的概念,我們在一套存儲系統(tǒng)當中可以同時對外提供三種不同的服務(wù),我們從三合一,轉(zhuǎn)化為了四合一,有了大數(shù)據(jù)的對接,可以更好的替代ASDFS,幾年發(fā)布的AS13000G5,追加了數(shù)據(jù)庫訪問協(xié)議,做了一個領(lǐng)先的預(yù)測,我們做了一個預(yù)判,我們認為一定有很多超大規(guī)模的數(shù)據(jù)庫,超大規(guī)模數(shù)據(jù)庫的特點,數(shù)據(jù)量特別大,對于系統(tǒng)的訪問延遲要求并不是很高,這些數(shù)據(jù)庫可以很好落到分布式存儲上,這是我們預(yù)測。數(shù)據(jù)庫協(xié)議也已經(jīng)出來了,實際落地的案例雖然并不是很多。我們軟件層面五種業(yè)務(wù),我們在業(yè)界和第三方公司,做文件云做加密的,做留值存的,我們做了深度集成,我們在AS13000容器和虛擬化技術(shù)分離出來一部分資源,把第三方軟件打包在AS13000統(tǒng)一給用戶,除了采購AS13000以外,不用采購其他設(shè)備,大大減少用戶整個TCU,為用戶節(jié)省了成本。我們這個產(chǎn)品現(xiàn)在經(jīng)過這么多年的發(fā)展,我們發(fā)現(xiàn)它在分布式存儲所應(yīng)對的場景當中我們進行了一個分類,我們定義是八大場景,大家可以一起看一下,包括視頻監(jiān)控高性能計算、云、大數(shù)據(jù)、AI、電子影像和傳統(tǒng)應(yīng)用。視頻監(jiān)控交通卡口的圖片,這種業(yè)務(wù)下我們會和很多的安防廠商一樣給最終用戶提供一個存儲平臺,是一樣的。然后像在廣電媒資領(lǐng)域,我們和廣電有深厚的合作,后面還有案例。在電子影像這一塊有幾個小的分支,一個大家平時接觸金融雙錄系統(tǒng),錄音錄像最終羅布到分布式存儲里面,因為數(shù)據(jù)文件的數(shù)量非常大的,再有大家去醫(yī)院的時候,醫(yī)院的判別系統(tǒng)。其他的像云計算大數(shù)據(jù)和人工智能,炒的比較熱,而且分布式存儲一直以來有一個概念為云而生的存儲,可以很好的對接云下邊的各種協(xié)議的接口,這個是我們現(xiàn)在AS13000G5最新版本的情況。

展開的說一下我們硬件現(xiàn)在目前為止一些特點,昨天的時候我們也說了借著本次峰會發(fā)布了幾個硬件的幾個型號,這里給大家分享一些干貨,我們有一個型號是4U60,特點是它的空間相對來說比較短,設(shè)備比較短,可以放在一米深的機柜里,適配現(xiàn)在市面上99%的機柜,可以裝到任何數(shù)據(jù)中心里面,之所以打造這個型號是互聯(lián)網(wǎng)廠商提出的硬件,因為我們浪潮一直認為產(chǎn)品是以用戶的業(yè)務(wù)為導(dǎo)向進行研發(fā)設(shè)計。再有一個機型更高密,可以做到4U72盤位,這樣的密度下我們配合14TB大容量硬盤,可以做到一個節(jié)點可以達到一個PB的空間。這個是一個高密的機型,還支持非常靈活的配置,可以把一個4U的節(jié)點內(nèi)部變成兩個小的36的節(jié)點,也可以變成四個小的節(jié)點和八個小的節(jié)點,當我們把這個設(shè)備交付給客戶的時候,一個節(jié)點就是一套分布式存儲,這個是我們一體機相關(guān)的解決方案。再有一個大家可能也或多或少聽過我們浪潮集團旗下有浪潮商用公司,我們也可以把我們分布式存儲軟件結(jié)合到一起,高組頻高線速,我們單結(jié)點FPS節(jié)點性能加強,我們經(jīng)過客戶的對比。這個我們節(jié)點的情況,再有我們之前浪潮內(nèi)部有一款設(shè)備密度比較高的,一個機柜內(nèi)部可以部署四十個節(jié)點。通常情況下這個節(jié)點比較受到互聯(lián)網(wǎng)用戶青睞,浪潮分布式存儲硬件的情況。

接下來說一說整個分布式存儲的特點,大家都知道分布式存儲用戶在采購的時候,提到一個空間利用率的問題,有一個安全水位的概念,安全水位不是我們提1024的轉(zhuǎn)換,也不是說糾刪碼和副本開銷之后剩余多少,所有軟硬件之后,系統(tǒng)格式化映射目錄的時候,到底能不能把目錄存滿,和大家說一件事,所有的廠商都沒有辦法把目錄存滿,這里面涉及到分布式存儲底層架構(gòu)的問題,要做節(jié)點和節(jié)點之間數(shù)據(jù)流動和IO的均衡,所以說我們各個廠商推薦的安全水位都不太一樣。我們在AS13000G5的版本,把之前90%的安全水位通過多機制和哈希計算系數(shù)提高到95%空間利用率,增長5%的點給用戶帶來的效益,用戶一次系統(tǒng)采購當中可以少買幾個節(jié)點,少買幾十塊硬盤,是一個比較有經(jīng)濟反饋的優(yōu)點,除此之外我們還有千億級文件的支持,很多客戶項目當中,很多時候客戶一天落到系統(tǒng)當中需要落一億個文件,文件保存周期雖然不長,但是進行了半個月或者是說一個月保存當中,就需要整個分布式存儲,需要支持千億級文件,我們在這一塊經(jīng)過了國家級第三方測試機構(gòu)的驗證,支持千億級的文件。我們大家都知道像分布式存儲更多的是去對接前端的云和前端的虛擬化,最近一兩年做了一件事,進行了全面的對接,取得了Openstack和VMmare全套的構(gòu)建,不需要擔心系統(tǒng)的兼容性的問題,還有一點特別靈活的在我們AS13000G5這一塊我們支持第二次的開發(fā),我們可以給用戶開放一些源代碼,和用戶一起適配,調(diào)試優(yōu)化我們的存儲,很多高性能場景當中取得了非常好的效果,可能不經(jīng)過優(yōu)化的情況下,我們一個存儲的節(jié)點可以跑出1.5到1.8的性能,優(yōu)化之后單節(jié)點可以跑出2.5大G的性能。除此之外像我們上一代的時候,AS13000產(chǎn)品的時候我們分布式存儲的規(guī)模,一個集群就是5120個節(jié)點,這一代也沒有變,我們這一代變化的是說每個節(jié)點最大容量變了,我們現(xiàn)在支持EB級的容量?,F(xiàn)在有越來越多的客戶,昨天在展區(qū)交流的時候,也和我反饋了一下,我們發(fā)現(xiàn)我們有很多客戶初始化配置的時候都是五個PB或者十個PB數(shù)據(jù)量起,確實是說我們遇到了數(shù)據(jù)爆炸式增長的問題,相信未來我們會越來越多用分布式存儲整合我們數(shù)據(jù)中心當中各種各樣不同的數(shù)據(jù),整合我們數(shù)據(jù)中心當中各種各樣的傳統(tǒng)應(yīng)用以及智能應(yīng)用。

我們再重點看一些我們比較有特色的亮點,前面我們提到了我們有一個概念叫多合一還有5+X,大家關(guān)注一下我們其他友商,現(xiàn)在友商也都在做。就是說無論大家去做多個系統(tǒng)的統(tǒng)一管理還是說做一個單一系統(tǒng)的多種服務(wù),這里邊可能未來會有一個繞不開的話題,就是協(xié)議的自由轉(zhuǎn)化,我現(xiàn)在已經(jīng)接觸到了前端有一些客戶,他給我們反饋的一個要求就是說我現(xiàn)在在本次采購,這一次IT系統(tǒng)建設(shè)的時候,我不知道我應(yīng)該采購什么樣的分布式存儲。我不知道我買分布式文件還是買分布式對象,未來有可能上云,上云可能會對接S3,我現(xiàn)在有可能業(yè)務(wù)偏向于文件,這個怎么辦。因為我們這里邊支持有一種技術(shù)叫多元零拷貝的技術(shù),這種技術(shù)簡單的直白翻譯過來相當于就是說支持協(xié)議的自由轉(zhuǎn)換。怎么說呢?就是說用戶在最開始部署的時候可以部署分布式文件,可以存了很多數(shù)個TB的文件級的數(shù)據(jù)。落到存儲上,后來有一天你說數(shù)據(jù)不想變,不想遷移修改,你想把數(shù)據(jù)轉(zhuǎn)變成對象的數(shù)據(jù),對外提供對象的服務(wù),我們可不可以做,這里邊可以說不需要經(jīng)過任何的其他的產(chǎn)品的幫助,不需要經(jīng)過底層的數(shù)據(jù)遷移拷貝鏡像,可以把這個數(shù)據(jù)從文件數(shù)據(jù)轉(zhuǎn)化為對象數(shù)據(jù),為什么支持這樣做,我們多合一最開始設(shè)計的時候,就是協(xié)議的自由轉(zhuǎn)換來支持的多合一。這個設(shè)計的思路從2013年我們發(fā)布AS13000就沒有變過,六年的時間我們軟件站在原有設(shè)計思路上沒有轉(zhuǎn)換,沒有切換過軟件站。

很多用戶完成了一個數(shù)據(jù)中心的生命周期管理的時候,往往考慮下一步在異地建第二個數(shù)據(jù)中心,用戶可能會有一個三到五年的規(guī)劃,涉及到了雙核數(shù)據(jù)中心以及兩地三中心,很多金融行業(yè)都有實際落地。大家平時關(guān)注IDC分析報告,我們知道分布式存儲圈子里面,文件、塊和對象三種數(shù)據(jù)服務(wù)發(fā)展最快是對象,未來增長率最高是對象。我們這里相當于支持了對象的多數(shù)據(jù)中心的容災(zāi),多數(shù)據(jù)中心容災(zāi)體驗就和我們的傳統(tǒng)的集中式的存儲是一樣的,比如說我們可以基于存儲做雙活,基于存儲做兩地三中心,采用的技術(shù)架構(gòu)也差不多,這里邊有一點就是第三條我們支持智能WAN加速是什么樣技術(shù),我們?nèi)绻诙鄶?shù)據(jù)中心之間采用異部數(shù)據(jù)復(fù)制,我們可以降低30%到50%鏈路帶寬,在容災(zāi)解決方案的建設(shè)過程當中,應(yīng)該有一半左右的預(yù)算被鏈路開銷掉了,如果開銷租用的情況下,可以從原來的100GB帶寬,縮減到50GB帶寬,對在座用戶來說也是非常大的一筆節(jié)省,是智能WAN加速帶來的體驗。我們分布式存儲在未來可以幫助越來越多的客戶去構(gòu)建容災(zāi)的系統(tǒng)。

    最近大概也就是19年上半年到現(xiàn)在下半年這么一年時間,我發(fā)現(xiàn)在互聯(lián)網(wǎng)以及金融領(lǐng)域,越來越多的客戶在考慮用對象存儲去做雙活去做兩地三中心。

    我們提到分布式存儲,大家都知道分布式存儲有一個概念就是它是要存取海量數(shù)據(jù)的,所以要求分布式存儲要能夠不斷的去擴展自己的規(guī)模,隨著時間的推移我們會發(fā)現(xiàn)分布式存儲可能節(jié)點數(shù)量會達到一百多個節(jié)點,會有好幾千塊硬盤需要用戶不停的去管理去更換去運維。有沒有一個非常智能的一套軟件能夠幫助用戶的運維人員減輕管理和運維的壓力,是有的。我們浪潮有一款智能管理軟件可以管理浪潮全系列的存儲,包括集中式的混散全散以及分布式存儲,這款軟件部署上去之后,對我們環(huán)境內(nèi)部所有的分布式存儲節(jié)點進行智能化存儲,當你調(diào)節(jié)所有節(jié)點配置的時候,你只需要在同一管理界面進行簡單兩到三步操作就可以批量化配置。像故障監(jiān)控包括性能預(yù)測,可能各個廠商也都提到了。這里邊說一個重點我們深度優(yōu)化的功能,硬盤的故障預(yù)測,是說我們過去三年里面我們從四廠商收集了五十萬塊硬盤的日志,拿回到我們數(shù)據(jù)中心,實驗的環(huán)境下通過機器學(xué)習(xí)和AI分析之后,發(fā)現(xiàn)市場上常見的硬盤故障可以被預(yù)測的,比如說希捷,像英特爾的,目前故障預(yù)測準確率達到了兩周時間周期內(nèi)85%的精度。也就是說在我們的統(tǒng)一管理軟件界面下,可以給用戶一個感知一個報警,您的分布式存儲上面三千塊硬盤,未來兩周之內(nèi)會壞的是幾塊硬盤。目前我們整個這套智能管理系統(tǒng)包括我們的硬盤故障預(yù)測這個功能是現(xiàn)實促銷的,在2019年以及2020年上半年都不會收費跟隨著AS13000G5一起銷售。這是現(xiàn)在的一個現(xiàn)狀。

    接下來給大家說一下國際的權(quán)威機構(gòu)Gartner如何評價我們浪潮分布式存儲,大家知道最著名有一個分析報告叫魔力象限,我們在分布式存儲2018年時候參評,加上2019年連續(xù)兩年進入到分布存儲魔力象限,分布式存儲魔力象限大家仔細看一下,國內(nèi)的廠商只有兩家,我們浪潮是其中之一,還在不斷完善我們的產(chǎn)品。除了魔力象限以外,還有另外一個分析報告,叫用戶的體驗報告。這個是說Gartner很嚴謹調(diào)查問卷調(diào)查各個廠商最終用戶,最終用戶對于廠商的產(chǎn)品使用一年以上的時間,我的感受是什么樣的,是不是能夠滿足我的需求,是不是滿足未來得規(guī)劃。調(diào)研的對象都是Gartner最終精心挑選的用戶,最終訪談的問卷會發(fā)到最終用戶CTU和手機架構(gòu)師里面,由CTU和手機架構(gòu)師評價,你是否愿意把廠商產(chǎn)品和解決方案推薦給其他應(yīng)用商。浪潮取得了不錯的成績。還有一個報告,關(guān)鍵能力的報告,在魔力象限的基礎(chǔ)上去除了各個廠商產(chǎn)品營銷方面的一些指標和得分的情況,單純看產(chǎn)品力,Gartner定義有八個維度,包括容量性能、管理、性價比、彈性等等八項能力,對于八項能力,定義的分布式存儲五大領(lǐng)域進行了不同的打分,把各個廠商得分的情況進行了晾曬。浪潮在Gartner取得了不錯的成績,一個第一兩個第二兩個第三,我們歸檔和備份最快的。去年的時候也有排名,沒有像今年這么靠前,2019年我們做了很多動作,歸檔備份軟件對接這個層面去做了很多動作。我們現(xiàn)在可以對接康福相關(guān)國內(nèi)知名的備份軟件。除此之外大家都知道,云這個場景浪潮有自己的云也可以和第三方的云進行很好對接,這個方面我們也取得了比較好的成績。

    接下來給在座客戶包括我們的友商分享一下我們在最近的一兩年實際落地的一些典型案例,我們大家都知道,現(xiàn)在有越來越多的分布式存儲用戶一旦采購了之后,就是在原有的分布式存儲上進行不斷的擴容。因為分布式存儲這個容量增速比集中式存儲大的,里邊存的大多數(shù)存的非結(jié)構(gòu)化數(shù)據(jù),經(jīng)過后臺數(shù)據(jù)分析發(fā)現(xiàn),確實有比較不錯的成績。重復(fù)購買率比較高,41%,也就是說每賣出去一百套,最終會有41個客戶會進行重復(fù)的采購和擴容。這個是我們現(xiàn)在取得的一個比較好的成績,再有我們前面提到了分布式存儲和云對接,大家都知道云無論是像公有云還是私有云這樣的分類,還是說你去按照警務(wù)云企業(yè)云通信云等等這樣分類,都可以用分布式存儲承載用戶前端各種應(yīng)用。我們的分布式存儲經(jīng)過這么多年的努力,全國范圍內(nèi)實際云相關(guān)的項目落地也有很多,這里邊包括了北京城市副中心,還有濟南市的政務(wù)云山東省的政務(wù)云,廣西的政務(wù)云,內(nèi)蒙的政務(wù)云相關(guān)的規(guī)劃以及項目的最終落地都和我們分布式存儲有很大的關(guān)系。在警務(wù)云方面我們和吉林省的警務(wù)云以及山西的警務(wù)云都有很好的對接和最終落地。給大家分享一下在昨天論壇的時候,我們也提到了,我們在國內(nèi)的某個大的運營商當中,這個運營商相當于率先的去進行了一個IT架構(gòu)的轉(zhuǎn)型,他認為很多的業(yè)務(wù)和數(shù)據(jù)是應(yīng)該不處在分布式存儲上的,所以說他在2017年開始,一直到現(xiàn)在2019年,三年左右的時間總共發(fā)布了三次集采的招標的入圍這種活動。經(jīng)過了好幾十項深度的測試,浪潮和友商一起參加三次的集采,浪潮三次全部入圍,從側(cè)面也證明了我們產(chǎn)品性能以及穩(wěn)定性可以達到用戶比較高的一個要求。

    后面是有幾個典型的案例,一個是在我們的某個資源衛(wèi)星中心,這個資源衛(wèi)星中心有幾顆地面衛(wèi)星,覆蓋的面積是250萬平方公里,每天會產(chǎn)生三萬張圖片,三萬張圖片都需要快速落到后端的存儲里,因為衛(wèi)星飛過去的地方不會再采集數(shù)據(jù)的,只有在第二次飛過來的時候才可以,所以說這個對于后端的存儲來說要求有一個非常好的一個穩(wěn)定性,要求有一個非常大的恒定的帶寬。用戶在第一次系統(tǒng)建設(shè)的時候給我們各個廠商提出的要求就是說分布式存儲要能夠提供一個70個PB統(tǒng)一存儲資源池,對外提供恒定40G的帶寬,我們項目初期建設(shè)的時候,就給用戶提供了35個節(jié)點,我們國內(nèi)落地的單一系統(tǒng)最大的分布式存儲集群。隨著那一年分布式存儲落地之后,用戶感覺是不錯的,緊接著用戶進行了第二次擴容第三次擴容,分布式存儲集群已經(jīng)擴展到三百多節(jié)點,不斷的擴,這個項目還有一個重大意義,我們實現(xiàn)了衛(wèi)星領(lǐng)域第一次天上地下自主可控,這么多年一直提自主可控,因為衛(wèi)星中國人早就掌握了制造的技術(shù),地面的存儲系統(tǒng)一直以來用的國外的友商,這個系統(tǒng)第一次替代掉了國外的友商。經(jīng)過實際的性能測試發(fā)現(xiàn)效果也比較不錯,而且在項目當中因為節(jié)點的數(shù)量比較多,用戶希望有一種節(jié)能的技術(shù),幫助降低整體的TCU,這里邊有一個硬盤節(jié)能技術(shù),硬盤低訪問不訪問的時候,降低硬盤的轉(zhuǎn)速,節(jié)省整個系統(tǒng)的能耗。 

    接下來的案例在智能交通領(lǐng)域內(nèi),在某個市,這個市有一個三環(huán)路,有五六千個攝像頭,五六千個攝像頭對道路的狀況進行管理包括主路和輔路,管理路上的車輛行人,以及相關(guān)的違章種種相關(guān)的事故,每一天五六千攝像頭產(chǎn)生一億文件,90TB視頻,一億文件會帶來四億次文件的檢索,都是對后端檢索提出的性能,多輪測試當中,我們浪潮分布式存儲,最終給用戶提供108個節(jié)點,很好承載了用戶的云數(shù)字這套大的系統(tǒng),這套大的系統(tǒng)上線之后,人工的行為糾察,人工的糾察效率提高了80%,包括一些關(guān)鍵的交通運管系統(tǒng),都得到了很大的提升。

    這個里邊案例是我們在今年和清華大學(xué)配合做腦科學(xué)研究的案例,清華大學(xué)為了研究小白鼠大腦,搭建了28臺高速相機,每秒鐘拍攝三十張高清圖片,每張圖片是1200萬象素24兆B,要求20GB恒定帶寬,每次作業(yè)需要24小時不間斷出圖,對系統(tǒng)的性能以及穩(wěn)定性都有很大的挑戰(zhàn)。這一套系統(tǒng)當中我們最終給清華大學(xué)第一階段做了50個節(jié)點,整個分布式存儲給上層提供了45GB的帶寬很好完成了高性能的項目。

??? 最后一個案例是我們在廣電媒資領(lǐng)域,我們和廣電國網(wǎng)合作的案例,我們的客戶除了BOSS系統(tǒng)以外,其他所有的應(yīng)用都部署到了AS13000上,包括非編類業(yè)務(wù),我們給客戶創(chuàng)造了三種不同容量層,有大容量硬盤層以及SSD硬盤層,承接不同的應(yīng)用,而且這個用戶有三個數(shù)據(jù)中心,需要配合我們的遠程數(shù)據(jù)復(fù)制的功能搭建兩地三中心,這樣的情況下給客戶提供140多個節(jié)點分布式存儲集群,完成了項目部署。用戶業(yè)務(wù)上線之后也是他給我們最終反饋的結(jié)果,IT的這種架構(gòu)轉(zhuǎn)化比較成功的,采用煙囪式架構(gòu),也是完成了一次架構(gòu)的轉(zhuǎn)換。 ???

以上的這些就是我想給大家分享的內(nèi)容,這里想給大家說什么,浪潮分布式存儲還是希望大家能夠過多關(guān)注一下,因為每一年我們的軟件和硬件都有非常大的變化。我們也希望我們的變化能夠給在座的各位帶來數(shù)據(jù)中心的建設(shè)的一個幫助。希望能夠幫助大家去很好的完成未來的數(shù)字化轉(zhuǎn)型。

分享到

zhangnn

相關(guān)推薦