浪潮信息存儲(chǔ)產(chǎn)品線副總經(jīng)理劉希猛

“這些市場(chǎng)成績(jī)的取得,離不開過(guò)去這些年浪潮信息在整個(gè)存儲(chǔ)領(lǐng)域持續(xù)的研發(fā)投入和布局?!?1月29日,浪潮信息存儲(chǔ)產(chǎn)品線副總經(jīng)理劉希猛在2023中國(guó)數(shù)據(jù)與存儲(chǔ)大會(huì)上發(fā)表題為《數(shù)聚AI,智慧未來(lái)》的主題演講中分析成功因素時(shí)指出,公司在器部件、集中式、分布式等各方面持續(xù)投入、迭代演進(jìn),無(wú)論是硬件系統(tǒng)、核心軟件還是管理軟件,都可實(shí)現(xiàn)基于客戶應(yīng)用的全棧定制;基于跟業(yè)界眾多合作伙伴的聯(lián)手,實(shí)現(xiàn)了存儲(chǔ)網(wǎng)關(guān)、云存儲(chǔ)、備份存儲(chǔ)、歸檔存儲(chǔ)、數(shù)據(jù)庫(kù)一體機(jī)等各種專業(yè)存儲(chǔ)產(chǎn)品的定制開發(fā),提供了滿足客戶需求的全棧解決方案。

應(yīng)對(duì)AI時(shí)代 數(shù)據(jù)存儲(chǔ)新要求

人工智能時(shí)代,內(nèi)容的生成源于數(shù)據(jù),浪潮信息可提供經(jīng)過(guò)驗(yàn)證的全棧方案。作為國(guó)內(nèi)AI/HPC領(lǐng)域的領(lǐng)先廠商,浪潮信息致力推動(dòng)數(shù)據(jù)要素和人工智能模型結(jié)合,促進(jìn)算力基礎(chǔ)設(shè)施建設(shè)。

今年8月。浪潮信息發(fā)布了OGAI大模型智算軟件棧,從算力基礎(chǔ)設(shè)施的集群系統(tǒng)環(huán)境部署、算力調(diào)度保障到模型開發(fā)管理各領(lǐng)域降低算力基礎(chǔ)設(shè)施的建設(shè)門檻,幫助用戶加速大模型的開發(fā)效率,保障大模型的生產(chǎn)和使用。當(dāng)然,OGAI的框架對(duì)存儲(chǔ)也提出了新的要求,這些要求集中在數(shù)據(jù)的搜集、準(zhǔn)備、訓(xùn)練、推理以及歸檔五個(gè)階段。如在數(shù)據(jù)歸集和數(shù)據(jù)準(zhǔn)備階段,由于模型從過(guò)去的文本模型向圖片、視頻等多模態(tài)模型演進(jìn),數(shù)據(jù)類型越來(lái)越豐富,數(shù)據(jù)量也越來(lái)越大。

據(jù)了解,浪潮已經(jīng)支持一家訓(xùn)練數(shù)據(jù)集達(dá)到了1PB的客戶,這意味著原始數(shù)據(jù)已經(jīng)接近10PB、包含了千億數(shù)量的文件,同樣參數(shù)量的模型里采用視頻或者圖片的訓(xùn)練數(shù)據(jù)集是文本集的100倍。而訓(xùn)練和推理階段對(duì)存儲(chǔ)需求集中體現(xiàn)在性能方面。PB級(jí)的訓(xùn)練數(shù)據(jù)包含了千億數(shù)量的文件,在訓(xùn)練開始之前,要把文件目錄信息全量加載到系統(tǒng)中,同時(shí),GPU在訓(xùn)練過(guò)程中可能出現(xiàn)斷點(diǎn)、故障,需要對(duì)checkpoint數(shù)據(jù)進(jìn)行快速的保存和加載。浪潮信息存儲(chǔ)系統(tǒng)可提供超200GB/s的讀寫帶寬,超過(guò)300萬(wàn)的OPS,提升訓(xùn)練效率。之所以能滿足這樣級(jí)別的人工智能應(yīng)用需求,是因?yàn)槔顺毙畔⒋饲耙呀?jīng)將自身的分布式融合存儲(chǔ)、AI/HPC算力服務(wù)器,以及11月27日正式發(fā)布的源2.0的模型等,都在這樣的系統(tǒng)上進(jìn)行過(guò)訓(xùn)練、推理,積累了豐富的經(jīng)驗(yàn)。

分布式、集中式并重,以存儲(chǔ)平臺(tái)筑基存力底座

浪潮信息秉承一體布局,分層解耦的理念助力數(shù)據(jù)中心的建設(shè)。在數(shù)據(jù)多元化、應(yīng)用多樣化的背景下,不同的CPU、GPU或者XPU上將運(yùn)行千行百業(yè)的應(yīng)用。如何以一套架構(gòu)能夠滿足多架構(gòu)、多元數(shù)據(jù)的存儲(chǔ)要求,同時(shí)也能夠提供持久的存儲(chǔ),靈活的擴(kuò)張?劉希猛表示,分層解耦就是為應(yīng)對(duì)上述問(wèn)題而推出的解決方案。首先是云數(shù)分層。

當(dāng)前,20%的用戶數(shù)據(jù)部署的混合云的架構(gòu),未來(lái)3~5年后占比將達(dá)到60%以上。要保持用戶數(shù)據(jù)在云上云下的自由流動(dòng),就需要對(duì)數(shù)據(jù)和公有云之間進(jìn)行解耦。其次,是云存解耦,專業(yè)存儲(chǔ),除了具備自動(dòng)歸檔的能力、能夠滿足存儲(chǔ)可靠性的要求,同時(shí)也需要符合國(guó)內(nèi)安全政策監(jiān)管的要求。三是存算解耦,讓存儲(chǔ)和計(jì)算可以按比例或者按需進(jìn)行擴(kuò)展,降低部署的TCO。四是資源解耦,根據(jù)不同應(yīng)用來(lái)選擇不同資源。如針對(duì)極低資源的需求,可通過(guò)資源解耦,讓效率發(fā)揮更好??傮w而言,對(duì)數(shù)據(jù)中心分層解耦,可實(shí)現(xiàn)開放協(xié)同、精準(zhǔn)計(jì)算、智慧有數(shù)。

為此,浪潮信息提供了分布式存儲(chǔ)平臺(tái)和集中式存儲(chǔ)兩大平臺(tái),不論是在數(shù)據(jù)中心方面還是存儲(chǔ)系統(tǒng)方面,都可以提供安全可靠、經(jīng)濟(jì)、高效的數(shù)據(jù)基礎(chǔ)設(shè)施。

1.分布式存儲(chǔ)平臺(tái) 融合高效

分布式存儲(chǔ)平臺(tái)的優(yōu)勢(shì)是融合高效,實(shí)現(xiàn)核心能力做多協(xié)議的互通。浪潮信息分布式存儲(chǔ)平臺(tái)提升了部件性能、可靠性,盤控協(xié)同,對(duì)外服務(wù)的能力大大提高。無(wú)論是高性能的文件、或大容量的對(duì)象,還是大數(shù)據(jù)的原生等智能分析應(yīng)用中,未來(lái)分布式融合存儲(chǔ)都將成為數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)的關(guān)鍵支撐。

今年5月,浪潮信息發(fā)布了AS13000G7平臺(tái),可以實(shí)現(xiàn)五種協(xié)議的統(tǒng)一部署,其中非結(jié)構(gòu)化協(xié)議支持?jǐn)?shù)據(jù)互訪互通,做到真正的數(shù)據(jù)融合,同時(shí)也實(shí)現(xiàn)了閃存、磁盤、磁帶、光盤等不同存儲(chǔ)介質(zhì)之間的管理融合。

8月份,浪潮信息發(fā)布的AS15000G7,是面向AIGC全階段場(chǎng)景的高性能分布式存儲(chǔ),可以更好地滿足用戶在AI場(chǎng)景下對(duì)于性能、容量等方面的苛刻要求。兩款分布式新品的發(fā)布,標(biāo)志著浪潮信息單節(jié)點(diǎn)可提供上百GB的帶寬,實(shí)現(xiàn)上萬(wàn)節(jié)點(diǎn)EB級(jí)的容量擴(kuò)展,真正滿足未來(lái)非結(jié)構(gòu)化數(shù)據(jù)爆發(fā)的增長(zhǎng)需求。除了這兩個(gè)產(chǎn)品的發(fā)布,7月份浪潮信息也發(fā)布了面向生成式AI的存儲(chǔ)解決方案,通過(guò)全閃節(jié)點(diǎn)滿足訓(xùn)練、推理要求,提出全閃熱數(shù)據(jù)和溫冷數(shù)據(jù)之間在未來(lái)的算力基礎(chǔ)設(shè)施中做好配比。11月30日,由中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院、存儲(chǔ)產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟、華中科技大學(xué)、浪潮信息等23家單位共同編寫的《分布式融合存儲(chǔ)研究報(bào)告》重磅發(fā)布,意味著越來(lái)越多的應(yīng)用場(chǎng)景需要融合存儲(chǔ)作為數(shù)據(jù)底座來(lái)支撐,融合存儲(chǔ)將迎來(lái)重大發(fā)展機(jī)遇得到了產(chǎn)業(yè)界的廣泛認(rèn)可。

2.集中式存儲(chǔ)平臺(tái) 可靠高效

集中式存儲(chǔ)針對(duì)客戶追求穩(wěn)定可靠、極致性能以滿足自身關(guān)鍵的業(yè)務(wù)需求。浪潮信息的集中式存儲(chǔ)解決方案主要包含高端HF18000系列、中端HF6000系列、HF5000系列以及低端的AS2000系列。

在可靠性方面,浪潮信息從防護(hù)、預(yù)測(cè)、隔離三個(gè)層面進(jìn)行了全面加強(qiáng)。例如,支撐某銀行超1000套部署,支撐兩地三中心的業(yè)務(wù)。

在性能方面,浪潮信息不斷打磨以iTurbo為核心的加速引擎,通過(guò)IO路徑的調(diào)度、資源的調(diào)度、數(shù)據(jù)的組織包括端到端協(xié)議的打通持續(xù)提升性能。浪潮信息集中式存儲(chǔ)解決方案下一代高端多控解決方案即將上市。新產(chǎn)品采用業(yè)界主流的雙控冗余架構(gòu),可達(dá)到6個(gè)9的領(lǐng)先水平,支持靈活擴(kuò)展,單框或者單機(jī)歸集的故障整個(gè)業(yè)務(wù)仍然在線,滿足高可用的要求。

釋放數(shù)據(jù)新潛能,服務(wù)數(shù)字化轉(zhuǎn)型

浪潮信息已經(jīng)具備了AI大模型實(shí)踐能力,可以幫助客戶簡(jiǎn)化部署,降低上線門檻。

“面向未來(lái),浪潮信息將基于標(biāo)準(zhǔn)產(chǎn)品,跟用戶、服務(wù)伙伴、上游技術(shù)以及科研院所共建存儲(chǔ)場(chǎng)景共同體,持續(xù)合作創(chuàng)新,探討滿足未來(lái)應(yīng)用需求的解決方案?!眲⑾C捅硎荆磥?lái)浪潮信息將憑借標(biāo)準(zhǔn)的產(chǎn)品和源于JDM的場(chǎng)景化定制能力,更好地服務(wù)未來(lái)的數(shù)字化轉(zhuǎn)型,為數(shù)字經(jīng)濟(jì)發(fā)展貢獻(xiàn)力量。

分享到

xiesc

相關(guān)推薦