存儲在線總編宋家雨(左一)與IBM副總裁、大中華區(qū)存儲及中國區(qū)Power業(yè)務(wù)總經(jīng)理候淼(右一)新聞會客廳訪談
宋家雨:最近IBM存儲在品牌方面有些調(diào)整,把原來IBM Spectrum調(diào)整為IBM Storage,這個動作的背后是怎樣的一個戰(zhàn)略布局?
侯淼:IBM存儲剛剛調(diào)整了整個產(chǎn)品線命名,從IBM Spectrum調(diào)整為IBM Storage,精簡了。IBM存儲產(chǎn)品線比以前更加專注了,通過命名的改變,希望能夠使品牌更加突出,突出IBM+Storage。因?yàn)槲覀兛吹剑瑪?shù)據(jù)增長變得越來越快,數(shù)據(jù)量越來越大,IBM Storage業(yè)務(wù)會成為重要的業(yè)務(wù)發(fā)展領(lǐng)域。
IBM存儲品牌戰(zhàn)略調(diào)整,跟IBM公司整體戰(zhàn)略是分不開的。
IBM在2019年收購了Red Hat,今年我們剛剛發(fā)布了watsonx, IBM整個公司戰(zhàn)略圍繞兩大主線來展開,一個代表混合云,一個代表人工智能。
混合云主要是圍繞紅帽O(jiān)penShift底座,為客戶打造一個端到端的混合云策略,上可以支持微服務(wù),對下可以支持容器,這樣把客戶的硬件、軟件資源統(tǒng)一結(jié)合起來,這是IBM很重要的策略。
針對人工智能,特別是今年7月份IBM剛剛推出的watsonx,它分為watsonx.ai、watsonx.data和watsonx.governance。其中,watsonx.ai主要是作為AI開發(fā)平臺,為客戶生成模型提供相關(guān)的底座和支持,包括模型的訓(xùn)練、驗(yàn)證、調(diào)優(yōu)和部署。watsonx.data是湖倉一體的結(jié)構(gòu),跟存儲也是緊密相關(guān)的。watsonx.governance為整個人工智能應(yīng)用提供監(jiān)管,包括管理的平臺。這三個產(chǎn)品會支撐IBM戰(zhàn)略的另外一個主線,也就是人工智能。
IBM現(xiàn)在有基礎(chǔ)架構(gòu)和軟件業(yè)務(wù),還有企業(yè)咨詢服務(wù),所有這些部門的產(chǎn)品和解決方案都是圍繞以上兩個主線來展開,我們會比以前更加專注。圍繞這個主線,IBM對存儲整個產(chǎn)品線進(jìn)行了調(diào)整,以前我們是以盤(閃盤)、帶(磁帶)、閃存這樣的語言進(jìn)行描述,未來我們的產(chǎn)品線會圍繞三塊: 第一塊是人工智能存儲;第二塊是混合云存儲;第三塊是數(shù)據(jù)保護(hù)存儲。我們實(shí)際上把硬件、軟件結(jié)合,首先會有一個軟件的平臺和引擎作為關(guān)鍵的組成部分;然后是相關(guān)硬件,包括盤和帶,為客戶提供針對AI場景、混合云場景以及數(shù)據(jù)保護(hù)場景的解決方案。
宋家雨:您能否結(jié)合這兩個場景,介紹一下IBM存儲的一些獨(dú)特思考?
侯淼:如果把數(shù)據(jù)源的數(shù)據(jù)分成兩類,一類是結(jié)構(gòu)化的,一類是非結(jié)構(gòu)化的,實(shí)際上你會發(fā)現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)增長是非常快的,這里包括像文件、對象、聲音、圖像等數(shù)據(jù),對此,我們投入技術(shù)、研發(fā)力量幫助客戶去尋找這種這種非結(jié)構(gòu)化數(shù)據(jù)的價(jià)值,提供相應(yīng)的管理方案。
人工智能處理的數(shù)據(jù)大部分(80%-90%)都是非結(jié)構(gòu)化數(shù)據(jù),針對這些數(shù)據(jù)的管理和應(yīng)用,IBM存儲的一個主要解決方案就是IBM Storage Scale的產(chǎn)品家族,來優(yōu)化和簡化數(shù)據(jù)的訪問和存儲。
還有一個角度是幫助客戶去實(shí)現(xiàn)數(shù)據(jù)的云化,這里最核心的就是容器化。所以我們的混合云存儲,特別是我們推出的閃存產(chǎn)品,針對容器化去支持紅帽O(jiān)penShift混合云平臺,滿足客戶在混合云和私有云構(gòu)建。
現(xiàn)在混合云應(yīng)用有一個比較大的變化,就是很多客戶開始逐漸將應(yīng)用容器化,對于硬件來講,容器化的好處在于能夠大幅度地去提高硬件的利用率,因?yàn)橐郧耙粋€機(jī)器支持幾百個虛機(jī)就可以了,但是容器化能支持上千規(guī)模,使利用率能夠大幅度提高,減少客戶在硬件上的購買成本,這是它的重要價(jià)值。
隨著軟件應(yīng)用變得更加敏捷,部署也能夠越來越快,不需要花很多周期和時(shí)間。圍繞這樣一個改變,很多客戶使用容器化軟件去實(shí)現(xiàn)生產(chǎn)系統(tǒng)。對于生產(chǎn)系統(tǒng),不可避免會談到備份、容災(zāi),包括恢復(fù)的功能,而這也是IBM最強(qiáng)的部分。
通過我們的軟件跟OpenShift相結(jié)合,能夠支持客戶實(shí)現(xiàn)生產(chǎn)系統(tǒng)的容器化,然后做容災(zāi)備份一整套解決方案。換句話來講,我們是為企業(yè)客戶在做混合云時(shí),提供端到端的架構(gòu),使它能夠不單單能滿足容器化帶來的好處,而且也能滿足生產(chǎn)系統(tǒng)所具有的可靠性、穩(wěn)定性和安全性的要求。
宋家雨:圍繞watsonx,在AIGC領(lǐng)域,IBM存儲有哪些獨(dú)特的優(yōu)勢和思考,能不能分享一下?
侯淼:實(shí)際上人工智能這幾年是一個高潮,GPU 被大量在 AI中使用。IBM在人工智能方面,倡導(dǎo)從+AI到AI+,就是以前是在原有系統(tǒng)上加一些人工智能的功能,今天要做的是用人工智能去替代原有的系統(tǒng),使它更加自動化。
我們有一個基本的框架,這個框架就是數(shù)據(jù)、模型、算力和存力。針對基礎(chǔ)構(gòu)架去支持大模型,通過生成式的大模型,支持?jǐn)?shù)據(jù)的分析和提煉,其中基礎(chǔ)架構(gòu)是最主要的平臺。它有兩個關(guān)鍵支柱,一個是算力,一個是存力,我覺得這個說法可能只在中國有,因?yàn)樵趪舛冀凶鯿omputing、Storage,中國語言則體現(xiàn)出一個“力”。
存力包括兩部分:一是要有一個存儲平臺,是能夠進(jìn)行數(shù)據(jù)的存??;二是“力”,代表一種能力,這個能力能夠支持人工智能的模型和算力能力的發(fā)揮,所以在人工智能存力里,對存儲有不一樣的要求。一方面是要求高性能,因?yàn)楝F(xiàn)在GPU會越來越快,而且GPU對存儲的要求是吞吐量越來越大,想要數(shù)據(jù)的話能及時(shí)提供 I/O。GPU資源越來越貴,存儲的價(jià)值就在于怎么能夠減少GPU的等待時(shí)間,減少GPU等待帶來的浪費(fèi),這很關(guān)鍵,所以人工智能存儲第一個特點(diǎn)就是要高性能。為了做到高性能,這類存儲要支持英偉達(dá)的GPU直連,通過支持DGS協(xié)議,使企業(yè)的數(shù)據(jù)和性能能夠提升一倍以上,這是第一個高性能。
第二個就能夠進(jìn)行線性水平擴(kuò)展,你很難能夠去預(yù)測未來的增長,所以所有這類系統(tǒng)都是分布式的。要求存儲也要是分布式,能夠線性擴(kuò)展,但是分布式跟線性擴(kuò)展是兩個概念。分布式是能夠擴(kuò)展到上百、上千個節(jié)點(diǎn),但是當(dāng)你擴(kuò)展到上百、上千個節(jié)點(diǎn)時(shí),它的性能是否能跟得上?IBM Storage Scale軟件能解決分布式存儲擴(kuò)展時(shí)的性能問題,實(shí)現(xiàn)線性水平擴(kuò)展。
安全性、備份、可靠性則是第三個需求。我覺得這三個結(jié)合起來,這個存力就能夠支持企業(yè)在人工智能領(lǐng)域所需要的基礎(chǔ)存儲要求了。
宋家雨:您能不能具體介紹一下IBM存儲和英偉達(dá)算力解決方案的合作?
侯淼: IBM跟英偉達(dá)公司的合作由來已久,就在近幾年,2018年IBM和英偉達(dá)一起聯(lián)合支持美國能源部的項(xiàng)目,當(dāng)時(shí)是用IBM的Power CPU,采用英偉達(dá)NVLink總線進(jìn)行互聯(lián),英偉達(dá)選中了Tesla GPU加IBM Storage Scale System(下文簡稱為 SSS,原ESS)產(chǎn)品,這三款產(chǎn)品結(jié)合在一起。因?yàn)槿斯ぶ悄苡?jì)算跟高性能計(jì)算是類似,都需要很強(qiáng)的算法,無論是浮點(diǎn)(運(yùn)算)還是整型(運(yùn)算)。英偉達(dá)在它的一些方案,包括DGX SuperPOD都是采用IBM的SSS產(chǎn)品作為存儲的存力。
IBM現(xiàn)在所發(fā)布的SSS產(chǎn)品也拿到了英偉達(dá)的官方認(rèn)證,支持DGX SuperPOD的GPU直連,而且有完整的測試,從兩個節(jié)點(diǎn),到4~8個節(jié)點(diǎn),我們推薦不同類型的產(chǎn)品組合。IBM單模塊能夠去支持125 GB/s的帶寬傳輸能力,這是現(xiàn)在業(yè)內(nèi)最快的。同時(shí)我們能夠?qū)崿F(xiàn)上百、上千個模塊的水平線性擴(kuò)展,所以這個方案能滿足英偉達(dá)GPU對數(shù)據(jù)存儲的需要。
回到剛才我談三個能力,有一個是高性能,包括剛才我談到支持GPU直連,包括最快速的單模塊125 GB/s傳輸能力。另外一個能力是線性擴(kuò)展,IBM現(xiàn)在的一個主要解決方案是IBM Storage Scale存儲軟件,以前叫GPFS,這個軟件是分布式文件系統(tǒng),客戶比較多,它的特點(diǎn)在于:第一,它是全域命名管理,能夠支持不同存儲協(xié)議的數(shù)據(jù)能夠交互,包括像云原生S3、NFS等,它有特殊的本地緩存的算法,能夠在你訪問遠(yuǎn)程之前提前去預(yù)測這個數(shù)據(jù)是不是在遠(yuǎn)程,能夠先拿到數(shù)據(jù)。通過這種方式,即使水平擴(kuò)展上百個節(jié)點(diǎn)、上千個,它能夠通過預(yù)測提高性能,盡可能少衰減,這也是它非常大的優(yōu)勢,也是國內(nèi)包括國外很多分布式存儲用它作為核心數(shù)據(jù)底座的原因。
第三,很多客戶用人工智能進(jìn)行訓(xùn)練之后,特別是進(jìn)行推理和使用,數(shù)據(jù)會越增長越快。這些增長的數(shù)據(jù),要考慮歸檔和備份的問題。IBM較其他存儲的廠家,我們有比較深的、完整的一個存儲產(chǎn)品解決方案,我們通過IBM SSS 3500產(chǎn)品作為一級存儲,去跟英偉達(dá)的DGX 服務(wù)器配合使用。
同時(shí),當(dāng)數(shù)據(jù)變得越來越多,很多數(shù)據(jù)使用頻度降低時(shí),數(shù)據(jù)開始從熱數(shù)據(jù)變成溫?cái)?shù)據(jù)和冷數(shù)據(jù),我們就開始考慮后面的歸檔,包括備份方案,這里包括文件歸檔、目標(biāo)存儲的歸檔,還有系統(tǒng)通過自帶歸檔,我們有一整套的方案去滿足客戶對人工智能存力的要求。
宋家雨:在未來IBM存儲的規(guī)劃之中,生成式AI部分會更加依賴于Watson嗎?
侯淼:我覺得您說了一個很好的題目,Watson這個名稱來自IBM的創(chuàng)始人老沃森,后來也成為了IBM研發(fā)實(shí)驗(yàn)室的名稱——IBM Watson實(shí)驗(yàn)室。今天,Watson已經(jīng)成為IBM人工智能的統(tǒng)一品牌。
現(xiàn)在我們提出叫watsonx,之所以是X的話,是希望我們有各種不同的場景,不同的方案,能解決客戶更多的問題。圍繞watsonx它的三個組成部分,第一個是支持生成式AI的開發(fā)平臺,叫watsonx.ai,第二個是watsonx.data,把數(shù)據(jù)湖和數(shù)據(jù)倉庫,湖倉一體來結(jié)合。第三個是watsonx.governance,跟整個監(jiān)管包括合規(guī)相關(guān)的。
跟存儲有比較大關(guān)系的是watsonx.data,這里牽扯到不單單是要解決人工智能對存儲的要求,而且也要解決數(shù)據(jù)的管理,數(shù)據(jù)的訪問,整套解決方案。圍繞這塊,用到了不單單是人工智能存儲,也會用到云,用到數(shù)據(jù)備份、數(shù)據(jù)保護(hù)。IBM watsonx希望針對企業(yè)級的人工智能應(yīng)用提供端到端的技術(shù)支持和行業(yè)專長。
現(xiàn)在市面上有一些工具可能只是工具,用在企業(yè)的話,會有很多問題。包括這些工具的使用,數(shù)據(jù)的產(chǎn)生,數(shù)據(jù)的保護(hù),包括維護(hù)以及監(jiān)管的要求。
IBM的理念是,我們提供watsonx產(chǎn)品家族是滿足端到端的需要,特別是企業(yè)客戶,當(dāng)你不具備那么強(qiáng)AI的研發(fā)能力,通過IBM產(chǎn)品組合,能夠從生成式的AI模型,到最后滿足監(jiān)管的要求以及數(shù)據(jù)被保護(hù)等各個方面,這是我們提出watsonx整個的想法。
watsonx是7月初剛剛開始上市的產(chǎn)品,國內(nèi)現(xiàn)在在推廣階段,現(xiàn)在有一些國外的案例,主要是客戶通過生成式AI模型解決行業(yè)一些問題。比如:制造業(yè)生產(chǎn)線中缺陷的判別,醫(yī)療影像的識別,呼叫中心對客戶訴求的自動化應(yīng)對和回復(fù)。我們現(xiàn)在看到針對這類行業(yè)應(yīng)用,所有模型都有它的行業(yè)特點(diǎn),發(fā)生很多交互關(guān)系,往往要跟客戶業(yè)務(wù)緊密結(jié)合,去產(chǎn)生一個合理、可落地的一個模型。
關(guān)于數(shù)據(jù),我們發(fā)現(xiàn),不單單是企業(yè)對AI的使用要求,這些客戶本身的海量數(shù)據(jù),比如,一個銀行的呼叫中心可能也有銀行帳戶的信息,包括信用的信息,而這些信息往往存在數(shù)據(jù)庫里,所以IBM watsonx.data面對的數(shù)據(jù)對象不單單是非結(jié)構(gòu)化的,還有一些結(jié)構(gòu)化的,對數(shù)據(jù)的保護(hù)要求也不一樣,可能你跟客戶的通話本身是敏感的,要保護(hù)。但是跟客戶銀行帳戶的信息相比,可能這里要求的保護(hù)級別更高。怎么樣把這些結(jié)合在一起,就變得非常重要了。
我們現(xiàn)在看到watsonx.data對存儲的要求,會比單一的系統(tǒng)來得要復(fù)雜,因?yàn)槌藸砍兜侥P退a(chǎn)生的,跟GPU配合所需要的存儲結(jié)構(gòu)以外,還需要后臺其他的存儲連接,包括跟它的數(shù)據(jù)庫存儲,包括怎么樣整體上為客戶去做備份,做數(shù)據(jù)保護(hù),所以我們針對人工智能AI的核心軟件Storage Scale,后臺既可以接閃存,也可以接對象存儲,也可以接磁帶,這樣跟客戶整個系統(tǒng)相結(jié)合,不單單是提供AI存儲的本身,而且提供湖倉一體的存儲架構(gòu)。
宋家雨:最后一個問題想問一下侯總,除了目前我們講的混合云、AI存儲之外,安全也是一個特別需要關(guān)注的話題。IBM Storage也有一個產(chǎn)品叫Defender,這樣一個產(chǎn)品是不是能夠抵御勒索病毒攻擊呢?
侯淼:IBM有一類產(chǎn)品,我們叫它數(shù)據(jù)彈性存儲,這里核心軟件就是IBM Storage Defender。實(shí)際上是兩個層面的事情,一個叫做數(shù)據(jù)安全,一個叫數(shù)據(jù)保護(hù),這兩個是不一樣的。
數(shù)據(jù)安全很大程度上是主動的,它要去防止被黑客所襲擊,怎么樣能夠進(jìn)行主動探測,它是一個主動行為。數(shù)據(jù)保護(hù)相對來說是被動行為,怎樣能夠在同時(shí)情況下保護(hù)我的數(shù)據(jù),能夠盡可能減少損失。IBM是把這兩塊結(jié)合在一起了,就是Defender所要解決的問題。