在近日舉行的“中國計算機學會青年計算機科技論壇”(CCF YOCSEF)濟南論壇上,“離開國家超算,商業(yè)超算能否獨立生存”的話題引起了關注和熱議。商業(yè)超算的市場究竟在哪里?超級云計算能否打破超算服務無法真正商業(yè)化的魔咒?超算云服務能否開辟新的戰(zhàn)場?在超算市場喧囂的背后,我們需要的是更精準的客戶畫像、超算資源的供需平衡、速度與應用優(yōu)先權更合理的安排……也許只有這樣,普惠超算的夢想才能真正照進現(xiàn)實。
超算正變得多元化
中國超算越來越厲害,雖然起步較晚,但是發(fā)展速度很快。很多人頭腦中慢慢有了這樣的印象,很大程度上是因為中國的超級計算機近些年在全球超級計算機榜單 TOP500中屢有斬獲, 甚至有過連續(xù)多屆坐莊的好成績,其中“天河一號”“天河二號”“太湖之光”更是人們耳熟能詳?shù)闹袊売嬎銠C的優(yōu)秀代表。
時至今日,中國超算已經(jīng)在世界超算領域占有了一席之地。就在我們已經(jīng)有能力制造出全世界屬一屬二的超級計算機之時,一些隱藏在“高速度”之下的問題也漸漸浮出水面。
最集中的體現(xiàn)就是“重硬輕軟”,具體表現(xiàn)在:我國的應用軟件目前仍處于初級階段,應用與軟件研發(fā)存在脫節(jié)現(xiàn)象,一個典型的例子是日常運行的超算作業(yè),其并行規(guī)模仍停留在千核級別以下,不能充分發(fā)揮億億次超級計算機的并行能力,尤其是在超算應用較多的制造業(yè)和基礎科研領域,大部分的商業(yè)應用軟件都來自國外,而我們的軟件幾乎都是科研用軟件, 不具備大規(guī)模商業(yè)推廣的能力和條件。
正因為如此, 有人提出了超算能否從陽春白雪走向下里巴人,超級計算機的發(fā)展到底應該是速度為王還是應用為王等疑問。
我國超級計算機的研制模式基本都是由政府科技部門主導,地方政府參與,企業(yè)承擔研制任務,國家超級計算中心負責運維和推廣。不可否認,這種模式是經(jīng)過過去20多年的實踐和驗證,使得我國在超算領域異軍突起的重要基礎和保障。
但是在從跟跑進入到并跑,甚至部分技術領跑的新階段后,很多專業(yè)人士也在反思,會不會因為我們以前太重視超算領域TOP500 這樣的“金牌”之爭,反而放松了對于提升超算整體應用水平這樣類似“全民健身”的要求?再加上軟件發(fā)展沒有實質性突破,自研應用少、應用場景不完善等問題依然存在,以及采用商業(yè)模式運營的超算中心成功的案例鳳毛麟角, 導致商業(yè)超算缺少良好的生態(tài)平臺,無法滿足千行百業(yè)對商業(yè)化大規(guī)模超算應用的需要。
找到了問題所在,然后有效地解決問題,我國的超算產(chǎn)業(yè)才能實現(xiàn)又一次飛躍。國家超級計算天津中心主任助理馮景華認為,國情不同,超算的應用模式也不同,國家超算和商用超算并不矛盾,超算肯定能產(chǎn)業(yè)化,而且產(chǎn)業(yè)化手段非常多。國內的國家級超算中心都在積極探索適合自己的創(chuàng)新發(fā)展之路。
技術創(chuàng)新驅動應用創(chuàng)新,反過來,應用又是技術的試金石,是技術持續(xù)提升的基礎和源泉。 其實,速度為王或應用為王并不矛盾,從產(chǎn)品的角度出發(fā),就是速度為王;從客戶和業(yè)務的角度出發(fā),就體現(xiàn)為應用為王。超算落地,其核心還是以應用為王。
但在超算發(fā)展的不同階段,應根據(jù)實際的需求和目標的設定,及時調整速度為王或應用為王的優(yōu)先級?,F(xiàn)在,超算的發(fā)展正處于一個關鍵的轉折期,企業(yè)的云化轉型、智能升級迫切需要超算提供的強大算力和支撐。從整體趨勢來看,超算會逐漸從重視速度變?yōu)橹匾晳茫眠M行更細粒度的劃分,不同的場景需要不同的解決方案。
用戶的規(guī)模不同、需求不同,對技術能力的要求不同,運維的復雜程度不同、成本也不同。面對這么多不同,超算應當進一步劃分等級和客戶群,針對不同客戶提供不同規(guī)模、性能的超算服務。
國家超算面向大型、重要的用戶,而商用超算可以解決大量中小型用戶的需求。從這個角度說,商用超算是國家超算有益的補充。
在“新基建”的浪潮下,我們看到各類超算中心也在探索多元化的運營模式,致力于提供全譜系服務。在用戶多樣化需求的牽引下,隨著技術的不斷發(fā)展,將超算的算力分離出來,實現(xiàn)定制化,同時降低超算的使用成本,超算普惠是可以實現(xiàn)的,比如超級云計算模式、云超算等就是有益的嘗試。
需要明確的一點是,國家超算是一種戰(zhàn)略資源,不能全部做商業(yè)化的探索。但是在條件具備的情況下可以進行多元化運營模式的探索,這有助于打造良好的超算生態(tài),推動整個超算的大規(guī)模商業(yè)化進程。
給客戶畫像 超算市場三分天下
一提到超算,很多人最直接的聯(lián)想就是超級計算機,甚至就在超算與超級計算機之間劃上了等號。其實,超級計算機只是豐富的、多層次的超算應用的金字塔尖,而不代表超算應用的全部。業(yè)內之所以有關于國家超算與商業(yè)超算能否并存的探討,也是從客戶的實際應用需求出發(fā),看到了劃分超算場景和客戶群體的必要性和商業(yè)價值。
北京并行科技董事長陳健從商業(yè)角度將超算行業(yè)劃分為“尖端超算、通用超算和行業(yè)超算”三大細分市場,并為三大市場的客戶進行畫像和產(chǎn)品定位。這種對超算行業(yè)生態(tài)立體化的描述,有利于超算廠商和服務運營機構進一步明確目標客戶,提供更有針對性的解決方案和服務,更加充分地發(fā)揮超算的威力。所謂尖端超算,一個“尖端”已經(jīng)直接說明了這類客戶和這類需求的特殊性。
通常來說,尖端超算的客戶部署的是“萬核”以上的應用。他們追求“三極”,即極大的規(guī)模、極高的超算硬件系統(tǒng)要求和極致的性能。能夠駕馭尖端超算的必定是高端超算的從業(yè)人員,來自于攻堅型科研、國家級客戶或各行業(yè)頂級研究機構。
稱得上是尖端超算的產(chǎn)品,毫無疑問,一定是“塔尖上的明珠”“國之重器”。具體分析,尖端超算產(chǎn)品無論是在計算、訪存、通信,還是I/O 場景下,都具有十分出眾的能力,是性能設計平衡的高端超級計算機?!疤狻薄疤旌佣枴钡染褪羌舛顺愕拇恚彩侨嵉貐⒂^過設備的人無不嘖嘖稱贊。眾所周知, 這些尖端超算產(chǎn)品需要國家大力投入,集中科研力量進行攻關,目的就是集中力量辦大事,解決一些重大、棘手的科研難題。因此,不能簡單地核算其性價比,必須以速度為王。
提供尖端超算服務的代表就是國家超級計算中心。國家超級計算中心是由科技部批準成立的,截至 2019 年,科技部批準建立的國家超級計算中心共有七家,包括國家超級計算天津中心、國家超級計算廣州中心、國家超級計算深圳中心、國家超級計算長沙中心、國家超級計算濟南中心、國家超級計算無錫中心和國家超級計算鄭州中心??梢哉f,它們是中國超算的脊梁。 現(xiàn)在仍有一些地方政府在大力興建超算中心,希望進入到國家超算體系之中。
中科院計算所研究員張云泉介紹說,從實踐來看,我國超算在建設思路上采取了優(yōu)先發(fā)展超算系統(tǒng)的性能,然后再拉動超算應用發(fā)展的策略,這種方式雖然在短時間內拉近了我們在設備端與世界先進水平的差距,但是也會導致超算系統(tǒng)初期應用效率偏低等情況的出現(xiàn),需要一定的過渡期,才能讓超級計算機的資源和能力得以充分釋放。
反觀歐美日等國家,它們的超算發(fā)展模式是,根據(jù)行業(yè)和應用領域的實際應用需求,有針對性地研制能滿足實際應用需求的超算系統(tǒng),這樣可以有效避免對機器的浪費,形成了供需的動態(tài)平衡。
采用通用超算的客戶,其應用主要在萬核以下,其中絕大多數(shù)是千核以下的應用。這類客戶的代表是那些海量的自身無超算資源但又想使用超算服務, 或是當前在自主建設中小型超算系統(tǒng)的客戶。這類客戶的核心需求表現(xiàn)在,需要優(yōu)質的服務,而且特別關注性價比。
通用超算可以針對不同類型的應用,按照動態(tài)隨需增長模式,提供最高性價比的超算服務計算資源,從而將那些不得不自建超算系統(tǒng)的客戶解脫出來,以租用的方式更方便快捷、以更低的成本使用超算服務。
通用超算的代表是超級云計算中心。我國的一些國家超算中心已經(jīng)在嘗試這種模式,并且取得了不錯的效果。另外,像北京超級云計算中心,便提供商業(yè)運營的通用超算服務平臺,用戶數(shù)已經(jīng)突破2萬,并且仍在持續(xù)快速增長。北京超級云計算中心不僅擁有強悍的處理器、 專業(yè)的平臺優(yōu)化能力,而且可以根據(jù)用戶需求進行動態(tài)擴容,避免了用戶排隊,同時保證了計算的順暢。一句話,北京超級云計算中心可以為各類企業(yè)提供優(yōu)質的超級計算和云計算服務。
行業(yè)超算的客戶可能是范圍最廣、應用需求差異最大的一類客戶,其應用可從單核跨越到幾千核。這類客戶最關注服務,然后是性能和性價比。與其說這類客戶關注超算,還不如說他們更關注的是業(yè)務本身,因為超算只是他們用來滿足業(yè)務需求的一個環(huán)節(jié)而已,其終極目標是實現(xiàn)完整業(yè)務云化,同時保證業(yè)務運行的穩(wěn)定性和可靠性。
行業(yè)超算,顧名思義就是面向不同的行業(yè)需求,按照各行業(yè)的實際業(yè)務需求設計完整的云上業(yè)務流程,并且保證業(yè)務各環(huán)節(jié)能夠快速、高效、動態(tài)實現(xiàn),具有彈性和高性能、高穩(wěn)定性、高可靠性、高可維護性。行業(yè)超算的實現(xiàn)方式通常是“公有云/超算云+ 專業(yè)超算服務商”。
以阿里云、騰訊云等為代表的公有云服務商最近幾年加快了在超算領域的布局。以公有云的方式交付超算資源和服務,可以發(fā)揮云本身靈活、低成本、服務化等優(yōu)勢,加速超算普惠的進程。舉例來說,早在2018 年初,騰訊云重慶黑石數(shù)據(jù)中心便對外提供超算云服務,將超級計算機集群部署在云端,滿足了重慶當?shù)毓I(yè)企業(yè)對高性能計算的需求,讓他們享受到云服務帶來的種種便捷。
另外,阿里云的彈性高性能計算平臺E-HPC面向的是傳統(tǒng)對高性能計算有強烈需求的高校科研機構和企業(yè)用戶,能夠大幅度降低人工智能計算門檻,很好地詮釋了公有云上的HPC as a Service。阿里云表示,E-HPC不僅可以一鍵部署,而且是可媲美大型超算集群的云上超算中心。
我們雖然按照客戶需求和產(chǎn)品特性將超算劃分成三大市場,但這三大市場之間的界線并不是涇渭分明,比如通用超算與行業(yè)超算之間就有交叉,最終還是要根據(jù)客戶的實際需求判定采用哪種解決方案或服務。
“有些人可能會迷信超級計算機。但是超級計算機不可能為一些小應用更改配置,更不要說定制化了。這就好比手里攥著一把巨大無比的錘子,到處找小釘子砸。既然有通用超算、行業(yè)超算這樣順手的小錘子,為什么不用?用小錘子砸小釘子可能會事半功倍?!标惤”硎?,“我們從給客戶畫像入手,先明確用戶的需求,再找對路的產(chǎn)品和服務,這樣可以更好地滿足超算商業(yè)化的需求。”
將超算劃分成三大市場,最直接的效果是將客戶需求梳理清楚,引導客戶對號入座,選擇最適合自己的超算服務,而不是非要千軍萬馬爭過國家超算這一座獨木橋。商業(yè)超算也有自己的擅長,在某些場景下可能更經(jīng)濟、更高效。俗話說,殺雞焉用宰牛刀,就是這個道理。不同的設備對應不同的最適合的應用場景,既不要大材小用,也不必一味追求“高大上”。
調查顯示,大部分企業(yè)客戶的計算需求都在千核以下,通用超算或行業(yè)超算完全可以滿足需求。統(tǒng)計數(shù)據(jù)顯示,我國傳統(tǒng)超算市場的整體規(guī)模達280億元,其中尖端超算目前大約占四分之一,而通用超算占四分之三。行業(yè)超算包含了行業(yè)應用軟件市場,是后起之秀,增長勢頭迅猛,預估市場份額約為1000億元,假以時日很有可能顛覆目前的超算市場格局。
國外的超算市場更加成熟,也相對簡單,尖端超算數(shù)量并不多(比如NASA),通用超算和行業(yè)超算的用戶主要都是由云計算公司來提供服務。在國內,尖端超算的規(guī)模還在不斷擴大, 但是仍有很多企業(yè)用戶在自建超算系統(tǒng),這說明在超算市場上還存在供需不平衡的情況。在電商領域,有了天貓和京東,為什么還會有拼多多異軍突起?這是不同的市場定位、不同的客戶群體和需求決定的。在超算領域,尖端超算、通用超算和行業(yè)超算三大市場會進一步明確和細分。
超算云服務異軍突起
明確應用需求,找對適合的產(chǎn)品,接下來就是如何落地,也就是超算商業(yè)化這個要探討的核心問題。
超算商業(yè)化的一個重要前提是,有海量的客戶需要超算應用,但是這些應用不必運行在超級計算機上,而用戶自建超算系統(tǒng)又不劃算,這時商業(yè)化的超算云服務就是一種新的選擇。并行科技就是一家提供專業(yè)化超算云服務的供應商。從某種程度上說,它像是一個聚合各種模式超算服務的“中間商”,通過它的整合和調度,用戶可以獲得與自己業(yè)務匹配的尖端超算、 通用超算和行業(yè)超算。并行科技與多個國家超算中心保持密切的資源往來,可以幫助客戶建設超級云計算中心(比如與北京超級云計算中心攜手共建),同時還與阿里云、華為云等公有云服務商結成了合作伙伴。無論客戶有哪類超算需求,都可以先找到并行科技,由它負責匹配具體的超算資源和服務。目前,并行科技服務的超算客戶超過了2萬,其中大多數(shù)還是以科研為主,合同金額從幾千元到幾百萬元不等。
投資界的人剛接觸到超算時,總會有點敬而遠之,因為大家擔心超算是重資產(chǎn)投入,以為會建大型數(shù)據(jù)中心,包袱太重。其實這是一種誤解,超算領域有很多供應商,比如超算云服務商并行科技就是一家輕資產(chǎn)公司,雖然它背靠的是超算中心、超級云計算中心和公有云這些資源池,但它本身的特長還是在PaaS和SaaS 層,可以根據(jù)用戶的需求動態(tài)擴容這些資源池,避免用戶排隊,最大程度地發(fā)揮超算資源池的作用。并行科技是一個超算云服務的統(tǒng)一出口,它將超算資源標準化,并按其性能、質量等銷售給客戶。
在數(shù)據(jù)中心領域,數(shù)據(jù)中心的建設與運營有逐漸分離的趨勢,輕重資產(chǎn)由各自最擅長的企業(yè)經(jīng)營,前一段時間鵬博士動作頻頻正是為此。在超算領域亦是如此,并行科技就是“吃螃蟹的人”。陳健表示,并行科技的初衷是以SaaS化構建立體超算行業(yè)生態(tài),打造新的行業(yè)增長點。并行科技與超算資源提供商之間就像是電網(wǎng)與電廠的關系。有了多個不同“電廠”的支持,并行科技可以向客戶直接輸送成本最低的“電”,同時保證服務最優(yōu)。
超算迎來“黃金時代”
市場研究公司Hyperion Research的數(shù)據(jù)顯示,從2017年到2022年,全球超級計算機市場規(guī)模將翻一番,超過95億美元。AI的爆發(fā)為超算的商業(yè)化和普及應用又添了一把火。據(jù)悉,一批新崛起的中國本土私募基金也將AI應用于投資決策,有的還投資建設了自己的新一代AI 超級計算機。
超算市場還在成長壯大。尖端超算是一個國家的科技命脈,仍會向著“更高更快更強”發(fā)展,而通用超算和行業(yè)超算可以預見其增長速度將更快,三大市場各有自己的區(qū)間,互相不可替代。
我國正走在從“超算大國”到“超算強國”的道路上,不僅要在硬件上攻艱克難,更要在算法和應用軟件上尋求新的突破,再邁上一個新臺階。超算正處于“黃金時代”,它不僅需要產(chǎn)品、技術和應用上的創(chuàng)新,更迫切需要商業(yè)模式上的創(chuàng)新。超算云服務、超級云計算中心毫無疑問將成為超算商業(yè)化的有力推手。
(說明:文章來源《中國信息化周報》)