▌北京超算推出按需構(gòu)建算力資源的創(chuàng)新模式 

當(dāng)人工智能(AI)概念被提出之時(shí),文藝工作者便竭盡筆墨暢想了未來(lái)計(jì)算機(jī),如科幻小說(shuō)《最后的問(wèn)題》描述了占地?cái)?shù)千公里電子計(jì)算機(jī)Multivac,電影《終結(jié)者》展現(xiàn)了一臺(tái)臺(tái)并聯(lián)占滿房間的計(jì)算機(jī)。這些未來(lái)智能在規(guī)模超大、功能超強(qiáng)這兩方面都貼合著當(dāng)前算力集群的真實(shí)形態(tài)。

隨著生成式AI在國(guó)內(nèi)廣泛落地,互聯(lián)網(wǎng)大廠在大模型部署上百舸爭(zhēng)流,算力被拱上這場(chǎng)浪潮的焦點(diǎn)。大模型訓(xùn)練對(duì)計(jì)算資源的需求非常高,需要高性能的計(jì)算機(jī)、顯卡集群或超級(jí)計(jì)算機(jī),但算力方面“供不上、用不起”成為制約人工智能產(chǎn)業(yè)發(fā)展的一大痛點(diǎn)。

在超算商業(yè)化的征途上,北京超級(jí)云計(jì)算中心(簡(jiǎn)稱“北京超算”)深耕行業(yè)13載,憑借海量算力資源、創(chuàng)新的超算云服務(wù)模式,以及7*24小時(shí)專(zhuān)業(yè)技術(shù)支持已為超過(guò)1000家單位提供優(yōu)質(zhì)服務(wù)。

北京北龍超級(jí)云計(jì)算有限責(zé)任公司(簡(jiǎn)稱“北龍超云”)是北京超算的主體運(yùn)營(yíng)公司,算力豹邀請(qǐng)北龍超云CTO甄亞楠接受專(zhuān)訪,一同探討算力資源池如何鏈接算力供需兩端,以及算力中心建設(shè)過(guò)程中的工程化難題和著力點(diǎn)。

▲北龍超云CTO 甄亞楠

01 四種算力平臺(tái)“開(kāi)箱即用”,加快科研&生產(chǎn)流程

《2022-2023全球計(jì)算力指數(shù)評(píng)估報(bào)告》顯示,計(jì)算力指數(shù)平均每提高1個(gè)點(diǎn),國(guó)家的數(shù)字經(jīng)濟(jì)和GDP將分別增長(zhǎng)3.6‰和1.7‰。算力正以一種全新的生產(chǎn)力形式,為各行各業(yè)的數(shù)字化轉(zhuǎn)型注入新動(dòng)能,惠及每一家企業(yè)、每一個(gè)人。在甄亞楠看來(lái),算力與應(yīng)用之間的關(guān)系是相互依存的,應(yīng)用程序的設(shè)計(jì)和應(yīng)用場(chǎng)景決定了它所需的算力。

算力已成為科學(xué)研究和企業(yè)創(chuàng)新的必備技能,如何將技術(shù)創(chuàng)新和算力進(jìn)行有效的結(jié)合?甄亞楠談及對(duì)這一問(wèn)題的深刻思考,他認(rèn)為以科學(xué)計(jì)算、人工智能為代表的技術(shù)創(chuàng)新方法依賴大量算力資源。北京超級(jí)云計(jì)算中心以算力服務(wù)作為核心業(yè)務(wù),可以提供共享的CPU、GPU等算力資源,解決人工智能訓(xùn)練推理,以及科學(xué)計(jì)算所面臨的計(jì)算問(wèn)題。免去傳統(tǒng)算力建設(shè)過(guò)程中資金投入大、資源總量小等一系列問(wèn)題。

從整個(gè)產(chǎn)品規(guī)劃的方面來(lái)看,北京超算目前已經(jīng)形成四大產(chǎn)品為核心的運(yùn)營(yíng)服務(wù)體系——AI智算云、行業(yè)云、超算云、設(shè)計(jì)仿真云,除了提供海量的的CPU、GPU算力資源外,還可以提供“專(zhuān)有云”“混合云”等定制化行業(yè)解決方案,以滿足人工智能、工業(yè)仿真、氣象海洋、生命科學(xué)、材料計(jì)算、能源勘探等行業(yè)場(chǎng)景的需求,為用戶構(gòu)建云上科研工作環(huán)境,使用戶能夠?qū)W⒖蒲小?/p>

▲AI智算云平臺(tái)架構(gòu)

甄亞楠分享到,對(duì)于基礎(chǔ)科研來(lái)說(shuō),算力平臺(tái)使用戶省去高昂自建算力成本基于多種主流型號(hào)的海量算力資源,不僅可以滿足多種業(yè)務(wù)場(chǎng)景,同時(shí)可以滿足大規(guī)模計(jì)算訴求,尤其是大模型訓(xùn)練、推理業(yè)務(wù)需求,加速科研成果研究和轉(zhuǎn)化。

據(jù)了解,北京超算已服務(wù)1千多家單位,包括企業(yè)、科研院所和高校,涉及20多種行業(yè)。

02 大模型“暴力計(jì)算”時(shí)代,按需建設(shè)提升利用率

大模型增長(zhǎng)之勢(shì)在2024年持續(xù),據(jù)Gartner預(yù)測(cè),到2025年全球?qū)⒂?0%的AI模型使用云端來(lái)進(jìn)行訓(xùn)練和部署。另一方面,多模態(tài)模型的訓(xùn)練以及應(yīng)用側(cè)推理都將對(duì)算力提出更嚴(yán)苛的要求,算力資源復(fù)雜度與規(guī)模將同步升級(jí),隨著模型規(guī)模的擴(kuò)大、訓(xùn)練時(shí)間加長(zhǎng),計(jì)算資源的利用率也會(huì)成為關(guān)鍵。

國(guó)家信息中心近日在京發(fā)布的《“人工智能+”時(shí)代公共云發(fā)展模式與路徑研究》報(bào)告顯示,我國(guó)算力存在資源分散、利用率低等問(wèn)題,一定程度阻礙了人工智能技術(shù)創(chuàng)新迭代與規(guī)?;瘧?yīng)用的步伐。甄亞楠認(rèn)為,采用公共算力能夠高效利用資源,提升算力供給,并通過(guò)規(guī)模經(jīng)濟(jì)效應(yīng)降低算力使用門(mén)檻,讓更多用戶享受到高性能、高性價(jià)比的算力服務(wù);另一方面,目前公共算力資源面臨算力資源分散利用效率不高、服務(wù)效能不佳等問(wèn)題。

在算力服務(wù)上,北京超算采用市場(chǎng)化供給和專(zhuān)業(yè)化運(yùn)營(yíng)以解決算力共享難等問(wèn)題,推出了按需構(gòu)建算力資源的創(chuàng)新模式,以需求為向?qū)Вo密?chē)@用戶的實(shí)際業(yè)務(wù)需求、應(yīng)用需求,精準(zhǔn)匹配算力資源,推動(dòng)算力服務(wù)的高質(zhì)量和效率的提升。

甄亞楠透露,智算中心的算力服務(wù)已經(jīng)躍升為北京超算的主營(yíng)業(yè)務(wù)之一,且目前增長(zhǎng)迅速。北京超算具有萬(wàn)卡集群工程化能力,同時(shí)擁有長(zhǎng)達(dá)十幾年的服務(wù)經(jīng)驗(yàn),有力保障大模型訓(xùn)練、推理業(yè)務(wù)的開(kāi)展。

當(dāng)前人工智能正快速迭代創(chuàng)新,大模型的用戶量、訪問(wèn)速度、網(wǎng)絡(luò)帶寬、訓(xùn)練模式等時(shí)時(shí)影響其算力需求的大小,在保障算力的性能和穩(wěn)定服務(wù)方面,甄亞楠展現(xiàn)出對(duì)北京超算的信心。據(jù)介紹,北京超級(jí)云計(jì)算中心從2019年開(kāi)始打造人工智能算力服務(wù),且在2021年、2023年有多套的智算資源入榜世界人工智能算力性能排行榜(AIPerf500),先后獲得總量份額第一、大模型訓(xùn)練算力TOP3等成績(jī)。

▲北京超算獲2021年世界人工智能算力性能排行榜總量份額第一名

步履不停,北京超算將強(qiáng)大的算力服務(wù)能力持續(xù)性輸出給大模型客戶,同時(shí)也在積極尋找優(yōu)質(zhì)的加速卡資源,來(lái)保障算力使用者在大模型計(jì)算過(guò)程中有效的、短期的算力資源。

未來(lái),大模型“原生”應(yīng)用落地的場(chǎng)景有待進(jìn)一步探索,如政府、金融、視頻、媒體等領(lǐng)域。甄亞楠透露,北京超算正在就文生圖、文生視頻等新興AI技術(shù)領(lǐng)域與客戶進(jìn)行溝通,將幫助落戶這類(lèi)大模型場(chǎng)景的工作納入中長(zhǎng)期規(guī)劃。

03 算力建設(shè)“智逢其時(shí)”,積極推動(dòng)形成以人工智能為引擎的新質(zhì)生產(chǎn)力

近年來(lái),“東數(shù)西算”工程全面啟動(dòng),國(guó)資委今年2月提出加快智能算力中心建設(shè),兩會(huì)政府工作報(bào)告更是強(qiáng)調(diào)要“適度加快”。在算力建設(shè)火熱之下,我們“冷思考”發(fā)現(xiàn),分散在地方的算力中心各自為營(yíng),算力需求也呈現(xiàn)出多元化、碎片化趨勢(shì),種種因素導(dǎo)致的尖端算力浪費(fèi)、低端算力過(guò)剩的問(wèn)題掣肘著算力建設(shè)的發(fā)展。

建立適應(yīng)“人工智能+”時(shí)代的高質(zhì)量算力服務(wù)基地迫在眉睫,在助力智算中心建設(shè)方面,北京超算有著長(zhǎng)期布局和具體著力點(diǎn)。甄亞楠分享說(shuō),北京超級(jí)云計(jì)算中心成立于2011年,是由北京市人民政府主導(dǎo)、院市共建的“北京超級(jí)云計(jì)算和國(guó)家重要信息化基礎(chǔ)平臺(tái)“,坐落于北京市懷柔綜合性國(guó)家科學(xué)中心–懷柔科學(xué)城。

當(dāng)下,大模型及生成式AI技術(shù)正在掀起新的產(chǎn)業(yè)革命,北京超級(jí)云計(jì)算中心積極推動(dòng)形成以人工智能為引擎的新質(zhì)生產(chǎn)力,可以在算力設(shè)施、算力運(yùn)營(yíng)、大模型應(yīng)用落地等方面與地方或產(chǎn)業(yè)開(kāi)展全方位合作,為智算中心建設(shè)運(yùn)營(yíng)提供高性能、可持續(xù)的運(yùn)行方案,推動(dòng)智算中心快速投入使用并實(shí)現(xiàn)長(zhǎng)效運(yùn)營(yíng),保障經(jīng)濟(jì)社會(huì)效益最大化。

為破解算力資源易閑置、使用成本高等問(wèn)題,北京超算已在算力產(chǎn)業(yè)的市場(chǎng)化供給、規(guī)模化經(jīng)營(yíng)、專(zhuān)業(yè)化運(yùn)營(yíng)方面做出示范性實(shí)踐,在算力產(chǎn)業(yè)生態(tài)化發(fā)展方面,北京超算也正與產(chǎn)業(yè)上下游協(xié)同合作、積極探索。

去年6月,北京市政府積極聯(lián)絡(luò)大模型產(chǎn)業(yè)鏈上的算力、數(shù)據(jù)、模型、應(yīng)用和投資單位推出“北京市通用人工智能產(chǎn)業(yè)創(chuàng)新伙伴計(jì)劃”,北京超算成為首批“算力伙伴”。目前,北京超算已與北京智源人工智能研究院、智譜AI、瀾舟科技、深勢(shì)科技等單位形成了算力合作,為國(guó)產(chǎn)大模型如智譜GLM-4、孟子大模型等提供了算力服務(wù)支撐,幫助訓(xùn)練進(jìn)行優(yōu)化以及數(shù)據(jù)分析,為大模型團(tuán)隊(duì)提升效率。

▲3月18日,在瀾舟科技大模型技術(shù)和產(chǎn)品發(fā)布會(huì)上,北京超級(jí)云計(jì)算中心等與瀾舟科技簽約并合影。

結(jié)語(yǔ)算力產(chǎn)業(yè)格局重整,以服務(wù)助跑?chē)?guó)產(chǎn)算力

海外算力供給受限,國(guó)產(chǎn)算力迎難而上,在新技術(shù)、新政策重整算力產(chǎn)業(yè)格局的同時(shí),行業(yè)還需要正視國(guó)內(nèi)算力利用率低的底層鴻溝。甄亞楠談道,北京超算可以將積淀十余年的運(yùn)營(yíng)經(jīng)驗(yàn)進(jìn)行輸出,幫助政府和企業(yè)建設(shè)算力中心,同時(shí)提供高質(zhì)量的運(yùn)營(yíng)服務(wù)解決方案,來(lái)幫助他們?nèi)ヌ嵘麄€(gè)平臺(tái)的運(yùn)營(yíng)效率和經(jīng)濟(jì)效益。

在人工智能加速迭代和創(chuàng)新的當(dāng)下,北京超算已不僅僅是一個(gè)算力服務(wù)提供商,甄亞楠提到,北京超算密切關(guān)注芯片、軟件以及服務(wù)生態(tài)國(guó)產(chǎn)化方面的相關(guān)進(jìn)展,同時(shí)以算力服務(wù)為核心讓資源利用最大化,與業(yè)界合力讓算力資源供需兩端形成一個(gè)有機(jī)整體,讓國(guó)產(chǎn)算力跟上產(chǎn)業(yè)價(jià)值共振。

·END·

分享到

yunlang

相關(guān)推薦