超云發(fā)布“東數(shù)西算數(shù)據(jù)中心基礎架構(gòu)設計方案白皮書”

東數(shù)西算工程甫一啟動,超云就積極響應并對相關(guān)重點策略進行了深度的解讀和洞察,在編寫“東數(shù)西算數(shù)據(jù)中心基礎架構(gòu)設計方案白皮書”的同時,還不斷踐行投入到西部數(shù)據(jù)中心建設當中,西云作為超云的重要客戶和戰(zhàn)略合作伙伴,雙方在數(shù)據(jù)中心基礎架構(gòu)部署,AI算力、分布式存儲、高速網(wǎng)絡、AI運維以及云租賃等上層應用,進行了全方位合作,除了部署大量服務器,還在積極聯(lián)合研發(fā)新一代節(jié)能技術(shù),其中液冷整機柜就是其中的一款明星產(chǎn)品。

今年2月19日,國資委召開中央企業(yè)AI專題推進會,明確提出兩大核心目標:一是加快建設一批智算中心,二是開展AI+專項行動,構(gòu)建一批產(chǎn)業(yè)多模態(tài)優(yōu)質(zhì)數(shù)據(jù)集,打造從基礎設施、算法工具、智能平臺到解決方案的大模型賦能產(chǎn)業(yè)生態(tài);3月份政府工作報告提出“適度超前建設數(shù)字基礎設施,加快形成全國一體化算力體系”,這一決策體現(xiàn)了國家層面對于數(shù)字經(jīng)濟長遠發(fā)展的高度重視和戰(zhàn)略前瞻性。

“被稱為第四次技術(shù)革命的AI技術(shù),決定了未來社會的好壞甚至國家之間發(fā)展的差距。這個政策將引導我國在AI領(lǐng)域居于世界領(lǐng)先地位,堪稱高瞻遠矚?!?月16日,新華三集團聯(lián)席總裁、首席技術(shù)官兼技術(shù)委員會主席尤學軍在杭州召開的2024新華三媒體及分析師溝通會上表示:“對新華三來說,就要用最好的算力和聯(lián)接的技術(shù)來支持這個領(lǐng)域的快速部署,用最少的投入和最高的效率來貢獻自身的力量?!?/p>

新華三集團聯(lián)席總裁、首席技術(shù)官兼技術(shù)委員會主席尤學軍

由廠商自發(fā)建設或牽頭的智算中心也陸續(xù)投入使用。

3月底,集成了寧暢在AI計算領(lǐng)域能力,以底層硬件到頂層應用平臺系統(tǒng)化方案的“AI算力棧”NEX AI Lab(Nettrix AI Open Lab),滿足大模型落地所需的計算、存儲、網(wǎng)絡、建設、管理、應用及液冷等全方位需求也在桐鄉(xiāng)落成。

寧暢“AI算力?!盢EX AI Lab

紫光股份4月3日透露,其圖靈小鎮(zhèn)AIGC智算中心已于今年1月啟用,以裸金屬智算服務器租用、云智算服務租用、大模型服務等多種能力,為企業(yè)、研究機構(gòu)、高校院所提供定制、先進、普惠、全面的端到端的智能算力服務。

紫光股份圖靈小鎮(zhèn)AIGC智算中心啟用儀式

智算中心背后的建設者們

智算中心建設,離不開廠商的綜合性解決方案。

1)超云:高性能、彈性化的AIGC數(shù)據(jù)基礎架構(gòu)

超云作為國內(nèi)專業(yè)的數(shù)據(jù)中心產(chǎn)品及服務提供商,同時也是國內(nèi)較早布局數(shù)據(jù)中心解決方案的企業(yè)之一,多年來一直持續(xù)加大在產(chǎn)品研發(fā)方向的投入,通過技術(shù)創(chuàng)新與升級,數(shù)據(jù)中心解決方案已經(jīng)達到業(yè)界領(lǐng)先水平。

借助于多芯架構(gòu)、雙“云”共進的發(fā)展戰(zhàn)略,旗下產(chǎn)品線得到不斷豐富和壯大,隨著業(yè)務的發(fā)展,超云在數(shù)據(jù)中心領(lǐng)域的突破成為必然,也有義務和責任推動行業(yè)技術(shù)的發(fā)展與進步。超云為智算中心提供了高性能存儲產(chǎn)品及解決方案。

AIGC存儲可以為訓練數(shù)據(jù)、模型參數(shù)、中間結(jié)果和實時/近實時數(shù)據(jù)處理提供存儲能力;超云為AIGC智算中心提供NS5000V、CS13000、CS13000-G和AI存儲信創(chuàng)版等多個版本的全閃存陣列,滿足現(xiàn)有AIGC智算中心的高帶寬、低延遲、高可用的存儲需求;同時,為了解決更高性價比的長期海量存儲,采用分層存儲技術(shù),形成多副本、糾刪碼按照文件的使用頻率和創(chuàng)建時間,實現(xiàn)文件的自動分層,同時支持外部的對象存儲、文件系統(tǒng)、藍光存儲和帶庫歸檔能力,分層存儲解決方案大大提升了效率,降低了成本,同時能滿足數(shù)據(jù)的長期存儲需求。

除了能夠為AIGC智算提供海量、高效、低延遲的存儲外,同時還提供超融合計算能力的云化能力;超云在云部分的產(chǎn)品布局分為四部分:超融合產(chǎn)品、云操作系統(tǒng)、集中式存儲和分布式存儲,可以為AIGC基礎架構(gòu)提供高效、低延遲、海量的存儲和彈性擴展的計算能力。

2)寧暢:六“全”特點構(gòu)筑“全局智算”戰(zhàn)略

寧暢CEO秦曉寧在2024年度“全局智算”戰(zhàn)略新品及方案發(fā)布會上介紹了其六“全”特點:分別是全體系、全液冷、全服務、全場景、全行業(yè)、全階段。

寧暢CEO秦曉寧

全體系,是指從通用、A1、邊緣計算、整機柜、AI工作站、AI算力棧等硬件軟件、平臺、應用、開發(fā)工具支撐與適配整體的軟硬件棧全部具備,并且把服務器和數(shù)據(jù)中心級別的AI算力帶到了桌面。

全場景,寧暢AI全棧能力,全面支持大模型開發(fā)適配、部署場景。

全液冷覆蓋服務器、機柜、數(shù)據(jù)中心多形態(tài),支持風冷、冷板式液冷、浸沒液冷多方式,秉承“冷靜“計算策略,有效化解額外能耗以及成本居高不下的問題。

全行業(yè),滿足互聯(lián)網(wǎng)、金融、科研、自動駕駛等幾乎所有重要行業(yè)業(yè)務需求。

全服務,提供從前期咨詢、設計到制造、咨詢及后續(xù)運維、售后等全時算力服務,一個明顯的特征是不只交付硬件,如今有更多的軟件交付。

全階段,滿足客戶從大模型的開發(fā)、適配、部署、全場景不同業(yè)務發(fā)展階段關(guān)鍵需求,提供最具價比的定制化智算中心方案。

基于“全局智算”戰(zhàn)略,寧暢綜合某車企客戶的各種需求,最終選擇預制模塊化機房,成功搭建了一個面向自動駕駛領(lǐng)域的算力系統(tǒng)。

在機柜方面,液冷覆蓋率超過95%、功率高達100KW每柜的整機柜,電液盲插方式非常便于運維和部署,同時還為特定的硬件平臺推薦最優(yōu)能耗比配置,PUE最低可至1.09。

為滿足自動駕駛對實時性和延遲性要求,寧暢基于AI軟件棧提供優(yōu)化的深度學習框架和加速庫,充分平衡訓練,提升了推理效率;數(shù)據(jù)預處理自動標注方式,提高了數(shù)據(jù)的利用效率。

自動駕駛對安全性有更高的要求,車企需要進行大量的模擬測試。寧暢AI智駕中臺提供強大的模擬和測試工具,支持虛擬環(huán)境的創(chuàng)建與場景的重現(xiàn),測試運率的自動生成和執(zhí)行,加速了模型的訓練過程,實現(xiàn)模型訓練閉環(huán)。

通過種種舉措,寧暢以覆蓋數(shù)據(jù)收集、數(shù)據(jù)處理、模型訓練、參數(shù)調(diào)優(yōu)、模型評估、模型發(fā)布全流程的技術(shù)支持,幫助客戶專注業(yè)務,提升計算和測試效率,縮短了新產(chǎn)品上市的進程。

3)新華三:“算力×聯(lián)接”應對AIGC時代新挑戰(zhàn)

新華三應對AIGC時代新挑戰(zhàn)的舉措是“算力×聯(lián)接”六大能力。這六大能力分別是高效多元算力供給、高品質(zhì)網(wǎng)絡聯(lián)接、海量數(shù)據(jù)并行處理、智能能耗治理、主動安全、智能運維。

以高效多元算力供給為例,新華三以高效的算力調(diào)度和管理使能平臺琢作為展現(xiàn):傲飛算力平臺3.0已全面擁抱“算力即服務”,G7系列模塊化異構(gòu)算力服務器則以多元開放、擁抱OAI、存算分離三大優(yōu)勢提供澎湃算力支持,并以豐富的生態(tài)及模型適配減少產(chǎn)品開發(fā)周期、提升業(yè)務效率。

而在存儲領(lǐng)域,新華三推出的下一代AI存儲——Polaris系列則將Storage For AI和AI In Storage兩大思路融合為一。通過全閃介質(zhì)、數(shù)據(jù)池化和AI智能管理設計,Polaris能夠滿足AI業(yè)務負載對存儲設備的性能和功能需求,助力海量數(shù)據(jù)的加載和存儲,提升AI智算集群的整體運行效率,做到Storage For AI。而融合了AI技術(shù)的智能運維、智能加速、智能助手等工具則大幅降低了存儲設備在運維、管理、排障、規(guī)劃、配置、優(yōu)化等方面的工作量和成本,讓Polaris更加好用、易用。

新華三集團高級副總裁、云與計算存儲產(chǎn)品線總裁徐潤安

“兩種AI思路在同一款產(chǎn)品中的融合使Polaris既能滿足用戶的新型業(yè)務負載需求,也能創(chuàng)造更優(yōu)異的應用體驗,這也是企業(yè)級存儲的必然發(fā)展方向。”新華三集團高級副總裁、云與計算存儲產(chǎn)品線總裁徐潤安如是說。

在提供算力與聯(lián)接的基礎上,新華三也承擔和參與了一些大型智算中心的建設工作,力爭在今年ICT領(lǐng)域這一最大市場贏得商機,同時也為未來AI領(lǐng)域的創(chuàng)新打下基礎。

加強國產(chǎn)化替代,提升安全可控能力

智算中心的國產(chǎn)化替代,是指在建設智算中心的過程中,從硬件設備、軟件系統(tǒng)到核心算法等關(guān)鍵環(huán)節(jié)采用國產(chǎn)技術(shù)和產(chǎn)品,減少對外部技術(shù)的依賴,確保數(shù)據(jù)安全和國家安全。

剛剛投用的韶關(guān)數(shù)據(jù)中心集群落地后首個投入運營的智算中心——華南數(shù)谷智算中心是粵港澳大灣區(qū)國家算力樞紐節(jié)點首批投入運營的智算中心之一,也是中國電子PKS體系國內(nèi)首個信創(chuàng)數(shù)據(jù)中心示范項目,該智算中心采用了飛騰信息技術(shù)有限公司的處理器,旨在為“東數(shù)西算”工程打造一個安全可信的算力基礎設施。

阿里巴巴張北智算中心

阿里巴巴云啟動了全球最大的智算中心,總算力達到12 EFLOPS,展示了其在人工智能基礎設施領(lǐng)域的領(lǐng)導地位。這些智算中心不僅提供強大的計算能力,還旨在通過人工智能技術(shù)為客戶提供解決方案,提升其競爭力和創(chuàng)新能力。同時,阿里巴巴在智算中心建設中還積極引入國產(chǎn)算力芯片,如平頭哥含光800、倚天710以及自主研發(fā)設計、基于RISC-V指令集架構(gòu)的處理器玄鐵910,通過一云多芯架構(gòu)透明接入計算集群,提升了系統(tǒng)的性能與效率,增強了算力的自主可控性,促進了國產(chǎn)芯片技術(shù)的發(fā)展與應用。

眾所周知,阿里巴巴在多年前就已開始推行“去IOE化”策略,旨在減少對外部技術(shù)的依賴,特別是在IT基礎設施層面。近年來,這一策略進一步擴展到更廣泛的國產(chǎn)軟硬件替代,包括操作系統(tǒng)、數(shù)據(jù)庫、服務器等,推動了整個產(chǎn)業(yè)鏈的國產(chǎn)化進程。

在全面自主可控大趨勢下,隨著技術(shù)的不斷成熟和生態(tài)的完善,智算中心的國產(chǎn)化進程將持續(xù)加速,國產(chǎn)硬件、操作系統(tǒng)和基礎軟件、云計算平臺和AI框架、算法和應用、安全可控的數(shù)據(jù)管理體系的份額持續(xù)提升。國產(chǎn)化的推進有助于降低技術(shù)被封鎖或限制的風險,增強供應鏈的安全性,同時也是推動國內(nèi)科技創(chuàng)新、促進產(chǎn)業(yè)自主發(fā)展的重要舉措。(未完待續(xù))

分享到

xiesc

相關(guān)推薦