然而,當(dāng)前的現(xiàn)實(shí)情況是有效算力供給已無法滿足算力需求:
一方面,從儲備到應(yīng)用的算力需求都愈發(fā)旺盛,OpenAI CEO召集全球投資者組建聯(lián)盟為大模型構(gòu)建基礎(chǔ)設(shè)施,馬斯克的無人駕駛出租車Cybercab為科技行業(yè)描繪了未來感十足的面面,還有性能愈發(fā)強(qiáng)大的GPT-o1等模型層出不窮。
另一方面,數(shù)據(jù)中心的算力潛能尚未被完全挖掘出來。數(shù)據(jù)中心常被認(rèn)為是“耗電怪獸”,因?yàn)榉?wù)器運(yùn)行伴隨著熱量釋放,溫度一旦超過極限值,服務(wù)器性能就會顯著降低,限制數(shù)據(jù)中心算力發(fā)揮。于是各類創(chuàng)新技術(shù)涌現(xiàn),試圖讓數(shù)據(jù)中心再次突破能效瓶頸,釋放出被束縛的算力潛能。
這背后的關(guān)鍵變量就是冷卻技術(shù),液冷技術(shù)作為推手幫助數(shù)據(jù)中心一次次突破制約。就在2024年聯(lián)想集團(tuán)Tech World上,聯(lián)想集團(tuán)董事長兼CEO楊元慶與NVIDIA創(chuàng)始人兼CEO黃仁勛,這兩大全球科技行業(yè)頂尖企業(yè)的領(lǐng)軍者同臺,聯(lián)合發(fā)布全新液冷AI服務(wù)器,勇闖“最大工業(yè)革命”。
液冷技術(shù)正逐漸成為數(shù)據(jù)中心解決能耗問題的關(guān)鍵
在AI芯片架構(gòu)持續(xù)升級的浪潮中,高算力往往伴隨高功耗的需求。這一趨勢使得英偉達(dá)的部分產(chǎn)品功耗已突破風(fēng)冷技術(shù)的極限,因此液冷技術(shù)已經(jīng)從原先的可選配置晉升為“必備配置”。隨著全球AI服務(wù)器需求強(qiáng)勁,液冷技術(shù)有望迎來量價(jià)齊升,為高算力架構(gòu)提供堅(jiān)實(shí)支撐。
自計(jì)算技術(shù)誕生之日起,能耗與冷卻便如同雙生之花,相互依存、相互制約,歷經(jīng)無數(shù)次的較量與博弈,在數(shù)據(jù)中心追求算力發(fā)展躍遷的百年歷程中,譜寫出一首冰與火的史詩。而這背后的基礎(chǔ)設(shè)施出現(xiàn)過各種頗具實(shí)驗(yàn)性的形態(tài),比如1985年,美國Cray-2超級計(jì)算機(jī)采用單相強(qiáng)制對流浸沒式液體冷卻系統(tǒng),芯片被整個浸入冷卻液中,極具科幻感和視覺沖擊力。
2018年,F(xiàn)acebook在其數(shù)據(jù)中心首次使用蒸發(fā)冷卻技術(shù),創(chuàng)新性的省去了最耗電的機(jī)械壓縮循環(huán)系統(tǒng),使用100%自然風(fēng)蒸發(fā)冷卻、加濕系統(tǒng)。
放眼未來,面向量子計(jì)算機(jī)的冷卻技術(shù)更為“神奇”,比如中國科學(xué)技術(shù)大學(xué)的研究團(tuán)隊(duì)提出了麥克斯韋妖式量子算法冷卻方法,通過光學(xué)干涉裝置搭建成冷卻模塊,實(shí)現(xiàn)量子系統(tǒng)的逐步冷卻……
目光聚焦當(dāng)下。2024年聯(lián)想Tech World上,聯(lián)想集團(tuán)董事長兼CEO楊元慶,與NVIDIA創(chuàng)始人兼CEO黃仁勛同臺登場,科技界兩大頂尖領(lǐng)軍者共同發(fā)布搭載聯(lián)想第六代Neptune海神液冷解決方案的AI服務(wù)器。在數(shù)據(jù)中心這個算力的心臟中,海神液冷技術(shù)如同一股清泉,為高密度計(jì)算提供了冷靜而高效的血液,為全世界的AI注入動力。
2024年11月15日,伴隨2024/2025財(cái)年Q2財(cái)報(bào),聯(lián)想集團(tuán)發(fā)布《Game of AI》系列知識科普視頻的第二集《數(shù)據(jù)中心:如何與世界交換算力》。 視頻延續(xù)桌面電影形式,通過《權(quán)力的游戲》風(fēng)格的開場片頭,復(fù)刻北境冰雪氣候變化,打造亦真亦幻的三維沙盤動畫,以此緊扣液冷主線。
同時(shí),視頻還以兩條科技樹線索,介紹了數(shù)據(jù)中心和能效的角逐演進(jìn)歷程,采用冰雪白為主的配色方案與模擬芯片的三維結(jié)構(gòu),融入液冷主題。
聯(lián)想集團(tuán)最新發(fā)布的第六代Neptune海神
聯(lián)想集團(tuán)最新發(fā)布的第六代Neptune海神液冷解決方案,可以為生成式AI高效計(jì)算提供動力。這在當(dāng)下對于數(shù)據(jù)中心算力效率提升的重要性不言而喻。
通過視頻中聯(lián)想集團(tuán)梳理的數(shù)據(jù)中心百年發(fā)展歷史,我們發(fā)現(xiàn),數(shù)據(jù)中心的算力與能耗密切相關(guān),二者共同掌握著能量密碼。
人類對算力的利用由來已久,但隨著信息技術(shù)革命到來,算力的性能和規(guī)模迎來爆發(fā),算力需求逐漸多元化,深入汽車、大模型等各種應(yīng)用場景。
2024年,算力提升的關(guān)鍵已經(jīng)從狂堆硬件轉(zhuǎn)向提升效率,如今數(shù)據(jù)中心需要的革命是基建效率的角力。目標(biāo)是在充分利用數(shù)據(jù)中心已有硬件設(shè)備的基礎(chǔ)上,使其發(fā)揮出更高能耗并提供更強(qiáng)大的算力。視頻以桌面電影第一視角,通過網(wǎng)頁、文件等多樣化載體提取信息,給觀眾帶來更多操控互動感受。
在明確數(shù)據(jù)中心效率這一概念的同時(shí),需要先搞清楚一個指標(biāo)——TDP熱設(shè)計(jì)功耗。這指的就是當(dāng)芯片達(dá)到最大負(fù)荷時(shí)熱量釋放的指標(biāo),也是冷卻系統(tǒng)要面對的重大挑戰(zhàn)。
一旦超過這一極限值,處理器的溫度繼續(xù)升高,就會導(dǎo)致數(shù)據(jù)中心的性能降低,讓芯片發(fā)揮計(jì)算能力的前提就是,處理器運(yùn)行過程中產(chǎn)生的熱量和冷卻技術(shù)的散熱能力達(dá)到平衡。
因此提升基建能效,將其從能耗制約下拯救出來的關(guān)鍵就是冷卻技術(shù)。二者相互制約又相互關(guān)聯(lián),共同決定了數(shù)據(jù)中心的穩(wěn)定運(yùn)行和能源利用效率。
Iceotope推出KUL AI液冷服務(wù)器
獲悉,2024年11月12日精密液體冷卻的全球領(lǐng)導(dǎo)者Iceotope今天宣布推出KUL AI,這是一種新的解決方案,可在任何地方提供AI的承諾,并在增強(qiáng)熱管理和最大服務(wù)器性能至關(guān)重要的情況下提供顯著的運(yùn)營優(yōu)勢。
KUL AI采用基于8GPU技嘉? G293數(shù)據(jù)中心服務(wù)器的解決方案,集成了Iceotope的精確液體冷卻,并由英特爾?至強(qiáng)可擴(kuò)展處理器提供支持,這是Iceotope迄今為止集成的最強(qiáng)大的服務(wù)器。8GPUG293專為支持密集GPU計(jì)算而設(shè)計(jì),獲得了NVIDIA認(rèn)證解決方案認(rèn)證,并針對使用介電流體的液體冷卻進(jìn)行了優(yōu)化。KUL AI 通過保持最佳溫度、保護(hù)關(guān)鍵IT組件和最大限度地降低故障率來確保不間斷、可靠的計(jì)算性能,即使在持續(xù)的GPU運(yùn)行期間也是如此。
AI負(fù)載推動液冷滲透率提升
在AI技術(shù)引領(lǐng)的數(shù)字經(jīng)濟(jì)時(shí)代,AI算力需求持續(xù)狂飆,同時(shí)承載AI算力的芯片電力功耗不斷提升,并帶來高昂的碳排放代價(jià)。
數(shù)據(jù)顯示,作為算力中樞的數(shù)據(jù)中心在AI工作負(fù)載的激增需求下,深陷能耗泥沼。根據(jù)IDC測算,預(yù)計(jì)到2027年,AI數(shù)據(jù)中心容量的復(fù)合年增長率 (CAGR) 將達(dá)到 40.5%,與此同時(shí) AI 數(shù)據(jù)中心的能源消耗預(yù)計(jì)將以44.7%的CAGR增長,到2027年達(dá)到146.2太瓦時(shí) (TWh)。
耗電越高,間接碳排放就越高,在綠色發(fā)展共識下,AI算力需求爆發(fā)下的節(jié)能降碳解決方案刻不容緩。為有效地應(yīng)對AI算力功耗挑戰(zhàn),應(yīng)用液冷技術(shù)已成為當(dāng)前業(yè)界共識,由此也帶動液冷散熱方案在2024年的滲透率將達(dá)到 10%,到2025年提升至 20%。
目前,算力廠商正積極布局液冷技術(shù),進(jìn)一步驅(qū)動液冷散熱滲透率提升。如英偉達(dá)以其新一代的Blackwell GPU,大幅提升了散熱設(shè)計(jì)功率(TDP),并宣稱其未來所有GPU產(chǎn)品的散熱技術(shù)都將轉(zhuǎn)為液冷。大型云廠商作為AI算力的主要采購者,通過布局基于英偉達(dá)GPU的AI服務(wù)器,也帶動液冷技術(shù)的縱深應(yīng)用。TrendForce 稱,隨著全球ESG意識提升,加上CSP(云廠商)加速建設(shè)AI服務(wù)器,將帶動散熱方案從風(fēng)冷轉(zhuǎn)向液冷形式。
在算力核心基礎(chǔ)設(shè)施的服務(wù)器層面,液冷技術(shù)將推動液冷服務(wù)器蓬勃發(fā)展。中金公司指出,AI服務(wù)器算力提升使得智算中心單機(jī)柜功率密度大幅增長,既需要使用液冷技術(shù)實(shí)現(xiàn)有效降溫,也使得液冷技術(shù)相較于傳統(tǒng)風(fēng)冷技術(shù)實(shí)現(xiàn)成本經(jīng)濟(jì)性,市場有動力自發(fā)推動液冷技術(shù)在AI服務(wù)器上的廣泛普及。
我國作為AI發(fā)展大國,正不斷加大對液冷數(shù)據(jù)中心的投入力度,根據(jù)賽迪顧問統(tǒng)計(jì),今年上半年,我國公開招投標(biāo)的液冷數(shù)據(jù)中心中標(biāo)數(shù)量超過去年同期的3倍,2024H1新建智算中心基本都應(yīng)用了液冷技術(shù)。
我國液冷數(shù)據(jù)中心爆發(fā),為液冷服務(wù)器市場的高速增長帶來了強(qiáng)勁動能。IDC 預(yù)計(jì),2023-2028年,中國液冷服務(wù)器市場年復(fù)合增長率將達(dá)到45.8%,2028年市場規(guī)模將達(dá)到102億美元。
結(jié)語
算力已經(jīng)成為人工智能進(jìn)入真實(shí)的產(chǎn)業(yè)環(huán)境中不可或缺的核心要素,液冷技術(shù)更高效地帶走高溫,使算力可持續(xù),讓數(shù)據(jù)中心源源不斷與世界交換算力。如今,AI重塑整個世界運(yùn)行邏輯,算力正是其堅(jiān)實(shí)的底座。正如聯(lián)想集團(tuán)打造的視頻結(jié)尾所說,“服務(wù)器與數(shù)據(jù)中心作為千行百業(yè)的基礎(chǔ)設(shè)施建設(shè),將重新定義AI作為生產(chǎn)力的能量源泉,并以世界之力再造世界”。(文/宋雨涵)