作為造價極高的AI加速系統(tǒng),DGX B300可以不計成本地選任何CPU,只要它能充分的發(fā)揮整套系統(tǒng)的性能。選擇英特爾至強6作為默認推薦的CPU配置,這意味著它能很好地滿足需求,也意味大量AI加速系統(tǒng)會搭載這款英特爾處理器。
在AI服務器中,CPU其實很重要,它不僅要運行操作系統(tǒng),還要負責協(xié)調GPU的工作、管理系統(tǒng)資源,支撐整個AI系統(tǒng)穩(wěn)定運行。此前,來自IDC的數(shù)據(jù)顯示,有73%的GPU加速服務器都在使用英特爾至強處理器作為主控CPU。
從技術細節(jié)看,主控CPU需要和GPU協(xié)同工作。因此,CPU在I/O、核心性能、內存(容量和帶寬)、CPU上的預處理或卸載(offload)能力、RAS特性,以及對于多種形態(tài)的AI服務器架構的支持,都會影響整個AI系統(tǒng)的性能。
英特爾至強6:理想主控CPU的優(yōu)勢解析
首先,我們從產品角度來簡要介紹一下,為什么英偉達會選擇英特爾至強6處理器作為推薦配置?
首先,在I/O部分,英特爾至強6性能核處理器最多支持96個PCIe 5.0通道,相較于第五代至強可擴展處理器增加了20%。像DGX B300這種雙路服務器系統(tǒng),PCIe總數(shù)能來到192個。
在CPU核心部分,英特爾至強6支持最多128個性能核心,相較于上代直接翻倍。平均單核性能提升20%,平均每瓦性能提升高達1.6倍,同等性能水平下平均可以節(jié)省30%的TCO。并且還具備卓越的單線程能力。
在內存部分,英特爾至強6支持DDR5-6400MT/s、最高達8800MT/s的MRDIMM內存以及CXL技術,可提供更大內存帶寬和更大內存容量。其中,英特爾至強6性能核還將內存通道數(shù)從8個提升到了12個,整體內存帶寬和內存容量都有了大幅提升。
英特爾至強6可以更好地支持在CPU上做預處理和卸載,這一部分會用到高級矩陣擴展(AMX)。因為現(xiàn)在的MoE模型越來越多,在CPU上做一些卸載工作現(xiàn)在變成了很熱點的話題,英特爾和很多合作伙伴也在進行積極探索。
英特爾至強6支持專門的RAS(Reliability, Availability, Serviceability)功能,它可以減少系統(tǒng)宕機時間。這次英偉達的DGX B300采用的是雙路服務器,豐富的RAS特性支持可以顯著減少宕機時間,提高系統(tǒng)資源的利用率。
因此,不管是英偉達的DGX(英偉達的一體化平臺)、MGX(英偉達開放給合作伙伴的模塊化服務器設計規(guī)范),還是DC-MHS全球標準(英特爾牽頭的模塊化標準架構),英特爾至強6都可以靈活支持。
2025年5月下旬,英特爾發(fā)布了三款新的性能核處理器,分別是6962P、6776P以及6774P。其中,6776P被用作英偉達的DGX B300系統(tǒng)的主控CPU,為什么要選擇這款處理器呢?
為什么選英特爾至強6776P做DGX B300的主控CPU?
此前,推薦作為英偉達DGX主控的CPU型號是6767P,這是一個64核的處理器,它的基礎頻率是2.4GHz,全核睿頻是3.6GHz,最大睿頻來到了3.9GHz。
6776P也是一塊64核的處理器,基礎頻率是2.3GHz,全核睿頻是3.6GHz,最大睿頻是3.9GHz。得益于英特爾創(chuàng)新的PCT技術,最高主頻提升到了4.6GHz,更高的主頻可以讓數(shù)據(jù)更快傳遞到GPU,從而提高GPU在高強度工作負載下的性能。
PCT指的是英特爾Priority Core Turbo技術,它讓部分核心成為高優(yōu)先級的核心,相應的,其他的核心就是低優(yōu)先級。搭配英特爾Speed Select睿頻頻率(Intel SST-TF)技術,讓高優(yōu)先級的核心以更高的主頻工作。
英特爾官方用這種方式把少數(shù)核心拉到更高頻率,意味著用戶可以不用額外考慮散熱等問題,還能保證可以長時間穩(wěn)定運行。
英特爾此次發(fā)布的3款支持PCT的至強處理器當中,6774P是單路CPU,6776P和6962P是雙路CPU。為了獲得更高的4.6GHz PCT頻率,又因為要支持雙路服務器,所以要選6776P。
雙路的DGX B300可以提供176條Gen 5.0通道。內存部分,在DGX B300系統(tǒng)中,它只支持8個內存通道,為了追求更大容量,這里采用了2 DPC的設置,每個通道配置2個DIMM,雙路理論最高容量為8TB,可以更好地應對未來更大數(shù)據(jù)規(guī)模。
上方在AI系統(tǒng)中使用至強6為主控CPU的示意圖中,有兩塊CPU帶著8塊GPU,8塊GPU之間通過NVLink互連,兩塊CPU之間通過UPI互連。
6776P最多支持8個PCT核心,也就是讓8個核心運行在高頻率,用戶可以根據(jù)需求選擇8個、6個、4個或2個。
PCT核心的設置也比較簡單,一種是在BIOS里進行設置,把一定數(shù)量的核心設定為PCT高核心。另外一種是通過SST的TF工具進行設置,在系統(tǒng)運行時可以動態(tài)配置調整,這種方式更便捷。
從英特爾專家的介紹中了解到,這三款處理器都是英特爾至強常規(guī)產品路線圖中的一部分,三款產品都是可以面向所有客戶開放的標準產品,而不是為特定用戶特定場景定制的特殊方案。
對于選擇DGX B300的用戶來說,6776P已是默認選項。如果是MGX用戶,則可以使用此前已發(fā)布的6767P。理論上,英特爾至強6的所有型號都支持作為AI加速計算系統(tǒng)的主控CPU,用戶在選用時可以根據(jù)實際需求作出選擇。