作為造價(jià)極高的AI加速系統(tǒng),DGX B300可以不計(jì)成本地選任何CPU,只要它能充分的發(fā)揮整套系統(tǒng)的性能。選擇英特爾至強(qiáng)6作為默認(rèn)推薦的CPU配置,這意味著它能很好地滿足需求,也意味大量AI加速系統(tǒng)會搭載這款英特爾處理器。
在AI服務(wù)器中,CPU其實(shí)很重要,它不僅要運(yùn)行操作系統(tǒng),還要負(fù)責(zé)協(xié)調(diào)GPU的工作、管理系統(tǒng)資源,支撐整個(gè)AI系統(tǒng)穩(wěn)定運(yùn)行。此前,來自IDC的數(shù)據(jù)顯示,有73%的GPU加速服務(wù)器都在使用英特爾至強(qiáng)處理器作為主控CPU。
從技術(shù)細(xì)節(jié)看,主控CPU需要和GPU協(xié)同工作。因此,CPU在I/O、核心性能、內(nèi)存(容量和帶寬)、CPU上的預(yù)處理或卸載(offload)能力、RAS特性,以及對于多種形態(tài)的AI服務(wù)器架構(gòu)的支持,都會影響整個(gè)AI系統(tǒng)的性能。
英特爾至強(qiáng)6:理想主控CPU的優(yōu)勢解析
首先,我們從產(chǎn)品角度來簡要介紹一下,為什么英偉達(dá)會選擇英特爾至強(qiáng)6處理器作為推薦配置?
首先,在I/O部分,英特爾至強(qiáng)6性能核處理器最多支持96個(gè)PCIe 5.0通道,相較于第五代至強(qiáng)可擴(kuò)展處理器增加了20%。像DGX B300這種雙路服務(wù)器系統(tǒng),PCIe總數(shù)能來到192個(gè)。
在CPU核心部分,英特爾至強(qiáng)6支持最多128個(gè)性能核心,相較于上代直接翻倍。平均單核性能提升20%,平均每瓦性能提升高達(dá)1.6倍,同等性能水平下平均可以節(jié)省30%的TCO。并且還具備卓越的單線程能力。
在內(nèi)存部分,英特爾至強(qiáng)6支持DDR5-6400MT/s、最高達(dá)8800MT/s的MRDIMM內(nèi)存以及CXL技術(shù),可提供更大內(nèi)存帶寬和更大內(nèi)存容量。其中,英特爾至強(qiáng)6性能核還將內(nèi)存通道數(shù)從8個(gè)提升到了12個(gè),整體內(nèi)存帶寬和內(nèi)存容量都有了大幅提升。
英特爾至強(qiáng)6可以更好地支持在CPU上做預(yù)處理和卸載,這一部分會用到高級矩陣擴(kuò)展(AMX)。因?yàn)楝F(xiàn)在的MoE模型越來越多,在CPU上做一些卸載工作現(xiàn)在變成了很熱點(diǎn)的話題,英特爾和很多合作伙伴也在進(jìn)行積極探索。
英特爾至強(qiáng)6支持專門的RAS(Reliability, Availability, Serviceability)功能,它可以減少系統(tǒng)宕機(jī)時(shí)間。這次英偉達(dá)的DGX B300采用的是雙路服務(wù)器,豐富的RAS特性支持可以顯著減少宕機(jī)時(shí)間,提高系統(tǒng)資源的利用率。
因此,不管是英偉達(dá)的DGX(英偉達(dá)的一體化平臺)、MGX(英偉達(dá)開放給合作伙伴的模塊化服務(wù)器設(shè)計(jì)規(guī)范),還是DC-MHS全球標(biāo)準(zhǔn)(英特爾牽頭的模塊化標(biāo)準(zhǔn)架構(gòu)),英特爾至強(qiáng)6都可以靈活支持。
2025年5月下旬,英特爾發(fā)布了三款新的性能核處理器,分別是6962P、6776P以及6774P。其中,6776P被用作英偉達(dá)的DGX B300系統(tǒng)的主控CPU,為什么要選擇這款處理器呢?
為什么選英特爾至強(qiáng)6776P做DGX B300的主控CPU?
此前,推薦作為英偉達(dá)DGX主控的CPU型號是6767P,這是一個(gè)64核的處理器,它的基礎(chǔ)頻率是2.4GHz,全核睿頻是3.6GHz,最大睿頻來到了3.9GHz。
6776P也是一塊64核的處理器,基礎(chǔ)頻率是2.3GHz,全核睿頻是3.6GHz,最大睿頻是3.9GHz。得益于英特爾創(chuàng)新的PCT技術(shù),最高主頻提升到了4.6GHz,更高的主頻可以讓數(shù)據(jù)更快傳遞到GPU,從而提高GPU在高強(qiáng)度工作負(fù)載下的性能。
PCT指的是英特爾Priority Core Turbo技術(shù),它讓部分核心成為高優(yōu)先級的核心,相應(yīng)的,其他的核心就是低優(yōu)先級。搭配英特爾Speed Select睿頻頻率(Intel SST-TF)技術(shù),讓高優(yōu)先級的核心以更高的主頻工作。
英特爾官方用這種方式把少數(shù)核心拉到更高頻率,意味著用戶可以不用額外考慮散熱等問題,還能保證可以長時(shí)間穩(wěn)定運(yùn)行。
英特爾此次發(fā)布的3款支持PCT的至強(qiáng)處理器當(dāng)中,6774P是單路CPU,6776P和6962P是雙路CPU。為了獲得更高的4.6GHz PCT頻率,又因?yàn)橐С蛛p路服務(wù)器,所以要選6776P。
雙路的DGX B300可以提供176條Gen 5.0通道。內(nèi)存部分,在DGX B300系統(tǒng)中,它只支持8個(gè)內(nèi)存通道,為了追求更大容量,這里采用了2 DPC的設(shè)置,每個(gè)通道配置2個(gè)DIMM,雙路理論最高容量為8TB,可以更好地應(yīng)對未來更大數(shù)據(jù)規(guī)模。
上方在AI系統(tǒng)中使用至強(qiáng)6為主控CPU的示意圖中,有兩塊CPU帶著8塊GPU,8塊GPU之間通過NVLink互連,兩塊CPU之間通過UPI互連。
6776P最多支持8個(gè)PCT核心,也就是讓8個(gè)核心運(yùn)行在高頻率,用戶可以根據(jù)需求選擇8個(gè)、6個(gè)、4個(gè)或2個(gè)。
PCT核心的設(shè)置也比較簡單,一種是在BIOS里進(jìn)行設(shè)置,把一定數(shù)量的核心設(shè)定為PCT高核心。另外一種是通過SST的TF工具進(jìn)行設(shè)置,在系統(tǒng)運(yùn)行時(shí)可以動態(tài)配置調(diào)整,這種方式更便捷。
從英特爾專家的介紹中了解到,這三款處理器都是英特爾至強(qiáng)常規(guī)產(chǎn)品路線圖中的一部分,三款產(chǎn)品都是可以面向所有客戶開放的標(biāo)準(zhǔn)產(chǎn)品,而不是為特定用戶特定場景定制的特殊方案。
對于選擇DGX B300的用戶來說,6776P已是默認(rèn)選項(xiàng)。如果是MGX用戶,則可以使用此前已發(fā)布的6767P。理論上,英特爾至強(qiáng)6的所有型號都支持作為AI加速計(jì)算系統(tǒng)的主控CPU,用戶在選用時(shí)可以根據(jù)實(shí)際需求作出選擇。