騰訊云上目前提供的實例主要分為兩大系列:6代實例(S6、C6、M6),基于第三代英特爾至強(qiáng)處理器;以及8代實例(S8、M8),搭載第五代英特爾至強(qiáng)處理器。與原來使用的第三代至強(qiáng)相比,現(xiàn)在搭載第五代至強(qiáng)的實例性能提升尤為顯著。
首先,物理核心數(shù)量從36個提升到了56個,內(nèi)存帶寬從DDR4升級為DDR5,速率提升75%,并且PCIe帶寬也實現(xiàn)了翻倍。更值得一提的是,L3緩存從60MB增至320MB,提升了5倍,單核的IPC至少提升了25%。
英特爾資深技術(shù)專家表示,這些改進(jìn)使得在實際應(yīng)用中,騰訊云的實例可以處理更復(fù)雜的任務(wù),特別是在AI和大規(guī)模數(shù)據(jù)處理場景中表現(xiàn)優(yōu)異。
騰訊云將基于英特爾至強(qiáng)6構(gòu)建下一代CVM實例
下一階段,英特爾計劃推出更性能強(qiáng)大的至強(qiáng)6性能核處理器。首先,至強(qiáng)6性能核處理器的核心數(shù)量將增加到128個。內(nèi)存通道也將從8個擴(kuò)展到12個,并且,它的內(nèi)存速率將達(dá)到8800MT/s,提升1.57倍。
至強(qiáng)6還支持最新的MRDIMM,MRDIMM的優(yōu)勢在于通過多路復(fù)用技術(shù)優(yōu)化內(nèi)存數(shù)據(jù)傳輸,提升內(nèi)存系統(tǒng)的帶寬利用率和頻率性能,同時支持更高的容量和效率,適用于高性能計算和服務(wù)器環(huán)境。
至強(qiáng)6還引入了新的AI功能,支持FP16數(shù)據(jù)類型,可以為AI推理和訓(xùn)練提供更高精度的選擇。此外,它還支持CXL 2.0,支持各種CXL設(shè)備,為未來的內(nèi)存擴(kuò)展和池化奠定了中套基礎(chǔ)。
英特爾專家表示,英特爾也將用至強(qiáng)6助力騰訊打造下一代CVM實例。這些硬件提升將為云計算和AI提供更強(qiáng)大的支持,特別是在需要大規(guī)模數(shù)據(jù)處理和并發(fā)計算的場景中,至強(qiáng)6的性能將顯著超越其前代。
英特爾的架構(gòu)優(yōu)勢:獨特的網(wǎng)絡(luò)與內(nèi)存設(shè)計
相比競爭對手,英特爾至強(qiáng)處理器在架構(gòu)設(shè)計上具備兩大顯著優(yōu)勢。
首先,第五代英特爾至強(qiáng)由兩個Tile構(gòu)成,每個Tile最多32個物理核心,處理器最多64核。兩個Tile通過Mesh網(wǎng)絡(luò)連接,以確保核心之間的低延遲通信。
也就是說,英特爾的Mesh架構(gòu)通過網(wǎng)狀網(wǎng)絡(luò)連接所有的CPU核心,使得多核心的通信延遲顯著降低,這意味著它在多核并發(fā)任務(wù)中表現(xiàn)更為突出。
而AMD采用的是多個Die的小核心設(shè)計,通過中央的I/O Die連接多個Die,這種總線式架構(gòu)導(dǎo)致Die之間的通信隔離性較強(qiáng),跨Die時的延遲較高。
根據(jù)Java負(fù)載基準(zhǔn)測試發(fā)現(xiàn),在虛擬機(jī)核數(shù)較少時區(qū)別不大,但當(dāng)虛擬機(jī)超過24核時,英特爾至強(qiáng)處理器的多核性能明顯領(lǐng)先于對手,最高差出42%,展現(xiàn)了更強(qiáng)的擴(kuò)展性。
其次,內(nèi)存帶寬是影響處理器性能的關(guān)鍵因素之一,特別是在需要頻繁內(nèi)存讀寫的應(yīng)用中,如AI訓(xùn)練、游戲和科學(xué)計算。
第五代英特爾至強(qiáng)的加持,讓騰訊云S8 CVM單核內(nèi)存帶寬達(dá)到了3.2GB/s,基于AMD的SA4高33%,比基于AMD的SA5高出77%。
當(dāng)內(nèi)存帶寬不會輕易成為系統(tǒng)瓶頸,處理器可以更高效地執(zhí)行復(fù)雜任務(wù),在處理大規(guī)模并發(fā)任務(wù)時會更從容。
應(yīng)用場景:游戲、科學(xué)計算與數(shù)據(jù)處理
英特爾至強(qiáng)處理器的技術(shù)優(yōu)勢在多個行業(yè)的應(yīng)用中得到了驗證,尤其在游戲、科學(xué)計算和數(shù)據(jù)處理等領(lǐng)域表現(xiàn)尤為出色。
為游戲行業(yè)用戶提供更高性能和更低延遲
MMORPG、FPS、以及很多對戰(zhàn)游戲?qū)Ψ?wù)器的要求很高,特別是在并發(fā)計算和實時數(shù)據(jù)同步方面。游戲中的玩家行為涉及大量的時空矢量計算,這些計算需要在極短時間內(nèi)完成,同時還要同步大量數(shù)據(jù),以確保玩家實時看到其他玩家的動作。
首先,第五代英特爾至強(qiáng)通過更高的IPC性能和AVX-512指令集加速這些矢量計算,同時內(nèi)置的AI加速引擎能夠提升游戲中的AI表現(xiàn)。第五代英特爾至強(qiáng)在單核性能上比前代提升25%,能夠支持更多的玩家并發(fā)運行。
此外,搭載第五代英特爾至強(qiáng)的騰訊云S8云主機(jī)有更大的L3緩存、更高的內(nèi)存帶寬和網(wǎng)絡(luò)吞吐能力,這有助于減少延遲,確保更快的數(shù)據(jù)同步和更流暢的游戲體驗。
同時,采用第五代英特爾至強(qiáng)的騰訊云S8云主機(jī)在高密度部署時性能衰減更可控,適合游戲服務(wù)器的大規(guī)模部署。
最后,英特爾在游戲領(lǐng)域還提供了優(yōu)化的編譯器、渲染工具包和AI工具,幫助提升游戲開發(fā)和運行的性能。
英特爾與Riot Games合作的游戲《Valorant》就是一個典型案例。通過軟硬件優(yōu)化,英特爾幫助《Valorant》實現(xiàn)了128Tickrate的刷新率,帶來了更低延遲和更流暢的游戲體驗。《Valorant》在國服上線時,英特爾通過硬件升級和優(yōu)化,提升了用戶承載量。
科學(xué)計算領(lǐng)域,加速仿真與研發(fā)
在科學(xué)計算領(lǐng)域,英特爾至強(qiáng)處理器同樣有出色表現(xiàn)。通過與騰訊云和合作伙伴的聯(lián)合解決方案,基于英特爾至強(qiáng)處理器的云架構(gòu)能夠顯著提升并發(fā)計算的能力。
比如,騰訊云與速石科技合作,基于搭載英特爾至強(qiáng)實例的騰訊云服務(wù)器,建立了混合云存算分離架構(gòu)。該架構(gòu)使任務(wù)并發(fā)量提高了100%,仿真周期縮短了30%。
與晶泰科技合作的藥物研發(fā)案例中,英特爾不僅提供了硬件支持,還利用了OneAPI軟件生態(tài)庫。這個生態(tài)庫包含了科學(xué)計算所需的編譯器、數(shù)學(xué)庫、通信庫和并行庫,幫助優(yōu)化計算性能。
通過這套軟件優(yōu)化,總體性能提升了2.32倍,其中,切換到英特爾編譯器,性能提升了41%。通過使用英特爾數(shù)學(xué)庫,性能提升了28%。利用英特爾IPP中的AVX-512指令集,性能提升了38%。
提升數(shù)據(jù)庫性能
在數(shù)據(jù)處理領(lǐng)域,特別是數(shù)據(jù)庫的應(yīng)用中,英特爾至強(qiáng)憑借大容量的L3緩存和向量計算能力,顯著提升了數(shù)據(jù)庫的性能。例如,在MySQL數(shù)據(jù)庫的測試中,第五代英特爾至強(qiáng)比第三代英特爾至強(qiáng)在同等規(guī)格下,性能提升了40%。
小結(jié)
英特爾通過不斷創(chuàng)新,繼續(xù)在競爭激烈的通用計算市場中保持領(lǐng)先。通過與騰訊云等領(lǐng)先的云服務(wù)提供商的合作,英特爾至強(qiáng)處理器不僅在當(dāng)前應(yīng)用中展現(xiàn)了卓越的性能,還為未來的云計算和AI工作負(fù)載提供了堅實的基礎(chǔ)。