總體而言,提升還是比較有誠意的。從公布的數(shù)據(jù)來看,Graviton4的計(jì)算性能整體比Graviton3提高了30%。其中,運(yùn)行MySQL數(shù)據(jù)庫的性能提高40%,運(yùn)行大型Java應(yīng)用的性能提高45%。

先來看看Graviton 4的主要參數(shù)

一到四代Graviton

從肉眼可見,Graviton4跟Graviton3一樣,都采用了Chiplet技術(shù),Chiplet技術(shù)也是Arm非常推薦的技術(shù)路線。

亞馬遜云科技首席布道師Jeff Barr在博客中提到,Graviton4采用的是96個(gè)Neoverse V2核心,每個(gè)核心獨(dú)享2MB的L2緩存,內(nèi)存方面提供12個(gè)DDR5-5600通道。

對(duì)比之下,上一代Graviton3核心數(shù)是64,這次直接提升了50%。內(nèi)存帶寬從之前的307GB/s提高到了536.7GB/s,整體提高了75%以上。L2 Cache也從1MB提升到了2MB,這些對(duì)性能的提升有很大幫助。

Neoverse V2 核心也叫被稱作”Demeter”核心,它基于ARMv9架構(gòu),主要面向HPC、云計(jì)算和超大規(guī)模數(shù)據(jù)中心市場(chǎng)。

ARM官方數(shù)據(jù)宣稱,與基于ARMv8架構(gòu)的Neoverse V1核心相比,Neoverse V2 的IPC提升了40%。此前,Graviton3和Graviton3E采用的就是Neoverse V1核心的ARMv8架構(gòu)。

Graviton4面向真實(shí)世界工作負(fù)載而優(yōu)化

從Amazon EC2 副總裁David Brown的介紹中看到,Graviton的設(shè)計(jì)是面向?qū)嶋H工作負(fù)載而優(yōu)化的,而不是面向跑分而優(yōu)化的。

為了說明什么是“為了實(shí)際工作負(fù)載而優(yōu)化”,他分享了這樣一張看似復(fù)雜,實(shí)際很簡(jiǎn)單的雷達(dá)圖。

雷達(dá)圖列舉了CPU微架構(gòu)中涉及的主要參數(shù)特性,具體又分成前端和后端兩大部分。

前端主要是指令相關(guān)的部分,而后端則是功能執(zhí)行單元為主。當(dāng)然,前后端之間還有指令控制器,負(fù)責(zé)把前端解碼出來的操作分發(fā)指令給執(zhí)行單元。

CPU微架構(gòu)需要前后端緊密協(xié)作。如果前端效率不高,會(huì)導(dǎo)致后端的執(zhí)行單元空等新指令,從而造成性能瓶頸。如果后端效率不高,執(zhí)行的速度太慢,新指令進(jìn)不來,那一樣會(huì)導(dǎo)致性能瓶頸。

雷達(dá)圖里還有數(shù)值,數(shù)值越小表示工作負(fù)載對(duì)該參數(shù)特性的依賴性越低,這意味著CPU的這一參數(shù)特征對(duì)整體性能的影響較小。

換句話說,低數(shù)值表明處理器在該工作負(fù)載下更有效率,數(shù)值越高表示該工作負(fù)載對(duì)它的依賴更高。有了這個(gè)雷達(dá)圖,就能讓CPU設(shè)計(jì)者面向?qū)嶋H工作負(fù)載做優(yōu)化,而不是按照基準(zhǔn)跑分測(cè)試的結(jié)果來優(yōu)化CPU。

上圖展示的是跑分測(cè)試時(shí)的一個(gè)情形,它會(huì)放大某些參數(shù)特性的影響。比如這里看到L3緩存那一項(xiàng)的數(shù)值特別的高,這會(huì)導(dǎo)致Back-end Stalls的值很高。此時(shí),后端不能再接受新的指令了,這將造成性能瓶頸。

這張圖右邊三個(gè)雷達(dá)圖展示的是Cassandra、Grovy以及Nginx,這三個(gè)應(yīng)用在處理真實(shí)世界工作負(fù)載時(shí)受不同參數(shù)特性影響的情況。可以看得出來,這些應(yīng)用同時(shí)受到多個(gè)不同參數(shù)特性的影響。如果要對(duì)真實(shí)世界的工作負(fù)載做優(yōu)化,就是得想辦法降低這些數(shù)值。

比如,像Graviton4相對(duì)于Graviton3做的事兒一樣。如上圖所示,Graviton4在運(yùn)行MySQL時(shí),在多個(gè)維度上的數(shù)值都有所下降,最終帶來40%的性能提升。當(dāng)然,這跟內(nèi)存帶寬等規(guī)格的提升也有很大關(guān)系。

無論如何,最后這張雷達(dá)圖上展示的,就是Graviton4面向真實(shí)世界的工作負(fù)載優(yōu)化。

Graviton4首發(fā)護(hù)航的EC2云主機(jī)

除了規(guī)格的提升,面向真實(shí)世界工作負(fù)載的優(yōu)化,面對(duì)日益復(fù)雜的安全威脅,Graviton4在安全方面也有新內(nèi)容。Graviton4不僅繼承了前一代處理器中的安全特性,還新增了加密的高速硬件接口來以保護(hù)數(shù)據(jù)的安全性和完整性。

同時(shí),Graviton4還新增了分支目標(biāo)識(shí)別(BTI-Branch Target Identification )功能,它可以用來確保代碼分支跳轉(zhuǎn)到正確的目標(biāo)地址,防止惡意軟件利用代碼中的跳轉(zhuǎn)指令跳轉(zhuǎn)到意圖以外的代碼段,從而提高系統(tǒng)的安全性。

與往年一樣,新的Graviton4處理器也帶著采用該處理器的新款EC2主機(jī),相伴而來。

這次護(hù)航發(fā)布(預(yù)覽版)的首款EC2是R8g,R8g屬于內(nèi)存優(yōu)化型實(shí)例,相較于上一代的R7g,R8g的vCPU數(shù)量和內(nèi)存容量都提高了三倍。

這使得R8g在面對(duì)高性能數(shù)據(jù)庫,大數(shù)據(jù)分析等有大量數(shù)據(jù)集的場(chǎng)景時(shí)更有優(yōu)勢(shì)。R8g的發(fā)布給內(nèi)存敏感型負(fù)載提供了更高的性價(jià)比和能效表現(xiàn)。

2018年,亞馬遜云科技發(fā)布第一代自研Graviton處理器,亞馬遜云科技成了第一個(gè)開發(fā)自研通用服務(wù)器處理器的云廠商,這也是Arm服務(wù)器陣營重新站起來的標(biāo)志性事件。

早期用戶拿Graviton處理器運(yùn)行微服務(wù)和Web應(yīng)用,成本節(jié)省了很多,為了擴(kuò)大優(yōu)勢(shì),后來又發(fā)布了性能更強(qiáng)的Graviton 2,再然后推出的Graviton 3在性能和能效方面的表現(xiàn)繼續(xù)提升。

其實(shí),去年還發(fā)布了Graviton3的升級(jí)版——Graviton3E,它主要優(yōu)化了在浮點(diǎn)運(yùn)算和向量運(yùn)算場(chǎng)景中的表現(xiàn),這種都是高性能計(jì)算領(lǐng)域才比較關(guān)注的能力。

現(xiàn)在看來,2018年亞馬遜云科技發(fā)布的Graviton處理器以及對(duì)應(yīng)的云主機(jī),確實(shí)給服務(wù)器市場(chǎng)帶來了很大影響。憑借更多核心帶來的高性能,單核單線程的穩(wěn)定性能輸出,超高的能效比優(yōu)勢(shì),還有肉眼可見的成本優(yōu)勢(shì),Arm終于在數(shù)據(jù)中心服務(wù)器市場(chǎng)搶占了一席之地。

隨后有第三方Arm服務(wù)器廠商也接連推出了多款A(yù)rm處理器,這些處理器陸續(xù)被一些云廠商所采用。前不久,另外一家國際性的公有云大廠宣布推出了128核的Arm處理器,無疑是Arm陣營的又一次勝利。

這些Arm處理器經(jīng)常會(huì)被云廠商自己用在自家提供的服務(wù)中,包括各種托管服務(wù)和Serverless服務(wù),Arm已是數(shù)據(jù)中心不可缺少的一部分,而造成這種新局面的帶頭人,就是亞馬遜云科技。

分享到

zhupb

相關(guān)推薦