后來聽亞馬遜云科技的人介紹Graviton,說這是云原生處理器,最近聽Ampere的人介紹Ampere Altra,這才幡然醒悟,對云原生處理器的概念有了一點認(rèn)識,也漸漸認(rèn)可了這類Arm處理器更適合公有云的說法。

此前聽亞馬遜云科技的人介紹Graviton2,當(dāng)時印象最深的除了相比x86有最高40%的性價比優(yōu)勢,就是Graviton的單物理核心提供單線程的獨特設(shè)計,單個物理核有獨享的緩存,避免了核心之間爭搶緩存從而影響性能,使得性能和延遲表現(xiàn)會更穩(wěn)定。

Ampere 80核的Ampere Alta和128核的Ampere Alta Max也能實現(xiàn)顯著的降本增效。在基于Ampere Altra騰訊云SR1實例上,對NGINX、Redis、MySQL三種Web應(yīng)用程序中的關(guān)鍵工作負(fù)載進(jìn)行測試,所展現(xiàn)的性價比與基于x86架構(gòu)的S6云實例對比有平均50%以上的提升(數(shù)據(jù)來源)。

除此之外,由于比64核的Graviton核數(shù)多,所以,Ampere更清楚地展示了多核心的優(yōu)勢,隨工作負(fù)載的實例數(shù)量(即運行的線程數(shù))增長性能也表現(xiàn)出了近乎線性的增長,主頻可以達(dá)到3.0GHz以上,而x86在運行的實例數(shù)量(即運行的線程數(shù))增長到一定程度后,再增加核數(shù)的提升則非常有限。

這是Ampere Computing產(chǎn)品市場總監(jiān)孫開本在2022 OCP China上分享的一張圖,測試運行的是Encoding編碼工作負(fù)載,橫坐標(biāo)是并發(fā)的編碼任務(wù)數(shù),代表的是使用的線程數(shù),縱坐標(biāo)是性能數(shù)據(jù)。隨著任務(wù)數(shù)的增加,性能增長的趨勢有比較大的區(qū)別。

另外一張圖展示的是Ampere Altra Max的性能可預(yù)測性,也可以說是性能的穩(wěn)定性。

上圖測試跑的是Redis工作負(fù)載,在運行Redis負(fù)載的同時,定期間隔性地插入其他工作負(fù)載,隨著負(fù)載的加入和完成,觀察主工作負(fù)載的性能變化。如圖所示,Ampere Altra Max的上運行的Redis性能幾乎沒有變化,而x86的性能抖動則非常明顯。

孫開本在演講中表示,主要原因有兩點,一個是單核單線程的設(shè)計,另一個得益于優(yōu)秀的功耗控制。

SPEC測試:Ampere處理器實際功耗低于TDP,從而能使主頻穩(wěn)定

大致原理上,單核單線程的設(shè)計減少了核心之間的相互干擾,既有助于性能穩(wěn)定,也有助于讓性能隨著核數(shù)的增長而增長。同時,在功耗控制方面的優(yōu)勢,Ampere 不僅能讓所有運行的內(nèi)核保持一致的最大主頻,從而提升穩(wěn)定性,而且還使得堆更多核心成為可能。

功耗是芯片設(shè)計的重要考量因素,Ampere處理器主頻相對較低,波動范圍也很小,方便控制功耗,為了性能穩(wěn)定,甚至能保持在一定的主頻保持不動,不用擔(dān)心撞到功耗墻而降頻造成性能抖動。

當(dāng)然,x86也可以關(guān)掉超線程技術(shù),把頻率鎖在較低的水平,以此來提供更穩(wěn)定的性能表現(xiàn)。雖然此時x86的單核性能更強(qiáng),但由于核數(shù)太少,整體性能表現(xiàn)還未可知,況且,這種做法無異于自廢多年修煉來的武功,目前想這么用x86處理器的用戶應(yīng)該只能是少數(shù)。而且對于云服務(wù)提供商來說,關(guān)掉超線程就意味著同一平臺可售賣的核數(shù)減半,經(jīng)濟(jì)效益將大打折扣,很不劃算。

總之,單核提供單線程加上功耗優(yōu)勢,Ampere就有了更穩(wěn)定的性能表現(xiàn),更線性的性能增長表現(xiàn),而這,正是公有云廠商所需要的:

一方面,公有云希望用創(chuàng)新技術(shù)來降本增效。

Ampere的核數(shù)優(yōu)勢使得云數(shù)據(jù)中心的計算密度大大提升,節(jié)省數(shù)據(jù)中心的空間成本。同時,能用單臺設(shè)備能提供更多實例,服務(wù)于更多用戶。最終,降本增效的成果最后也會讓用戶受益。目前,通過使用基于Ampere Altra的云實例(阿里云c6r),國內(nèi)可觀測解決方案提供商觀測云也實現(xiàn)了40%的性價比提升。這點也可以參考AWS的Graviton。

另一方面,公有云希望給用戶提供更好的使用體驗。

很多用戶擔(dān)心“嘈雜鄰居”問題影響性能表現(xiàn),而Ampere方案的性能是能在所有時刻保持一個穩(wěn)定的表現(xiàn),讓云服務(wù)商提供始終如一的穩(wěn)定服務(wù),避免性能抖動影響業(yè)務(wù)。

以上,就是我看到的云廠商為什么會選擇Arm服務(wù)器的主要原因。

OCP China Day 2022活動主題就有“綠色”這一關(guān)鍵詞,數(shù)據(jù)中心作為全球用電大戶,在綠色低碳方面的工作也非常重要,Arm在低功耗方面的優(yōu)勢也有助于數(shù)據(jù)中心實現(xiàn)低碳目標(biāo),這也會是數(shù)據(jù)中心采用Arm服務(wù)器的一大推動因素。

雖然,x86架構(gòu)在未來很長時間仍會是主流,但Arm服務(wù)器也將有越來越多的用戶。如今,Arm的應(yīng)用生態(tài)取得了許多進(jìn)展。

一方面,AWS自研的Graviton 是Arm陣營的一面旗幟,讓更多人關(guān)注到甚至開始用Arm服務(wù)器,而Ampere這種Arm芯片廠商可以無障礙共享Arm應(yīng)用生態(tài)。

另一方面,Ampere的第三方處理器被Oracle、谷歌云、騰訊云、微軟Azure、阿里云等各大公有云廠商所采用。這些頭部廠商的帶動不僅將加速生態(tài)的發(fā)展,也讓Arm服務(wù)器CPU的市場份額出現(xiàn)快速的增長。根據(jù)研究公司Omdia的數(shù)據(jù)顯示,今年第二季度全球服務(wù)器出貨量為 340 萬臺,其中Arm架構(gòu)達(dá)到了創(chuàng)紀(jì)錄的 7.1%,份額同比增長了 48%。

此外,浪潮、超微、HPE、緯穎、技嘉等服務(wù)器廠商也都推出了服務(wù)器硬件,既服務(wù)于超大規(guī)模數(shù)據(jù)中心市場,也能服務(wù)于企業(yè)用戶。

Ampere官網(wǎng)上列舉了Ampere支持的六大類場景,包括:各種常見的機(jī)器學(xué)習(xí)框架,支持Arm的老本行(云手機(jī)、IoT、自動駕駛)、大數(shù)據(jù)分析工作負(fù)載、云原生應(yīng)用負(fù)載、云存儲和Web服務(wù)。

其中,云存儲部分的相對較少,目前只顯示了Ceph。而云原生應(yīng)用負(fù)載部分則非常豐富,官網(wǎng)上列舉了很多,在DockerHub上能看到4943個鏡像,數(shù)量上大約是x86的三分之一,目之所及的各種常用鏡像都有了。

今年五月份,Ampere公布了下一代處理器AmpereOne?的規(guī)劃,將采用5nm制程工藝,支持PCIe 5.0和DDR5,將采用定制的內(nèi)核,從而有更多靈活的設(shè)計空間。Ampere還表示,未來將保持每年一代產(chǎn)品的更新節(jié)奏。

前不久HPE發(fā)布的ProLiant RL300就是單路服務(wù)器,但在OCP China Day 2022活動現(xiàn)場,Ampere的展臺上放置了兩臺服務(wù)器全都是雙路服務(wù)器,雙路至少可以提供160核。

左側(cè)是浪潮NF5080R6,右側(cè)是一臺Mt.Jade

一臺是浪潮采用Ampere處理器的雙路服務(wù)器NF5080R6(“R”大概就是Arm的意思)。另一臺則是開源的Mt.Jade服務(wù)器,它是由Ampere貢獻(xiàn)給OCP的開源服務(wù)器,任何人都可以下載設(shè)計圖紙進(jìn)行制造和使用。

有專家表示,這是中國用戶的采購習(xí)慣所致,未來可能會有所改觀。

分享到

zhupb

相關(guān)推薦