物理核的優(yōu)勢(shì)越發(fā)明顯

x86的超線程本來(lái)是有優(yōu)勢(shì)的,而到了一定規(guī)模后,超線程帶來(lái)的提升會(huì)越來(lái)越小,資源爭(zhēng)奪帶來(lái)的影響會(huì)更大。而Graviton2的思路則是盡可能增加核心數(shù),用物理單核支撐單線程,架構(gòu)相對(duì)簡(jiǎn)潔,效率更高。

生態(tài)的問(wèn)題,借力云原生的發(fā)展浪潮來(lái)解決

有許多專家都認(rèn)為,ARM服務(wù)器最大的問(wèn)題不是性能,而是生態(tài),關(guān)鍵問(wèn)題在于,沒(méi)有軟件可以運(yùn)行在ARM服務(wù)器上。也有人認(rèn)為,ARM服務(wù)器除了功耗,各方面都被x86碾壓,總之,ARM服務(wù)器并不被看好。

2019年前后,高通在ARM服務(wù)器上的折戟對(duì)于ARM陣營(yíng)打擊非常大,而Marvell的Arm服務(wù)器芯片由于種種原因,也并不被看好。放眼望去國(guó)內(nèi)的ARM服務(wù)器陣營(yíng)也奮力向前沖,但似乎并沒(méi)有一個(gè)比較明確的發(fā)展前景。

AWS的Graviton則是從2018年發(fā)布之日起,就成了ARM服務(wù)器陣營(yíng)的一面旗幟,但用戶想要用Graviton2,免不了需要將x86應(yīng)用遷移到ARM架構(gòu),對(duì)應(yīng)的生態(tài)則顯得尤為重要。

據(jù)周舸介紹說(shuō),從第一代Graviton到現(xiàn)在已經(jīng)構(gòu)建了許多生態(tài),各種主流的Linux操作系統(tǒng)都能支持Graviton;Docker以及Amazon EKS(AWS的K8s托管服務(wù))等容器服務(wù),以及Amazon ERM這樣的Hadoop大數(shù)據(jù)服務(wù)、Amazon ElastiCache內(nèi)存數(shù)據(jù)庫(kù)服務(wù)也都支持Graviton。另外,AWS也提供了一些遷移工具。

除了遷移一部分原有的負(fù)載,另外一個(gè)重要的方向是借力云原生的發(fā)展趨勢(shì)。

AWS給Graviton的定位是云原生處理器,意在凸顯出對(duì)正在興起的云原生生態(tài)的支持。周舸表示,許多傳統(tǒng)企業(yè)也在支持云原生架構(gòu),一旦這些企業(yè)的應(yīng)用改造走向微服務(wù)化,也就更容易發(fā)揮Graviton2多核架構(gòu)的優(yōu)勢(shì)。

2020年re:Invent大會(huì)上,AWS發(fā)布了一系列容器和無(wú)服務(wù)器相關(guān)的產(chǎn)品和服務(wù),包括Amazon ECSAnywhere、Amazon EKS Anywhere,AmazonEKS的開(kāi)源發(fā)行版EKS-D和AWS Proton等等,堪比連珠炮一般的發(fā)布,反映出了云原生不可阻擋的大趨勢(shì),而Graviton2則是在借云原生的發(fā)展大勢(shì)。

生態(tài)另一層重要的意義在于,有大量實(shí)際應(yīng)用之后就可以降低單個(gè)芯片的成本,反過(guò)來(lái),大規(guī)模使用有利于保持成本優(yōu)勢(shì),兩者是良性循環(huán)。

幸運(yùn)的是,作為一家自產(chǎn)自銷的ARM服務(wù)器廠商,AWS自己就有大量部署,根本不用擔(dān)心ARM服務(wù)器銷路的問(wèn)題,因?yàn)?,每天有大量的AWS用戶在不知不覺(jué)中就用了Graviton。

在筆者看來(lái),這可能也意味著,原來(lái)x86一點(diǎn)點(diǎn)構(gòu)建生態(tài)的方式,也就是從底層基礎(chǔ)軟件到上層應(yīng)用的全方位布局的方式,在Graviton會(huì)不一樣。因?yàn)橛脩粲肎raviton的時(shí)候用的是服務(wù),而不只是一個(gè)處理器,不需要從芯片板卡整機(jī)從頭構(gòu)建系統(tǒng),因?yàn)楝F(xiàn)在是云時(shí)代,云原生的大時(shí)代。

性能是否能擔(dān)大任?

上文提到,Graviton路線是不用超線程技術(shù),所以,而是為每個(gè)核都設(shè)置了大緩存,避免了超線程兩個(gè)線程搶緩存的尷尬,使得單個(gè)物理核的性能變得更強(qiáng)。

由于性能的提升,Graviton服務(wù)器不僅能支持Web類、游戲模擬器之類的場(chǎng)景,Graviton開(kāi)始越來(lái)越多的支持MySQL和PostgreSQL這種關(guān)系型數(shù)據(jù)庫(kù),以及Redis這類內(nèi)存數(shù)據(jù)庫(kù)。

更有甚者,還有許多用戶在用Graviton最新的C6g來(lái)跑高性能計(jì)算場(chǎng)景,比如天氣預(yù)測(cè)、流體計(jì)算等工作負(fù)載,超算用戶其實(shí)已經(jīng)認(rèn)可了ARM的性能實(shí)力。

2020年的全球超算機(jī)TOP 500榜單中,使用大量48核ARM芯片的日本 Fugaku(富岳)超算機(jī)奪得榜首,這是ARM架構(gòu)首次登頂超算TOP500榜單。

在EDA領(lǐng)域的用戶對(duì)處理器的要求也非常高,但有三家EDA廠商也在使用Graviton2,而且跑出了非常優(yōu)異的性能,通常來(lái)說(shuō),搞電路設(shè)計(jì)的更懂芯片,這也可以看做專家型用戶對(duì)Graviton的認(rèn)可。

實(shí)際案例來(lái)看:遷移的成本與遷移后的收益

上文其實(shí)也提到了應(yīng)用遷移的問(wèn)題,但遷移究竟有多麻煩呢?

據(jù)了解,著名社交媒體Snap在很短時(shí)間內(nèi)就完成了從C5實(shí)例(x86)向C6g(Graviton)實(shí)例的遷移,將應(yīng)用運(yùn)行在EKS容器架構(gòu)中,性能也得到了非常大的提升。

Smart Mark的CTO表示,在2019年使用第一代Graviton的時(shí)候,應(yīng)用遷移花了一個(gè)星期時(shí)間,將前端應(yīng)用都導(dǎo)入到了Graviton實(shí)例。2020年,在向Graviton2遷移的時(shí)候,前后只用了一天時(shí)間。

微觀層面,遷移是個(gè)技術(shù)問(wèn)題,但從企業(yè)運(yùn)營(yíng)的層面,遷移是一個(gè)成本問(wèn)題,需要評(píng)估遷移的成本和遷移后得到的收益。

涂鴉智能是一家全球化的AI+IoT企業(yè),平臺(tái)需要支撐億級(jí)物聯(lián)網(wǎng)設(shè)備的網(wǎng)關(guān),在面對(duì)流量高峰時(shí)需要有較高的擴(kuò)展性,為了承載如此規(guī)模的訪問(wèn)量,涂鴉智能的架構(gòu)構(gòu)建在了AWS之上。

涂鴉云端開(kāi)發(fā)部首席架構(gòu)師陳亞焱介紹說(shuō),在向Graviton遷移后,據(jù)測(cè)試數(shù)據(jù)顯示,在負(fù)載一樣的情況下,M5g實(shí)例的x86處理器的占用率為27%,而M6g的Graviton的CPU占用率已經(jīng)降低到了12%以下

同時(shí),M6g的價(jià)格要比M5系列更便宜一些,如果算性價(jià)比的話,涂鴉智能的這次遷移后,計(jì)算部分整體的性價(jià)比提升了2.5倍。目前,涂鴉智能有40%的負(fù)載Graviton2實(shí)例上,下一階段將會(huì)把更多負(fù)載遷移上來(lái)。

“你我當(dāng)年”是大觥科技開(kāi)發(fā)的一個(gè)AI圖像處理APP,從大觥科技科技副總裁袁泉的介紹中了解到,該公司構(gòu)建的架構(gòu)也非??粗匦詢r(jià)比,經(jīng)比較發(fā)現(xiàn),基于ARM的C6g比同等配置的C5實(shí)例性價(jià)比高30%,成本上總體可以節(jié)省38%。

至于應(yīng)用負(fù)載的遷移方面,袁泉表示,“這個(gè)過(guò)程很簡(jiǎn)單,并沒(méi)有什么困難”。談到下一階段的規(guī)劃時(shí),也是計(jì)劃將更多負(fù)載遷移到Graviton2實(shí)例上。

針對(duì)場(chǎng)景“量體裁衣”,AWS居然構(gòu)建了近400種實(shí)例

AWS大中華區(qū)云服務(wù)產(chǎn)品管理總經(jīng)理顧凡用量體裁衣來(lái)形容為了滿足各種需求,AWS推出的各種各樣的服務(wù)。

在計(jì)算實(shí)例方面,AWS持續(xù)創(chuàng)新,持續(xù)針對(duì)各種場(chǎng)景推出各種實(shí)例,目前,AWS大約有400種實(shí)例,而且,每年推出的實(shí)例類型比一家專業(yè)服務(wù)器廠商還多。

在計(jì)算方面,AWS之所以能這么快推出這么多實(shí)例,很重要的一個(gè)原因就是有AWS Nitro。(相關(guān)閱讀:AWS Nitro:云主機(jī)價(jià)格戰(zhàn)終結(jié)者

AWS Nitro承載了主機(jī)實(shí)例的存儲(chǔ)和網(wǎng)絡(luò)的功能,主板上主要承載CPU就可以了,有了AWS Nitro之后,升級(jí)換代的時(shí)候計(jì)算和存儲(chǔ)以及網(wǎng)絡(luò)都能獨(dú)立升級(jí),升級(jí)處理器可以提升性能,升級(jí)Nitro卡,則存儲(chǔ)以及網(wǎng)絡(luò)等能力就得到了提升。

AWS Nitro還承載了Hypervisior的負(fù)載,從而交付更全量的計(jì)算資源,虛擬機(jī)本身的性能更充足。另外,Nitro本身作為一個(gè)小型系統(tǒng),它與許多硬件結(jié)合后,很快就能打造出新的實(shí)例,比如,前不久,AWS將Nitro與MacMini結(jié)合后,推出了全球第一個(gè)MacOS云實(shí)例。

由于有了Nitro的幫助,AWS能做出各種類型的實(shí)例,包括剛才提到的Graviton ARM實(shí)例,包括4GHz的實(shí)例,包括各種操作系統(tǒng)的實(shí)例,包括為存儲(chǔ)、網(wǎng)絡(luò)、計(jì)算、內(nèi)存等各種場(chǎng)景優(yōu)化的實(shí)例。

用顧凡的話來(lái)說(shuō):”近400種實(shí)例,每一個(gè)背后都有一個(gè)客戶應(yīng)用的場(chǎng)景?!?/p>

分享到

zhupb

相關(guān)推薦