作為數(shù)字化轉(zhuǎn)型的重要基礎(chǔ)之一,云計算為企業(yè)提供了數(shù)字化轉(zhuǎn)型的核心驅(qū)動力,正以超前的速度普及。許多企業(yè)借助云計算快速成長,在細分領(lǐng)域取得了驚人成績,但也有一些企業(yè)沒能充分利用到云服務(wù)“按需使用”的最大優(yōu)勢,云上成本較高。

為了解決以上問題, 2019年的云棲大會上,阿里云聯(lián)合Mobvista匯量科技推出大型彈性集群管理平臺SpotMax,旨在幫助更多企業(yè)構(gòu)建符合云端特點的系統(tǒng)架構(gòu),充分利用云端高彈性資源助力企業(yè)享受云計算帶來的技術(shù)紅利。

SpotMax的故事從一份軍令狀說起

2017年,隨著Mobvista移動互聯(lián)網(wǎng)廣告業(yè)務(wù)的爆發(fā),流量激增進一步帶動企業(yè)云成本大幅提升。彼時的Mobvista已經(jīng)在降低云端成本上做了好幾輪嘗試,包括對低CPU利用率機器的合并淘汰,對數(shù)據(jù)存儲的優(yōu)化,購買Resolve Instance預留實例等。但是云資源成本問題仍然給公司帶來了巨大的挑戰(zhàn)。在此背景下, Mobvista創(chuàng)始人段威找到了蔡超,他相信蔡超一定有方法降低Mobvista的用云成本。

朋友公司的一些用云現(xiàn)狀,加之段威的這次邀請,讓蔡超意識到 ,在云端構(gòu)建成本可控的大規(guī)模系統(tǒng)是一個非常有價值的嘗試,蔡超覺得應(yīng)該為此做一點什么。于是他請辭當時的工作單位正式加入Mobvista,擔任首席架構(gòu)師一職,并立下軍令狀,將Mobvista的用云成本降低至少40%。

充分利用云端彈性資源完成軍令狀

進入Mobvista后,蔡超首先對Mobvista的系統(tǒng)架構(gòu)進行優(yōu)化,將Mobvista原本的云單體系統(tǒng)向云原生架構(gòu)進行改造。構(gòu)建了一個分布式的微服務(wù)架構(gòu),使得系統(tǒng)更加具有彈性、更高可用性,也能更好地利用云端的高彈性資源。

阿里云全球化部署的數(shù)據(jù)中心,讓Mobvista離各地用戶足夠近。同時,Mobvista結(jié)合阿里云的彈性伸縮服務(wù)與spot搶占式實例等基礎(chǔ)設(shè)施,研發(fā)出一套云端集群管理平臺SpotMax。

彈性伸縮是阿里云的一種資源管理服務(wù),可以根據(jù)用戶的業(yè)務(wù)運行狀況和彈性策略,自動創(chuàng)建和釋放資源。而搶占式實例是阿里云推出的一種低成本競價實例,類似于廣告競價模式。企業(yè)需要在創(chuàng)建搶占式實例時指定出價價格,當指定實例的市場價格低于企業(yè)出價且?guī)齑娉渥銜r,用戶即可按照出價購買并使用該實例1小時。而1小時后,當市場價格高于企業(yè)指定價格,實例會自動釋放。

搶占式實例的生命周期(來源于阿里云)

據(jù)蔡超介紹,搶占式實例的價格通常情況下僅為按需實例的20%左右、因此利用阿里云搶占式實例,無疑是降低企業(yè)用云成本的有效方式之一。但如何降低實例被釋放時對業(yè)務(wù)造成的風險呢?這是大多數(shù)企業(yè)使用搶占式實例時最為擔憂的問題,此前Mobvista正是由于這一原因才選擇較為保守的預留實例模式,而非最高性價比的搶占式實例。

對此,SpotMax通過產(chǎn)品化的手段降低搶占式實例的釋放率,尋找資源和成本之間的平衡點,在保證系統(tǒng)可用性的前提下,有效降低了企業(yè)用云成本。

最終,Mobvista實現(xiàn)了單位廣告請求成本降低約65%,蔡超完成了當初立下的軍令狀。隨后,為幫助更多企業(yè)節(jié)省云成本,更好利用云端高彈性資源。Mobvista將自身成功的經(jīng)驗產(chǎn)品化,聯(lián)合阿里云推出了大型彈性集群管理平臺SpotMax。旨在充分發(fā)揮阿里云搶占式實例價格優(yōu)勢的同時,智能化維護并保證集群穩(wěn)定。幫助更多企業(yè)輕松享受更高性價比的優(yōu)質(zhì)云服務(wù)。

實現(xiàn)了同等算力下,SpotMax最高可為企業(yè)節(jié)省90% 的用云成本,而在相同的預算內(nèi),SpotMax則可以將企業(yè)享受的算力提升10倍。

阿里云搭線,SpotMax首戰(zhàn)告捷

SpotMax推出后,很快便迎來了第一家企業(yè)用戶。一家轉(zhuǎn)型DSP廣告投放的公司經(jīng)阿里云推薦找到了Mobvista。

據(jù)了解,該公司在轉(zhuǎn)型DSP廣告投放業(yè)務(wù)后,每日所需的用云資源量波動巨大,為滿足資源波峰,需增加大量的用云成本。為解決成本問題,該公司CEO開始思考如何最大化利用阿里云搶占式實例特點,達到既滿足自己企業(yè)的彈性業(yè)務(wù)需求,又盡可能地壓低成本。

了解到該公司的訴求后,阿里云第一時間便想到了SpotMax。阿里云技術(shù)同學回憶,“當時,我們首先便想到了通過SpotMax解決這家企業(yè)的用云成本問題,因為該企業(yè)所面臨的的困境與當初Mobvista所面臨的困境非常類似,同時DSP廣告業(yè)務(wù)也與Mobvista的業(yè)務(wù)具有共通性”他認為能夠大幅節(jié)省Mobvista用云成本的SpotMax同樣適用于該企業(yè)。

蔡超回憶,拿到該企業(yè)的需求后,團隊第一時間針對導致其云成本上升的原因進行了分析,很快便發(fā)現(xiàn)當時該企業(yè)的服務(wù)器機型規(guī)格大不易伸縮,缺乏靈活性。這也直接導致了流量增加后,該企業(yè)用云成本增加,業(yè)務(wù)拓展難的問題。蔡超表示,目前大多數(shù)企業(yè)的現(xiàn)有架構(gòu)都是在云誕生之前搭建的,傳統(tǒng)的架構(gòu)模型很難有效利用云計算帶來的彈性優(yōu)勢。他進一步解釋道“目前市場上并沒有一本關(guān)于架構(gòu)的書可以解決企業(yè)上云成本高的問題,很多分布式的書,包含MIT相關(guān)的書,都是在云之前就寫的,因此并不符合云的特點?!?/p>

了解Mobvista已通過SpotMax在過去兩年節(jié)省幾千萬美元用云成本支出后,該企業(yè)迅速與Mobvista達成了合作。據(jù)該企業(yè)CEO透露,之所以這么快達成合作,是因為他們自身的業(yè)務(wù)與Mobvista具有高度的共通性,通過Mobvista的成功經(jīng)驗,他們 “既看到了遠大的方向也看到了落地的實際行動”,最終通過SpotMax,該企業(yè)實現(xiàn)了單位請求成本節(jié)約50%,并在財年結(jié)算中實現(xiàn)盈利。同時通過SpotMax對原有的架構(gòu)進行優(yōu)化后,進一步找到了更多的業(yè)務(wù)可能性。這對于他們來說,“可謂是意外之喜”該CEO在與阿里云及Mobvista的溝通中如是說道。

全面挖掘云計算技術(shù)紅利

現(xiàn)實中,由于企業(yè)自身架構(gòu)不符合云的特點而導致企業(yè)用云成本居高不下的案例并不少見。蔡超表示,上云并不等于用好云,上云不是單純地將企業(yè)業(yè)務(wù)平遷到云端,而是一個不斷實踐探索如何用好云的過程。因此,SpotMax在設(shè)計過程中充分考慮到了企業(yè)上云用云的多方面訴求,不僅是幫助企業(yè)節(jié)省上云和用云成本這么簡單,還為企業(yè)提供更全面的服務(wù)。

據(jù)蔡超介紹,SpotMax方案共包含三個部分:MaxArch、MaxChaos和MaxGroup。其中MaxArch提供對企業(yè)現(xiàn)有架構(gòu)的評估以及向云端遷移和云原生架構(gòu)的設(shè)計;MaxChaos主要提供混沌工程服務(wù),可幫助企業(yè)持續(xù)提高系統(tǒng)的可用性;而MaxGroup則是Spot Instance集群管理服務(wù),通過集群防退化、Spot Instance集群推薦及基于強化學習的混合集群負載均衡等,幫助企業(yè)節(jié)省用云成本。

究竟什么樣的企業(yè)更適合使用SpotMax呢?蔡超表示,原則上只要使用云服務(wù)的企業(yè),都可以使用SpotMax的服務(wù)。不過,擁有大量用戶請求,需要快速響應(yīng)、與用戶體驗極為相關(guān)的場景,SpotMax的作用會更為突出,比如,程序化廣告、電商、電子政務(wù)、企業(yè)管理服務(wù)(CRM,ERP)和高性能計算等行業(yè)。

之所以選擇與阿里云合作推出SpotMax,蔡超表示,是由于阿里巴巴擁有服務(wù)企業(yè)的完整生態(tài)。有數(shù)據(jù)顯示,截至2019年年底,全球已有超300萬家企業(yè)在使用阿里云。

本文來源:鳳凰網(wǎng)

分享到

songjy

相關(guān)推薦