阿里巴巴集團(tuán)研究員、阿里云智能彈性計(jì)算產(chǎn)品線負(fù)責(zé)人張獻(xiàn)濤

眾所周知,阿里巴巴在每一項(xiàng)產(chǎn)品和解決方案面市之前,都會(huì)在公司內(nèi)部進(jìn)行驗(yàn)證,確保為客戶提供最完美最成熟的服務(wù)。這一過(guò)程,始于公司成立之初,從十年前開始,持續(xù)至今。

值得注意的是,第三代神龍架構(gòu)性能暴漲160%,但成本卻有接近50%的下降。更高的性能,更低的價(jià)格,阿里云的競(jìng)爭(zhēng)優(yōu)勢(shì)一目了然。

服務(wù)客戶的十年,也是阿里云更懂業(yè)務(wù)場(chǎng)景的十年

過(guò)去十年來(lái),你感覺到了生活中哪些不同尋常的變化?

10年前預(yù)訂快餐需要撥打,如今只需動(dòng)動(dòng)手指外賣即可到家;10年前雙11購(gòu)物只能夠支撐5000萬(wàn)元的交易,去年的雙11已經(jīng)支撐到了2684億元;10年前買車票要到火車站車徹夜排隊(duì),如今在12306 APP上輕松完成,即使是春節(jié)搶票也不再遲緩;10年前,到政府機(jī)會(huì)辦一件事情需要跑很多次,如今,只需要跑一次就解決所有的問(wèn)題……

“這些社會(huì)效率的提升,背后都是云計(jì)算在發(fā)揮著巨大的作用。”過(guò)去15年間一直工作在云計(jì)算的第一線,經(jīng)歷了云計(jì)算從無(wú)到有、從弱到強(qiáng)這樣一個(gè)過(guò)程的張獻(xiàn)濤回憶說(shuō)。

云計(jì)算是一系列的產(chǎn)品和服務(wù)組成的新的計(jì)算模式,其最基礎(chǔ)最核心的功能就是彈性計(jì)算服務(wù)。阿里云在2010年的5月10日首個(gè)商業(yè)化的產(chǎn)品就是彈性計(jì)算產(chǎn)品,即ECS1.0;借助ECS1.0從服務(wù)中小企業(yè)的站長(zhǎng)開始,到2015年發(fā)布ECS2.0服務(wù)12306 APP這種極具挑戰(zhàn)的業(yè)務(wù)場(chǎng)景,再到2017年發(fā)布神龍架構(gòu)、承擔(dān)雙11這種世界級(jí)壓力,到今天阿里云以22個(gè)地域構(gòu)建的63個(gè)大型數(shù)據(jù)中心,服務(wù)起了全球互聯(lián)網(wǎng)、零售、制造、政務(wù)、金融等上千萬(wàn)家行業(yè)客戶;而在中國(guó),超過(guò)80%的科技創(chuàng)新企業(yè)都運(yùn)行在阿里云上。

技術(shù)的發(fā)展也改變著客戶的觀念。用戶從早期被推動(dòng)上云,變成了主動(dòng)上云,嘗到了甜頭后在性能、穩(wěn)定性、彈性等方面的訴求也與日俱增,這既成為阿里云引入人工智能、大數(shù)據(jù)等最新技術(shù),不斷進(jìn)行產(chǎn)品更新迭代的動(dòng)力,更是阿里云不斷發(fā)展和成功的動(dòng)因。

10年的變遷之后,可以說(shuō)阿里云更懂業(yè)務(wù)場(chǎng)景,和客戶之間的距離其實(shí)更近了。

洞悉市場(chǎng)三大訴求,徹底消除客戶后顧之憂

作為更懂業(yè)務(wù)、與客戶距離更近的體現(xiàn),是阿里云對(duì)客戶的訴求的理解也逐漸清晰起來(lái)。張獻(xiàn)濤表示,客戶至少在業(yè)務(wù)的永續(xù)、極致的性能和對(duì)資源極速?gòu)椥孕枨髮?duì)云計(jì)算充滿渴求。

業(yè)務(wù)的永續(xù),意味著業(yè)務(wù)運(yùn)行永遠(yuǎn)不停機(jī)。

在數(shù)據(jù)中心時(shí)代,傳統(tǒng)企業(yè)經(jīng)常由于各種各樣軟硬件的故障飽受宕機(jī)的苦惱,他們對(duì)云計(jì)算寄予厚望。云計(jì)算的確消除了他們的后顧之憂——過(guò)去十年服務(wù)用戶過(guò)程中,阿里云在全球配置了數(shù)百萬(wàn)臺(tái)服務(wù)器,匯集了大量硬件故障相關(guān)的信息,通過(guò)和達(dá)摩院的算法科學(xué)家的合作,借助機(jī)器學(xué)習(xí)和人工智能等先進(jìn)的技術(shù)準(zhǔn)確預(yù)測(cè)即將發(fā)生的故障,提前將客戶的業(yè)務(wù)以熱遷移的模式遷移到健康的機(jī)器上,防患風(fēng)險(xiǎn)的發(fā)生,預(yù)測(cè)準(zhǔn)確率到達(dá)99%以上。

極致的性能:業(yè)務(wù)遷云之后,業(yè)務(wù)的性能會(huì)變得更好嗎?

為了能夠更加追求更加極致的計(jì)算性能,阿里云自研了神龍計(jì)算平臺(tái)、盤古存儲(chǔ)平臺(tái)和洛神網(wǎng)絡(luò)平臺(tái)、以及軟硬一體化的深度優(yōu)化;自研服務(wù)器、交換機(jī)、含光芯片、與英特爾聯(lián)合深度定制的CPU。

自主品牌的操作系統(tǒng)Alibaba Cloud Linux 2.0 LTS,在云平臺(tái)之間形成更好的合力,釋放出來(lái)更極致的性能;在計(jì)算層面,去年阿里云參加斯坦福大學(xué)的DAWNBench圖片識(shí)別競(jìng)賽,整體優(yōu)化的計(jì)算獲得了4項(xiàng)世界第一;在網(wǎng)絡(luò)和存儲(chǔ)方面,阿里云的性能也都是業(yè)界領(lǐng)先。

對(duì)資源極速?gòu)椥缘脑V求:既要承受波峰時(shí)對(duì)平臺(tái)算力急劇提升的需求,也要滿足在波谷時(shí)對(duì)平臺(tái)算力大幅分流造成的影響。

例如,微博經(jīng)常需要彈出數(shù)倍甚至數(shù)百倍于平時(shí)的算力去應(yīng)對(duì)熱點(diǎn)事件,在數(shù)分鐘之內(nèi)需要提供數(shù)十萬(wàn)甚至上百萬(wàn)核的算力。這在IT資源的擴(kuò)充建設(shè)以月為周期提供的傳統(tǒng)時(shí)代是很難完成的。經(jīng)過(guò)深度優(yōu)化,Alibaba Cloud Linux 2.0整個(gè)實(shí)例的交付僅需11秒,而使用彈性容器實(shí)例(ECI),僅需一秒鐘就可以為客戶去交付所需的算力。

除了上述三大訴求,阿里云還推出了自助服務(wù)。

不是所有的客戶都會(huì)提出自助服務(wù)這個(gè)訴求,但在和客戶的溝通過(guò)程中,阿里云發(fā)現(xiàn)他們經(jīng)常會(huì)遇到這些方面的挑戰(zhàn)。為此,阿里云也準(zhǔn)備了相關(guān)的解決方案:在遷云階段,一鍵式的遷移上云服務(wù)中心可幫助客戶讓線下的業(yè)務(wù)上云輕而易舉;在交付部署階段,多樣性的架構(gòu)加資源編排,為客戶業(yè)務(wù)整體平穩(wěn)發(fā)展奠定良好的基礎(chǔ);在運(yùn)行階段,ESS這樣的服務(wù)可幫助客戶進(jìn)行計(jì)算資源的彈性容量伸縮,隨需而動(dòng);在運(yùn)維階段,自主診斷服務(wù)提供了自動(dòng)化的運(yùn)維編排能力,讓客戶免人力運(yùn)維,為業(yè)務(wù)在云上的發(fā)展保駕護(hù)航。

張獻(xiàn)濤表示,10年之內(nèi),阿里云重構(gòu)了計(jì)算的服務(wù)模式,具備了服務(wù)全業(yè)務(wù)場(chǎng)景的能力。

基于第三代神龍?jiān)品?wù)器打造的ECS六代增強(qiáng)型實(shí)例全球開售

基于第三代神龍?jiān)萍軜?gòu)的服務(wù)器,阿里云構(gòu)建了新一代的ECS產(chǎn)品家族,其中包含了第六代增強(qiáng)型實(shí)例、第七代高主頻實(shí)例、內(nèi)存增強(qiáng)硬實(shí)例、GPU和NPU云服務(wù)器、超級(jí)計(jì)算集群以及非易失性內(nèi)存APE實(shí)例和可信云實(shí)例。

在7月15日召開的發(fā)布會(huì)上,張獻(xiàn)濤宣布,基于第三代神龍?jiān)品?wù)器打造的ECS六代增強(qiáng)型實(shí)例全球開售。

第三代神龍?jiān)品?wù)器為ECS帶來(lái)哪些方面的價(jià)值?張獻(xiàn)濤解釋說(shuō),ECS第六代增強(qiáng)型實(shí)例由三部分組成。

在計(jì)算方面,自研了輕量級(jí)的Dragonfly Hypervisor,擺脫KVM、XEN一類傳統(tǒng)虛擬化架構(gòu),Dragonfly Hypervisor,不僅資源占用少,在虛擬化的效率提升方面也非常明顯,在計(jì)算的抖動(dòng)性方面可以降到百萬(wàn)分之一的級(jí)別;在存儲(chǔ)方面,第六代增強(qiáng)型實(shí)例全系標(biāo)配ESSD云盤,具備單盤100萬(wàn)IOPS的能力,超過(guò)第二名8倍以上,每秒吞吐量可達(dá)到4GB,每一次快照備份可以在5秒鐘之內(nèi)實(shí)現(xiàn),此外,其單路讀延遲最低200微秒,友商最好的水平也超過(guò)300us,寫延遲能力100us,遠(yuǎn)勝于其他云廠商最優(yōu)的400us;在網(wǎng)絡(luò)能力方面,最強(qiáng)可以提供單實(shí)例2400萬(wàn)PPS的轉(zhuǎn)發(fā)能力,業(yè)界最好的水平也才1000萬(wàn)IOPS,每一個(gè)數(shù)據(jù)包最低延遲為21us,而其他廠商最好的水平也超過(guò)30us。

除了單點(diǎn)性能,E2E端到端的性能方面,同樣選擇主流的三家云廠商加載相同規(guī)格的實(shí)例對(duì)比,在MySQL場(chǎng)景,阿里云性能最高領(lǐng)先190%,Nginx場(chǎng)景最高領(lǐng)先86%,Redis場(chǎng)景最高領(lǐng)先103%。

顯然,無(wú)論是單向的性能還是綜合的性能,第六代增強(qiáng)型實(shí)例比業(yè)界其他云廠商更具有很強(qiáng)的競(jìng)爭(zhēng)力和優(yōu)勢(shì)。

在張獻(xiàn)濤看來(lái),第六代增強(qiáng)型實(shí)例是集大成者,它繼承了第三代神龍?jiān)品?wù)器的幾乎所有的優(yōu)點(diǎn)。

通過(guò)第三代神龍架構(gòu),阿里云全面提升了神龍?jiān)品?wù)器的服務(wù)能力,自研的軟硬一體化的架構(gòu),大幅度提升計(jì)算效率和網(wǎng)絡(luò)存儲(chǔ)方面的服務(wù)能力。

“神龍服務(wù)器的整體性能之所以能暴漲160%,得益于在架構(gòu)上能更好地支持四路的服務(wù)器,吞吐能力的提升也是一個(gè)重要的因素?!睆埆I(xiàn)濤說(shuō)。

第三代神龍?jiān)品?wù)器不僅提供全計(jì)算場(chǎng)景的覆蓋,作為云原生的最佳載體,以極致性能、靈活彈性以及多計(jì)算形態(tài),開啟了超性能時(shí)代。

不斷推陳出新,神龍架構(gòu)迎接新的10年

回顧過(guò)去十年,阿里云和客戶一路攜手同行,通過(guò)不斷磨合,打造了今天具有競(jìng)爭(zhēng)力的彈性計(jì)算的產(chǎn)品序列;阿里云不僅深入了解客戶的需求,而且更加懂得創(chuàng)新的內(nèi)涵和價(jià)值。

展望下一個(gè)十年,阿里云勢(shì)必將繼續(xù)著眼于客戶的產(chǎn)品需求,加大在技術(shù)創(chuàng)新、產(chǎn)品資源方面的投入;預(yù)計(jì)增加了對(duì)本地盤支持、充實(shí)更多豐富功能的、第四代神龍架構(gòu)也會(huì)很快亮相,一代一代新品的問(wèn)世,在阿里云服務(wù)客戶能力進(jìn)一步提升的同時(shí),也不斷優(yōu)化客戶的業(yè)務(wù)水平,為整個(gè)社會(huì)創(chuàng)造更大的價(jià)值。

分享到

xiesc

相關(guān)推薦