阿里巴巴集團(tuán)研究員、阿里云彈性計(jì)算產(chǎn)品線負(fù)責(zé)人、阿里云無(wú)影產(chǎn)品線負(fù)責(zé)人張獻(xiàn)濤

以下內(nèi)容根據(jù)速記整理,未經(jīng)演講者審定。

與客戶共同進(jìn)步

迄今為止,阿里云已經(jīng)在全球25個(gè)地域部署了80多個(gè)大型云數(shù)據(jù)中心,服務(wù)了超過(guò)300萬(wàn)用戶,行業(yè)總數(shù)超過(guò)200個(gè)。在這個(gè)過(guò)程中,阿里云積累了大量有意義和價(jià)值的客戶案例。

1.云上奧運(yùn)會(huì)

由于新冠疫情的影響,東京奧運(yùn)會(huì)推遲到了2021年,阿里巴巴作為奧委會(huì)全球頂級(jí)合作伙伴全程參與其中。本次奧運(yùn)會(huì)最大的一個(gè)亮點(diǎn)就是“云上奧運(yùn)”。

阿里云彈性計(jì)算產(chǎn)品為全球奧運(yùn)盛會(huì)直播提供了超強(qiáng)的算力支持:轉(zhuǎn)播時(shí)長(zhǎng)超過(guò)9500個(gè)小時(shí),官網(wǎng)APP的訪問(wèn)人數(shù)超過(guò)了1.75億。由于數(shù)字化程度的提升,轉(zhuǎn)播中心面積減少了25%,現(xiàn)場(chǎng)工作人員數(shù)量縮減了27%,可以說(shuō),這次由阿里云技術(shù)支持的“云上奧運(yùn)”完美收官。

奧委會(huì)主席巴赫的所言是對(duì)阿里云最高的肯定:“今年奧運(yùn)會(huì)是數(shù)字化程度最為高的一屆奧運(yùn)會(huì)?!?/p>

2.應(yīng)對(duì)惡劣天氣

南方電網(wǎng)是中國(guó)比較知名的電網(wǎng)公司,為廣東、廣西、云南、貴州以及海南、香港、澳門提供電力服務(wù)。惡劣天氣對(duì)電力的影響是巨大的。阿里云和南方電網(wǎng)合作推出了國(guó)內(nèi)首個(gè)神龍?jiān)瞥闫脚_(tái),大幅提升了天氣預(yù)報(bào)的精細(xì)化水平以及預(yù)測(cè)臺(tái)風(fēng)的精準(zhǔn)度。今年的第七號(hào)臺(tái)風(fēng)襲來(lái)時(shí),神龍超算云超算平臺(tái)以超出普通的云服務(wù)器5倍的能力有效地支撐了南方電網(wǎng)在臺(tái)風(fēng)天的應(yīng)急指揮:提前七天預(yù)測(cè)臺(tái)風(fēng)的動(dòng)向、每秒鐘浮點(diǎn)運(yùn)算次數(shù)達(dá)到825萬(wàn)億次、每30分鐘輸出一份詳細(xì)的報(bào)告。

3.支持貧困地區(qū)教學(xué)

眾所周知,云計(jì)算給人們的生活帶來(lái)了很多的科技紅利。如何讓處于欠發(fā)達(dá)地區(qū)的中小學(xué)生也能夠像大城市的青少年一樣享受云計(jì)算帶來(lái)的紅利呢?

阿里巴巴集團(tuán)CEO張勇在今年云棲大會(huì)上宣布了一個(gè)“少年云計(jì)劃”,向欠發(fā)達(dá)地區(qū)捐贈(zèng)1萬(wàn)個(gè)云電腦機(jī)房,助力改善欠發(fā)達(dá)地區(qū)中小學(xué)的科技教育隨時(shí)隨地用上最新的技術(shù)。“少年云計(jì)劃”已經(jīng)啟動(dòng),阿里云也希望更多的合作伙伴參與進(jìn)來(lái),為欠發(fā)達(dá)地區(qū)的中小學(xué)教育添磚加瓦。

國(guó)際權(quán)威機(jī)構(gòu)認(rèn)可:計(jì)算能力衛(wèi)冕全球第一

在過(guò)去的一年內(nèi),阿里云除了服務(wù)好客戶以外也在苦練內(nèi)功。

根據(jù)Gartner的最新評(píng)測(cè),阿里云的計(jì)算產(chǎn)品在綜合服務(wù)能力方面再次衛(wèi)冕第一的寶座。這份報(bào)告整體的評(píng)測(cè)非常詳盡,對(duì)于綜合能力的評(píng)測(cè)相當(dāng)?shù)轿?。僅在計(jì)算這個(gè)領(lǐng)域就有272個(gè)評(píng)分項(xiàng)。在這次評(píng)測(cè)中,阿里云的計(jì)算再次拿到了第一,IaaS和PasS也獲得了綜合能力第三的好成績(jī)。

阿里云的付出換來(lái)了更多客戶的成功,自己也得到了快速成長(zhǎng)。

當(dāng)然,阿里云也不會(huì)止步于此,而是在更大的維度上做出創(chuàng)新,在技術(shù)方面做得更加深厚,在產(chǎn)品方面做得更加豐富,在服務(wù)方面做的更加智能,讓智能化的服務(wù)變成主流。

在生態(tài)方面,阿里云也是追求更加的開放,與合作伙伴“共贏共生”。

持續(xù)推動(dòng)技術(shù)的創(chuàng)新和升級(jí)

在技術(shù)方面,阿里云持續(xù)推動(dòng)技術(shù)的創(chuàng)新和升級(jí)又取得了新的成果。

1.第四代神龍架構(gòu)

阿里云發(fā)布了第四代神龍架構(gòu),也是最強(qiáng)的神龍DPU技術(shù)架構(gòu)。

今年有一個(gè)非常熱的投資浪潮,就是投資DPU。已經(jīng)大規(guī)模應(yīng)用并且性能指標(biāo)最強(qiáng)的DPU,就是神龍DPU。這個(gè)DPU 2017年阿里云帶領(lǐng)團(tuán)隊(duì)業(yè)界首創(chuàng)研發(fā)出的新的技術(shù)架構(gòu),引領(lǐng)了DPU技術(shù)發(fā)展的浪潮。

DPU是軟件定義的技術(shù)架構(gòu),在云計(jì)算中用于數(shù)據(jù)的加速和服務(wù)質(zhì)量的提升,同時(shí)又可以降低成本。在過(guò)去的四年里,阿里云作為DPU技術(shù)的發(fā)明者和領(lǐng)導(dǎo)者,發(fā)布總共發(fā)布了四代神龍架構(gòu),一代比一代的技術(shù)能力都要強(qiáng)。第四代神龍架構(gòu),提供了大規(guī)模的RDMA的組網(wǎng)能力。

傳統(tǒng)的這種RDMA的能力組網(wǎng)基本上都是在千臺(tái)規(guī)模就上線,神龍架構(gòu)下的RDMA的能力其實(shí)可以做到數(shù)10萬(wàn)臺(tái)的RDMA的規(guī)模。這樣的能力可以大大加速云上業(yè)務(wù)的創(chuàng)新。

2.大規(guī)模分布式調(diào)度技術(shù)資源管控和調(diào)度系統(tǒng)

經(jīng)過(guò)12年的開發(fā)和迭代,管理著數(shù)百萬(wàn)臺(tái)的物理服務(wù)器,通過(guò)提供APP將底層的資源做到可編程化,滿足客戶的自動(dòng)化和一些高級(jí)的需求。超大規(guī)模的智能故障預(yù)測(cè)系統(tǒng),可以提前識(shí)別出來(lái)硬件的故障,利用神龍熱遷移技術(shù),可以讓客戶的業(yè)務(wù)在無(wú)感的情況下做到故障的提前規(guī)避,阿里云還具備業(yè)界最高穩(wěn)定性,單實(shí)例可以做到99.975%的穩(wěn)定性,一致性的體驗(yàn),也方便了客戶在云邊端使用一套代碼來(lái)進(jìn)行集成,降低了整體的復(fù)雜度,方便業(yè)務(wù)的創(chuàng)新。

在資源調(diào)度方面,彈性其實(shí)是核心能力,每天都有數(shù)百萬(wàn)臺(tái)的被創(chuàng)建和釋放出來(lái),滿足客戶的極致需求。

阿里云通過(guò)了IDC大規(guī)模的性能測(cè)試,也是唯一一個(gè)通過(guò)了信通院云平臺(tái)大規(guī)模彈性性能測(cè)試的云服務(wù)廠商,可以在數(shù)分鐘之內(nèi)彈出幾十萬(wàn)核的算力,在5秒之內(nèi)交付3000個(gè)的容器實(shí)力,滿足客戶對(duì)于彈性資源的極致需求。

在計(jì)算領(lǐng)域,近年來(lái)最為亮眼的一個(gè)領(lǐng)域是AI。達(dá)摩院今年在11月份發(fā)布的訓(xùn)練模型參數(shù)已經(jīng)達(dá)到了10萬(wàn)億次。應(yīng)對(duì)這樣一個(gè)巨量模型,對(duì)算力提出了更高的這種需求。阿里云基于RDMA網(wǎng)絡(luò)的800G GPU超算實(shí)例,不僅能夠利用神龍架構(gòu)的能力,更多的網(wǎng)絡(luò)帶寬讓計(jì)算通信變得暢通無(wú)阻,分布式訓(xùn)練方面表現(xiàn)性能強(qiáng)勁。同時(shí),通過(guò)AIACC飛天加速引擎的整體加速,整個(gè)集群的效能提升了9.75倍之多,不論什么樣的規(guī)模,上十臺(tái)也好數(shù)百臺(tái)也罷,采用 fastGPU這種部署服務(wù),通過(guò)API編程就可以把原來(lái)需要幾個(gè)小時(shí)幾天的部署個(gè)時(shí)間壓縮到5分鐘之內(nèi)。

3.大規(guī)模彈性RDMA技術(shù),為數(shù)據(jù)時(shí)代而生

RDMA是讓云計(jì)算和傳統(tǒng)IT產(chǎn)生本質(zhì)區(qū)別的技術(shù)。

隨著互聯(lián)網(wǎng)數(shù)據(jù)量的增大,分布式計(jì)算的規(guī)模也越來(lái)越大,而大規(guī)模集群間的大量數(shù)據(jù)傳輸?shù)拈_銷其實(shí)也是非常大的,給CPU帶來(lái)的負(fù)擔(dān)也是隨之加重的。阿里云在神龍架構(gòu)的基礎(chǔ)上創(chuàng)新性地提出了彈性RDMA網(wǎng)絡(luò)傳輸技術(shù),用戶可以在使用RDMA技術(shù)的時(shí)候獲得低延遲的體驗(yàn),eRDMA可以把規(guī)模提升到數(shù)十萬(wàn)臺(tái),并且兼容RDMA相關(guān)的軟件生態(tài)。這樣一個(gè)新的通信方式大大加速大數(shù)據(jù)、AI、高性能計(jì)算甚至是一些數(shù)據(jù)庫(kù)的應(yīng)用:在機(jī)器學(xué)習(xí)場(chǎng)景中, AI訓(xùn)練能力有30%以上的提升,通用數(shù)據(jù)庫(kù)場(chǎng)景中,性能有130%的提升,大數(shù)據(jù)的綜合測(cè)試也表現(xiàn)出比傳統(tǒng)傳輸高出30%的性能提升,工業(yè)仿真領(lǐng)域也會(huì)有20%以上的性能提升。

4.自研倚天710通用CPU芯片

隨著云計(jì)算的不斷發(fā)展,通用處理器的芯片會(huì)越來(lái)越多。

為了能夠更進(jìn)一步的提升客戶價(jià)值,降低云產(chǎn)品的成本,在過(guò)去兩年中,阿里云自研了倚天710芯片,基于該芯片的云服務(wù)器將在不久后即將面世,滿足客戶多樣性的計(jì)算需求。

該產(chǎn)品的綜合性能測(cè)試結(jié)果,和業(yè)界標(biāo)桿相比,其SPEC int 2017性能有20%以上的提升,能效比也優(yōu)于業(yè)界水平50%以上。

5. 無(wú)影的大規(guī)模商用

除了彈性計(jì)算之外,阿里云還發(fā)布了另一個(gè)戰(zhàn)略級(jí)產(chǎn)品即無(wú)影的大規(guī)模商用。

無(wú)影作為一個(gè)端的算力的云化是一次成功的嘗試。截至目前,阿里云已經(jīng)服務(wù)了超過(guò)2萬(wàn)個(gè)客戶,也讓傳統(tǒng)的辦公、教育、個(gè)人娛樂(lè)這樣的算力通過(guò)像無(wú)影進(jìn)行云化,同時(shí)還引領(lǐng)了一批云計(jì)算公司參與的熱潮。

無(wú)影云電腦是阿里云面向辦公I(xiàn)T領(lǐng)域構(gòu)建的一個(gè)全新物種,它利用了阿里云過(guò)去12年間在分布式計(jì)算、分布式存儲(chǔ)和分布式網(wǎng)絡(luò)的能力,滿足客戶全方位的需求,再通過(guò)云原生編程框架,讓更多的軟件企業(yè)能夠做到云化轉(zhuǎn)型的同時(shí)還可以提供自己軟件產(chǎn)品或服務(wù)的更好的機(jī)制、體驗(yàn)。阿里云也跟很多的軟件企業(yè)一起進(jìn)行共創(chuàng),在云電腦中讓傳統(tǒng)的軟件變成云服務(wù),并且取得比傳統(tǒng)軟件更加強(qiáng)大的用戶體驗(yàn)。

6.面向未來(lái)為元宇宙及AI構(gòu)建起新型算力的基礎(chǔ)

最近一個(gè)詞非?;?,就是元宇宙。在新興的數(shù)字孿生、元宇宙和AI領(lǐng)域,阿里云通過(guò)底層的產(chǎn)品和技術(shù)的創(chuàng)新,與廣大的合作伙伴一起,提供一整套的端到端的算力解決方案:例如,清華大學(xué)能源與動(dòng)力工程系聯(lián)手阿里云合作伙伴,利用阿里云的云端視覺計(jì)算解決方案構(gòu)建了一個(gè)虛擬仿真功課的實(shí)驗(yàn)教學(xué)平臺(tái)。在這個(gè)平臺(tái)上已經(jīng)有16門課程、 32項(xiàng)實(shí)驗(yàn)項(xiàng)目,每年以超過(guò)22400個(gè)學(xué)時(shí)供700多名學(xué)生學(xué)習(xí)。

生態(tài)更開放:計(jì)算巢助力合作伙伴產(chǎn)品立體化上云

上云,非常關(guān)鍵的一個(gè)詞就是開放。

在生態(tài)方面,阿里云今年構(gòu)建了計(jì)算巢,作為在生態(tài)開放方面邁出的重要一步,希望借助阿里云十多年間積累的產(chǎn)品和技術(shù)方面的能力,讓軟件企業(yè)把產(chǎn)品更好的進(jìn)行云化、變成軟件服務(wù),幫助伙伴更高效地服務(wù)客戶,降低業(yè)務(wù)運(yùn)營(yíng)成本,實(shí)現(xiàn)更大的業(yè)務(wù)價(jià)值。

彈性計(jì)算四大能力全面服務(wù)客戶

彈性計(jì)算不僅僅只是阿里云提供底層計(jì)算資源的一個(gè)產(chǎn)品,而是有著更多層次的能力,包括豐富的產(chǎn)品實(shí)例、多形態(tài)的部署方式,覆蓋云上云下運(yùn)維周期的套件,以及像無(wú)影云手機(jī)這些終端服務(wù)類一些新型的產(chǎn)品。

阿里云希望利用“深厚的技術(shù)、豐富的產(chǎn)品形態(tài)、智能的服務(wù)以及開放的生態(tài)”這四方面的能力,為客戶提供全方位的計(jì)算服務(wù)保障,讓客戶的云上創(chuàng)新更加簡(jiǎn)單,更加高效。

分享到

xiesc

相關(guān)推薦