騰訊云異構(gòu)計(jì)算專家產(chǎn)品經(jīng)理高平
異構(gòu)計(jì)算新實(shí)例首發(fā) 滿足不同場(chǎng)景需求
由于通用CPU已經(jīng)無法滿足人工智能各類應(yīng)用中對(duì)高并發(fā)和高算力的需求,混合了不同架構(gòu)計(jì)算單元的異構(gòu)計(jì)算已經(jīng)成為人工智能領(lǐng)域最高效的計(jì)算模式。與此同時(shí),隨著人工智能在各個(gè)行業(yè)的落地加速,不同行業(yè),不同的業(yè)務(wù)場(chǎng)景對(duì)人工智能的要求也產(chǎn)生了分化。例如在電商,文創(chuàng),教育,金融,游戲以及傳統(tǒng)行業(yè)雖然都要大量使用到AI,但對(duì)異構(gòu)計(jì)算的算力和部署模式需求都不盡相同。對(duì)云計(jì)算企業(yè)而言也提出了更高的要求。
騰訊云此次發(fā)布的兩款異構(gòu)計(jì)算新實(shí)例在保持方便快捷部署、計(jì)算能力強(qiáng)大、彈性可配置的基礎(chǔ)上,進(jìn)一步豐富了算力的粒度,能夠充分滿足不同行業(yè)用戶和應(yīng)用場(chǎng)景下對(duì)異構(gòu)計(jì)算的不同需求。
Xilinx Alveo自適應(yīng)計(jì)算加速平臺(tái)
FPGA新實(shí)例云上瑞士軍刀FX4因其可編程的特性,可以讓用戶定制的算法實(shí)現(xiàn)硬件加速,大幅提高效率,同時(shí)擁有更佳的能源效率。騰訊云是國(guó)內(nèi)首家由 Xilinx 自適應(yīng)計(jì)算加速平臺(tái) Alveo 支持的公有云,Xilinx Alveo U200能夠?yàn)橹匾ぷ髫?fù)載提供比CPU高90倍的性能,在不改變硬件的情況下,能加速任何工作負(fù)載,并能降低總體擁有成本。此外,F(xiàn)X4提供了創(chuàng)新的開發(fā)者模式,安全而且高效,能夠提供類似于本地FPGA的開發(fā)體驗(yàn)。
GPU新實(shí)例GN7可以根據(jù)計(jì)算、渲染/游戲、桌面等場(chǎng)景的不同算力需求衍生出1/2 GPU、1/4 GPU等虛擬化實(shí)例規(guī)格,進(jìn)而大幅提升GPU的利用率,幫助用戶降低成本。
助力人工智能行業(yè)輕松擁有最強(qiáng)算力
騰訊云異構(gòu)計(jì)算專家產(chǎn)品經(jīng)理高平透露,經(jīng)過2年的發(fā)展,騰訊云異構(gòu)計(jì)算產(chǎn)品的用戶規(guī)模增長(zhǎng)超過10倍,并且得到了用戶的廣泛認(rèn)可。
自2017年6月推出基于M40的GPU計(jì)算實(shí)例以來,目前騰訊云已經(jīng)構(gòu)建了完整的GPU計(jì)算實(shí)例矩陣,包括新發(fā)布的GN7以及GN6S、GN10X等,能夠滿足用戶在深度學(xué)習(xí)訓(xùn)練/推理、視頻轉(zhuǎn)碼、圖形渲染、云游戲等多種場(chǎng)景下的不同算力需求。
對(duì)比行業(yè),騰訊云的GPU計(jì)算實(shí)例矩陣在不同算力層次都有明顯的顯存優(yōu)勢(shì),M40 GPU和P40 GPU標(biāo)配24G顯存,同時(shí)是國(guó)內(nèi)唯一大規(guī)模提供V100 32G GPU的主流公有云。據(jù)悉,V100 32G是目前為止顯存最大、算力最強(qiáng)的GPU,其已在騰訊云廣泛部署,幫助用戶隨時(shí)獲取最強(qiáng)算力。
傳統(tǒng)的異構(gòu)計(jì)算產(chǎn)品部署復(fù)雜、缺乏優(yōu)化、并且需要相關(guān)人員有足夠的技術(shù)經(jīng)驗(yàn),為此,騰訊云此次發(fā)布的兩款異構(gòu)計(jì)算新實(shí)例將
簡(jiǎn)化軟件的安裝部署過程,提供從簡(jiǎn)單到靈活之間的多種安裝部署方式選擇,讓異構(gòu)計(jì)算產(chǎn)品既簡(jiǎn)單,又好用。
對(duì)人工智能這樣需要高性能計(jì)算的復(fù)雜應(yīng)用來說,騰訊云異構(gòu)計(jì)算產(chǎn)品在提供最強(qiáng)算力的同時(shí),擁有更佳彈性的使用模式以及更高的性價(jià)比,大大降低了人工智能計(jì)算門檻。即便是人工智能初創(chuàng)企業(yè),也能夠輕松搭建屬于自己的超算中心。
從深度學(xué)習(xí)到基因組學(xué) 騰訊云異構(gòu)計(jì)算無處不在
目前,騰訊云異構(gòu)計(jì)算產(chǎn)品擁有極其廣泛的應(yīng)用前景,適用于深度學(xué)習(xí)、圖形渲染、云游戲等對(duì)計(jì)算能力、時(shí)延要求極高的場(chǎng)景,同時(shí)還能滿足分子建模、基因組學(xué)等工程計(jì)算領(lǐng)域的高要求。
以曾被蘋果App Store 評(píng)選為“年度優(yōu)秀本土App”的“馬卡龍玩圖”為例,這款單體智能識(shí)別AI視覺制作APP對(duì)GPU算力有很高要求,在采用GN10X實(shí)例后,超大的32G顯存能夠幫助其低延遲處理多個(gè)模型,提升了用戶體驗(yàn)。
目前GN7實(shí)例已經(jīng)應(yīng)用在騰迅云自有的智能鈦彈性模型服務(wù)(TI-EMS)上,TI-EMS在線推理平臺(tái)可以使用vGPU做小模型推理,充分提高了GPU的利用率,能夠幫助用戶在解決模型部署復(fù)雜、資源浪費(fèi)、手工擴(kuò)展資源效率低下等問題的同時(shí),進(jìn)一步的降低成本。
FPGA方面,騰訊云構(gòu)建的FPGA云生態(tài),可以提供一系列優(yōu)秀的壓縮、加解密、圖片處理、視頻編解碼、基因算法加速等IP,應(yīng)用方只需要專注在上層應(yīng)用和服務(wù)開發(fā)上,而不需要再關(guān)注FPGA編碼、調(diào)試等繁瑣細(xì)節(jié)。以騰訊云此前與東南大學(xué)合作的科研項(xiàng)目為例,基于騰訊云提供的FPGA云計(jì)算服務(wù),東南大學(xué)科研人員能夠在一個(gè)開源的系統(tǒng)平臺(tái)進(jìn)行具有高附加值的教學(xué)和研究,縮短了使用者的開發(fā)時(shí)間,助力高效理論研究成果迅速轉(zhuǎn)化。
另外一種異構(gòu)計(jì)算類型ASIC+CPU,騰訊云目前也在持續(xù)關(guān)注。高平表示,未來騰訊云將打造GPU+FPGA+ASIC混合形態(tài)的異構(gòu)計(jì)算產(chǎn)品陣列,并在集群與算力池化方面持續(xù)投入,打造適應(yīng)未來的異構(gòu)計(jì)算產(chǎn)品,為通用計(jì)算、云端渲染、視頻處理等場(chǎng)景提供更強(qiáng)算力及更優(yōu)的解決方案。