首先來看定位。與日常關(guān)注度更高的數(shù)據(jù)中心級顯卡定位有所不同,GPU Flex系列主要面向視頻轉(zhuǎn)碼與傳輸、視覺AI推理、云游戲、桌面虛擬化等應(yīng)用場景。
GPU Flex系列不包括用于機(jī)器學(xué)習(xí)訓(xùn)練和HPC高性能計(jì)算的場景,后者可以由Ponte Vecchio高性能顯卡來承擔(dān),當(dāng)然,也可以用Habana Gaudi來做機(jī)器學(xué)習(xí)訓(xùn)練。
今年發(fā)布的GPU Flex系列包括75W的Flex 140(12GB顯存)和150W的Flex 170(16GB顯存),算得上是功耗比較低的輕量級顯卡。
其中,F(xiàn)lex 140是半高設(shè)計(jì),F(xiàn)lex 170是全高的設(shè)計(jì),兩者分別配備了16個Xe內(nèi)核、16個光追單元和32個Xe內(nèi)核、32個光追單元,算力最高達(dá)256TOPS(INT8)。
英特爾公司市場營銷集團(tuán)副總裁、中國區(qū)云與行業(yè)解決方案部總經(jīng)理梁雅莉在介紹GPU Flex系列產(chǎn)品時,強(qiáng)調(diào)它能滿足智能視覺云的工作負(fù)載需求,能提供更出色的媒體轉(zhuǎn)碼吞吐性能和支持多達(dá)68路實(shí)時云游戲流。
接下來,我們看看GPU Flex系列顯卡在視頻轉(zhuǎn)碼與傳輸、視覺AI推理、云游戲等應(yīng)用場景中的表現(xiàn)。
媒體處理與傳輸場景,編解碼能力突出
在媒體處理與傳輸場景中,GPU Flex系列的一大亮點(diǎn)是支持AV1編解碼功能。AV1的優(yōu)勢很明顯,比如,它是免費(fèi)的,而H.264和H.265都是需要收費(fèi)的,但是,AV1編解碼的硬件支持普遍差一點(diǎn),GPU Flex系列看來是要打破這一局面,推動AV1的進(jìn)一步普及。
AV1還省流量,與常見的AVC(也就是常說的H.264)編碼相比,在同樣的視頻質(zhì)量下,AV1可節(jié)省30%以上的傳輸帶寬。這對于提供在線視頻類服務(wù)的企業(yè)而言,意味著網(wǎng)絡(luò)帶寬成本和數(shù)據(jù)存儲成本將會有大幅的壓縮。
將英特爾的Flex 140與英偉達(dá)同等功能定位的A10做對比,F(xiàn)lex 140的解碼吞吐量優(yōu)勢非常明顯,而且,英偉達(dá)A10的TDP為150瓦,而Flex 140僅為75瓦,在解碼性能和解碼效率上,F(xiàn)lex 140優(yōu)勢非常明顯。
在H.265(HEVC)轉(zhuǎn)碼性能對比中,英特爾數(shù)據(jù)中心GPU Flex系列140的性能也明顯優(yōu)于英偉達(dá)A10,能支持36路的1080p60幀,甚至還能支持1路8K60幀的視頻轉(zhuǎn)碼。
中科大洋是國內(nèi)一家大型廣電企業(yè),旗下自研的LeoVideo Cloud云轉(zhuǎn)碼產(chǎn)品中使用了英特爾數(shù)據(jù)中心GPU Flex140,實(shí)際部署和測試發(fā)現(xiàn),英特爾數(shù)據(jù)中心GPU Flex140能夠解碼16路4K并發(fā)或4路8K并發(fā)或60路1080p的并發(fā)。與競品相比,F(xiàn)lex 140有明顯優(yōu)勢。
PSNR是衡量畫面質(zhì)量的一個常用指標(biāo),中科大洋在測試中發(fā)現(xiàn)Flex 140編碼質(zhì)量比CPU的效果還要好。通常,CPU的編碼質(zhì)量要比顯卡效果要好,但效率比較低下,而現(xiàn)在,F(xiàn)lex 140讓解碼和轉(zhuǎn)碼的性能和質(zhì)量都有了較大提升。
億聯(lián)網(wǎng)絡(luò)是一家遠(yuǎn)程視頻會議服務(wù)商,原本是用CPU來做軟編解時,效率和性能都存在很多問題。當(dāng)使用英特爾Flex GPU來做圖像的編解、處理、縮放時,讓CPU可以專注在業(yè)務(wù)處理上,從而使得處理的性能和方案整體的可靠性都上了一個新臺階。
云游戲場景降本增效
在云游戲場景中,F(xiàn)lex GPU系列對于降本增效很有幫助。
上圖中,英特爾市場營銷集團(tuán)副總裁、中國區(qū)數(shù)據(jù)中心銷售總經(jīng)理兼中國區(qū)運(yùn)營商銷售總經(jīng)理莊秉翰展示了如何用兩張F(tuán)lex 170支持120路以上安卓云游戲的能力。
如圖所示,英特爾數(shù)據(jù)中心GPU Flex 170和140可以支持包括《王者榮耀》、《荒野行動》、《狂野飆車9:競速傳奇》等多款熱門游戲,一塊顯卡可以輕松支持幾十路游戲在1080p和720p分辨率下進(jìn)行游玩。
基于英特爾數(shù)據(jù)中心GPU Flex的云游戲服務(wù)可以帶來極大的成本優(yōu)化,除了支持安卓云游戲以外,最近的一次更新中,還宣布支持Windows平臺的云游戲,這也將提升GPU Flex顯卡的適用性。
火山引擎的云游戲解決方案中使用了GPU Flex?;鹕揭嫦到y(tǒng)架構(gòu)師梁宇表示,F(xiàn)lex 140自帶的硬件編解碼功能對于該方案中的軟硬件的整合和成本控制有很大幫助。
上圖展示的是用Flex 140支持火山引擎自研游戲《航海王熱血航線》的性能表現(xiàn),得益于其編碼能力,它能支持更多路的游戲??磥?,用戶想用GPU Flex提供別的云游戲服務(wù)也并不是很難。
GPU Flex也非常適合用來做AI推理
上圖展示的是GPU Flex做AI視覺推理時候的性能優(yōu)勢,所謂AI視覺推理,考驗(yàn)的是視頻流的解碼處理能力和AI推理運(yùn)算能力。與英偉達(dá)的A10相比,GPU Flex系列在目標(biāo)分類、目標(biāo)檢測等推理場景中的表現(xiàn)都更有優(yōu)勢。
當(dāng)虹科技老片修復(fù)系統(tǒng)中使用了GPU Flex系列顯卡,通過它來做AI插幀、AI HDR轉(zhuǎn)換、AI超分(提高分辨率)和AI畫質(zhì)增強(qiáng)。修復(fù)過程中會涉及很多編解碼的操作,通過使用CPU和GPU Flex的組合提高了處理效率,降低了方案的整體成本。
另外,GPU Flex系列顯卡的另外一大亮點(diǎn)是支持基于硬件的SR-IOV技術(shù),并且不需要軟件授權(quán)費(fèi)用,這對于桌面虛擬化場景非常有幫助,可以幫助用戶優(yōu)化總體擁有成本,省下一大筆錢。
結(jié)束語
英特爾的數(shù)據(jù)中心顯卡市場的未來表現(xiàn)還是很值得期待的。
除了本身的GPU相關(guān)技術(shù)積累以外,它還可以利用英特爾至強(qiáng)可擴(kuò)展處理器的生態(tài)優(yōu)勢。比如,用戶在用英特爾GPU和英特爾CPU時候能開啟一項(xiàng)叫Deep Link的技術(shù),它能智能地把一部分工作負(fù)載放在GPU上,一部分工作負(fù)載放在CPU上,以此來提升工作效率。
英特爾能在框架層面能解決應(yīng)用生態(tài)的難題。任何新的硬件都需要漫長過程來構(gòu)建生態(tài),英特爾規(guī)劃設(shè)計(jì)了一個叫oneAPI的框架,它能讓用戶在不同架構(gòu)下開發(fā)的應(yīng)用運(yùn)行在其它異構(gòu)產(chǎn)品上,比如,它可以讓一個應(yīng)用既能運(yùn)行在CPU上,也能運(yùn)行在GPU甚至是FPGA上。
在走向市場方面,得益于英特爾在企業(yè)級市場上的特殊地位,GPU Flex系列顯卡得到了新華三、浪潮、寧暢、寶德、超聚變在內(nèi)的OEM的支持,在第一時間就對于Flex系列GPU的適配工作,支持Flex GPU的服務(wù)器產(chǎn)品已陸續(xù)上市。
下一階段,此次GPU Flex系列的亮點(diǎn)在于編解碼以及各種偏輕量級的工作負(fù)載,強(qiáng)在??▽S眯矢撸诓痪玫奈磥砑磳l(fā)布的適合重型負(fù)載的Ponte Vecchio其實(shí)也非常值得期待。