基于多精度支持,NVIDIA T4擁有可加速深度學習訓練和推理、機器學習以及數(shù)據(jù)科學工作負載的 Tensor Core,以及豐富的平臺堆棧,包括用于深度學習的cuDNN、用于數(shù)據(jù)分析和機器學習的NVIDIA RAPIDS、用于云工作站圖形的NVIDIAQuadro虛擬工作站和用于云游戲的NVIDIA游戲軟件。結合用于GPU虛擬化的 vComputeServer軟件,騰訊云客戶可以靈活選擇在虛擬環(huán)境中運行GPU加速的工作負載,從而在提高安全性和利用率的同時降低成本。

騰訊云副總裁劉穎表示:“人工智能的迅速發(fā)展對算力需求提出了各種挑戰(zhàn),而我們專注解決這些問題,為客戶提供全方位的產品解決方案。騰訊云GN7實例通過部署NVIDIA T4 GPU,提供豐富多樣的實例規(guī)格,滿足從計算視覺到語音以及NLP等不同層次的算力需求。NVIDIAvComputeServer進一步豐富了算力粒度,為用戶提供了更多選擇的可能,最終為客戶節(jié)省成本。”

NVIDIA專業(yè)可視化業(yè)務副總裁Bob Pette表示:“企業(yè)正在迅速實施人工智能(AI)策略,AI策略需要依靠現(xiàn)代應用程序才能實現(xiàn),而現(xiàn)代應用程序則需強大算力的支持。如今,在NVIDIA vComputeServer的助力之下,騰訊云可以輕松地幫助客戶實施并擴展數(shù)據(jù)分析、機器學習、AI以及企業(yè)中的其他工作負載。”

多重特性,廣泛適用不同AI場景

憑借強大的計算能力和彈性能力,GN7實例在海量數(shù)據(jù)處理和人工智能領域都具有廣闊的應用價值。它既可以滿足諸如搜索、大數(shù)據(jù)分析等需要對海量數(shù)據(jù)進行處理的業(yè)務場景,也可以作為深度學習訓練和推理的系統(tǒng)平臺。GN7實例的虛擬化特性也十分適合互聯(lián)網業(yè)務中人工智能業(yè)務的批量部署以及云游戲,AR/VR在云端的應用。目前GN7實例已經在騰訊云自有的智能鈦彈性模型服務(TI-EMS)上實現(xiàn)了應用。該平臺通過使用vGPU做小模型推理,幫助用戶解決復雜模型部署和GPU利用成本效益等問題。

進一步降低成本

GN7實例降低了GPU加速的初始投資成本,是初創(chuàng)企業(yè)、大學和企業(yè)在評估AI時的經濟選擇。NVIDIA vComputeServer軟件通過對NVIDIAT4進行虛擬化,使多臺虛擬機(VM)可以同時訪問GPU或者使一臺虛擬機可以訪問多顆 GPU,從而實現(xiàn)性能的最大化。因此,騰訊云用戶可以根據(jù)工作負載的需求靈活選擇對應的GPU加速量。

比如在進行簡單模型推理這一類低算力需求的應用時,用戶無須再像以往必須使用單顆物理GPU,而是可以根據(jù)自身業(yè)務具體類型對GPU算力的需求,靈活選擇匹配的vGPU資源,提升了計算資源的利用率,從而有效降低用戶的使用成本,避免因配置不足或配置過度而產生成本。比如,通過使用1/2 vGPU實例規(guī)格,成本相對單卡實例降低了50%。

更出色的安全性

一直以來,騰訊云都在致力于通過最新虛擬化技術研發(fā)為用戶提供最安全最便利的異構計算產品。GN7實例具有更出色的性能與安全性,能夠安全隔離公有云上的實例。 相比過往進程級別的虛擬化GPU,GN7的升級點在于其提供的設備級虛擬化vGPU是完全模擬出來一個GPU設備,在支持GPU硬件的絕大多數(shù)特性的同時,還能夠做到操作系統(tǒng)級別的隔離,而且不同的用戶使用也不用擔心資源爭搶的問題。

下周,在于蘇州舉辦的GTC大會上,騰訊云海將會演示NVIDIA GPU加速的云服務,并介紹如何從云端部署AI工作負載。

分享到

zhangnn

相關推薦