提升效率和易用性 NVIDIA正式發(fā)布CUDA 5
比特網(wǎng) 發(fā)表于:12年10月17日 10:12 [轉(zhuǎn)載] 比特網(wǎng)
作為高性能計算領(lǐng)域最閃耀的新星,異構(gòu)計算以其強大的浮點性能以及極高的性價比迅速在超算500強榜單中席卷了很多席位。但作為一件新興事物,利用GPU進行異構(gòu)計算也面臨著很多問題,而其中最重要的一個便是相關(guān)算法和程序的開發(fā)。而作為異構(gòu)計算的推進者,NVIDIA今天宣布推出全新的GPGPU(通用GPU)編程環(huán)境:CUDA 5正式版。
NVIDIA宣稱,CUDA已經(jīng)獲得了累計150多萬次下載,支持180多個工程、科學(xué)與商業(yè)應(yīng)用,是開發(fā)人員挖掘GPU加速計算的最普及方式。
CUDA 5可以讓開發(fā)人員充分發(fā)揮NVIDIA GPU的加速性能,包括對最新“開普勒”家族的完整支持。
動態(tài)并行(Dynamic Parallelism):
作為一種新的GPU加速算法,動態(tài)并行可以允許GPU線程動態(tài)地衍生新線程,從而更好地適應(yīng)數(shù)據(jù)流。通過最大程度地簡化與GPU的往來通信,動態(tài)并行技術(shù)可以大大簡化并行編程,讓更多流行算法支持GPU加速,比如自適應(yīng)網(wǎng)格加密、計算流體動力學(xué)等等。
GPU-Callable庫:
新的CUDA BLAS庫可以讓開發(fā)人員為他們自己的PU-Callable庫使用動態(tài)并行,比如設(shè)計插件API、讓其他人擴展其內(nèi)核的功能性,部署GPU Callback、自定義第三方GPU-Callable庫的功能性。對象鏈接(object linking)可將多個CUDA源文件編譯成不同的對象文件,然后鏈接到更大的應(yīng)用和庫中,從而更簡單、更高效地開發(fā)大型GPU應(yīng)用。
GPUDirect支持遠程直接內(nèi)存訪問(RDMA):
GPUDirect技術(shù)建立了GPU與其它PCI-E設(shè)備的直接通信,并支持網(wǎng)卡與GPU之間的RDMA,還能大幅降低集群中GPU節(jié)點間的MPISendRecv延遲、改進整體應(yīng)用性能。
NVIDIA Nsight Eclipse Edition:
Linux、Mac OS X平臺上,NVIDIA Nsight Eclipse Edition可以讓開發(fā)人員在熟悉的Eclipse IDE環(huán)境內(nèi)開發(fā)、調(diào)試和編譯GPU應(yīng)用,并自帶CUDA編輯器和CUDA示例,可以更快地生成CUDA代碼,還整合了專家級的分析系統(tǒng),提供自動性能分析,以及修復(fù)代碼中性能瓶頸的向?qū)В有語法高亮區(qū)分GPU代碼和CPU代碼。
CUDA 5操作系統(tǒng)支持包括:Windows XP臺式機、Windows Vista/7/8臺式機和筆記本、Ubuntu 11.04/11.10、Fedora 16、Red Hat Enterprise Linux 5.x/6.x(后者僅限64位)、OpenSUSE 12.1(64位)、SUSE Server 11 SP1/SP2、Mac OS X。
作為最新的GPU編程環(huán)境,CUDA 5完整集成了新的開普勒GPU所包含的眾多特性,并重點提升了集群應(yīng)用中GPU的效率以及相關(guān)程序編寫的方便性。眾所周知,相對于傳統(tǒng)系統(tǒng)架構(gòu)來說,要想讓GPU參與到整個計算中來必須要對原有的程序架構(gòu)做出巨大的改變和優(yōu)化,而有時這個過程將相當(dāng)?shù)膹?fù)雜和漫長。而利用新的環(huán)境,軟件開發(fā)人員將能夠更快的開發(fā)新應(yīng)用,讓異構(gòu)計算所帶來的軟件成本變得更低。
公司簡介 | 媒體優(yōu)勢 | 廣告服務(wù) | 客戶寄語 | DOIT歷程 | 誠聘英才 | 聯(lián)系我們 | 會員注冊 | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.