噜噜噜综合,又色又爽又高潮免费观看,综合无码一区二区三区四区五区,中文字幕无码人妻aaa片,四虎成人精品永久网站

OpenCL:釋放你的GPU和系統(tǒng)資源

Jim 發(fā)表于:13年05月14日 00:18 [編譯] DOIT.com.cn

  • 分享:
[導讀]對于外行來說,OpenCL看上去也許只是一個以簡便的方式訪問GPU的工具,相當于在ATI顯卡上工作的CUDA。這么看就把OpenCL想得過于簡單了。事實上,OpenCL提供了一系列豐富的功能,給應用程序開發(fā)者提供了必要的基礎,來充分利用將來的異構(gòu)硬件。在本文中,我們要帶大家了解一下OpenCL是怎樣解決一些未來的挑戰(zhàn),以及OpenCL社區(qū)所做的努力,因為越來越多的用戶都從廠商鎖定的方案轉(zhuǎn)到OpenCL上來了。

對于外行來說,OpenCL看上去也許只是一個以簡便的方式訪問GPU的工具,相當于在ATI顯卡上工作的CUDA。這么看就把OpenCL想得過于簡單了。事實上,OpenCL提供了一系列豐富的功能,給應用程序開發(fā)者提供了必要的基礎,來充分利用將來的異構(gòu)硬件。在本文中,我們要帶大家了解一下OpenCL是怎樣解決一些未來的挑戰(zhàn),以及OpenCL社區(qū)所做的努力,因為越來越多的用戶都從廠商鎖定的方案轉(zhuǎn)到OpenCL上來了。

現(xiàn)在,我們都已聽說過功率墻(耗能限制問題),而且我們都知道,翻過它的唯一途徑就是并行。數(shù)據(jù)級并行是新的計算時代的第一個有影響力的技術(shù)。使用高度統(tǒng)一的工作單元,數(shù)據(jù)并行在許多科學算法上取得了不錯的性能提升,OpenCL當然支持這么模式。

然而,事情還沒完。因為CPU廠商正試圖讓它們的架構(gòu)適應這種新的并行模式(而GPU廠商在發(fā)展它們自己的),如何在程序中使用并行計算的替代辦法正在涌現(xiàn)。這些設計試圖降低大部分工作不適合非發(fā)散單元執(zhí)行的算法的性能限制。

其中一種方法就是采用一種多核心架構(gòu),并對它進行擴展,為并行任務提供更多的資源。這方面的一個例子就是2012年發(fā)布的英特爾至強Phi架構(gòu)。與CPU和GPU類似,至強Phi的編程模型對這兩者都需要一點點。像CPU的部分就是,至強Phi喜歡時間更持久的工作項,這樣它的緩存系統(tǒng)就能更有效地工作,減少內(nèi)存訪問延遲。同時,至強Phi比傳統(tǒng)的SMP(對稱多處理)提供了更多的執(zhí)行單元。對于許多應用程序來說,它在數(shù)據(jù)與任務并行之間找到了平衡,而對于開發(fā)者來說,值得慶幸的是,英特爾對它們的整個處理器產(chǎn)品線都提拱了OpenCL支持,包括至強Phi和嵌入式顯卡。OpenCL顯示局部累積沒有問題,有或沒有受限的內(nèi)存訪問,管理工作組的界面對于任何級別的數(shù)據(jù)并行計算都能勝任。這些特點使得它能夠無縫地集成反映至強Phi硬件混合特性的混合編程模型。

另一種已被廣泛開發(fā),而尚未充分利用(甚至往往不被承認)的硬件策略就是異構(gòu)片上系統(tǒng)(SoC)。由現(xiàn)已不在的IBM Cell服務器首創(chuàng),結(jié)合所謂的延遲優(yōu)化的核心(CPU)與吞吐量優(yōu)化的核心(GPU),異構(gòu)架構(gòu)試圖要兩全其美,只不過兩個部分是分開的。如果你正在使用移動設備閱讀本文,很有可能你已經(jīng)用上了異構(gòu)芯片:蘋果A Series,NVIDIA Tegra,AMD Fusion,高通Snapdragon和英特爾Ivybridge都是異構(gòu)的。其中一些還可能用于下一代的超級計算機中。如果是這樣的話,除非你明確地利用這些資源,否則它們就會成為你系統(tǒng)的能耗源頭,而沒有任何好處。OpenCL為開發(fā)者打開了異構(gòu)架構(gòu)的無限潛能。

最后一個值得一提的硬件策略就是Field Programmable Gate Array現(xiàn)場可編程門陣列(FPGA)。沒有幾個通用的處理架構(gòu)可以和自定義電路的能效相抗衡。不幸的是,很少有開發(fā)商會愿意花時間和精力來學習VHDL或Verilog,讓它們的想法變成實際能用的核心。OpenCL的一個非常新穎的應用程序,通過在OpenCL C編程語言編寫的內(nèi)核中創(chuàng)建FPGA固件,意圖消除這一阻礙。Altera公司(Stratix V架構(gòu)的制造商)已經(jīng)發(fā)布了用于OpenCL的Altera SDK。使用這套工具,開發(fā)者可以生成專為他們的應用程序量身定制的自定義硬件。這使得應用程序開發(fā)者擺脫了本該屬于電氣工程師的沉悶工作,與此同時,它還開啟了一個充滿無盡可能的迷人世界。

我們已經(jīng)討論的所有硬件趨勢,合起來,對于任何供應商特定工具鏈來說都是巨大的挑戰(zhàn)。要考慮使用異構(gòu)主機處理器,外加離散加速器(GPU或其他)的系統(tǒng)的編程模型。對這些資源的有效利用需要緊密結(jié)合數(shù)據(jù)并行與任務并行工作的能力,以及各種計算單元之間的數(shù)據(jù)移動。我們真的要指望著那些東拼西湊的廠商特定的工具來迎接這樣的挑戰(zhàn)嗎?設想一下,你現(xiàn)在必須支持一個配置相似的,但是是由一套不同的架構(gòu)建立的系統(tǒng)。你要寫多少個版本的代碼?這樣一個工作,你需要用多少年才能完成?

有了OpenCL,實現(xiàn)這樣一個模型就非常簡單了。因為設計用于運行在各種相互競爭的硬件架構(gòu)之上的OpenCL是對它們的自然反映。OpenCL可以容納上面提到的每一個架構(gòu),而且把它們協(xié)調(diào)在一起也沒有問題。作為一個開放的標準,新的廠商都能參與到OpenCL的討論中來,確保OpenCL能夠支持未來的硬件發(fā)展,無論方向如何。此外,關(guān)于OpenCL對自定義設備的支持,它提供了更大的靈活性,可以加入當下的計算設備概念不能滿足的系統(tǒng)資源,為集成DSP或內(nèi)部開發(fā)的ASIC創(chuàng)造了機會。

對于OpenCL的疑慮主要集中在OpenCL的可移植性是暫時的。這就是在轉(zhuǎn)移問題的焦點。顯然,所有的硬件是都不一樣,在各種架構(gòu)上表述并行算法的方法沒有單一一個最佳方法。這不是OpenCL的意義所在。OpenCL的真正作用是它提供了一個基礎,讓我們可以在一個單一框架里設定各種硬件組合。使用OpenCL,開發(fā)者可以輕松地在不同的內(nèi)核,執(zhí)行拓撲和內(nèi)存模式之間切換。這種靈活性就是OpenCL的核心。

有一個問題就是,OpenCL迄今一直缺少一個正式的用戶組織。為了解決這個問題,一些主要的OpenCL倡導者們組織了一個新的用戶群體。由于OpenCL是關(guān)于計算的可移植性的,所以這個新的組織就命名為Comportability。作為一個非營利公司,Comportability就是一個有關(guān)OpenCL一切的開放論壇。會員是免費的。個人被邀請參與討論,上傳軟件,參加一年一度的研討會。機構(gòu)和廠商作為投票成員參與其中,被邀請形成地區(qū)分會,舉辦研討會。

第一屆OpenCL世界研討會,將在2013年5月13日至14日于佐治亞理工學院舉辦。

[責任編輯:唐蓉]
藍調(diào)
專訪亞洲HPC大賽冠軍隊清華大學。我們這次帶領(lǐng)國內(nèi)很多知名專業(yè)的媒體過來,是因為不久前清華在ASC上,取得了非常好的成績,這也是國內(nèi)高性能計算水平發(fā)展非常好的例證.
官方微信
weixin
精彩專題更多
存儲風云榜”是由DOIT傳媒主辦的年度大型活動。回顧2014年,存儲作為IT系統(tǒng)架構(gòu)中最基礎的元素,已經(jīng)成為了推動信息產(chǎn)業(yè)發(fā)展的核心動力,存儲產(chǎn)業(yè)的發(fā)展邁向成熟,數(shù)據(jù)經(jīng)濟的概念順勢而為的提出。
華為OceanStor V3系列存儲系統(tǒng)是面向企業(yè)級應用的新一代統(tǒng)一存儲產(chǎn)品。在功能、性能、效率、可靠性和易用性上都達到業(yè)界領(lǐng)先水平,很好的滿足了大型數(shù)據(jù)庫OLTP/OLAP、文件共享、云計算等各種應用下的數(shù)據(jù)存儲需求。
聯(lián)想攜ThinkServer+System+七大行業(yè)解決方案驚艷第十六屆高交會
 

公司簡介 | 媒體優(yōu)勢 | 廣告服務 | 客戶寄語 | DOIT歷程 | 誠聘英才 | 聯(lián)系我們 | 會員注冊 | 訂閱中心

Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.