IDF2013:至強(qiáng)融核協(xié)處理器編譯和調(diào)優(yōu)工具
藍(lán)調(diào) 發(fā)表于:13年04月11日 15:00 [原創(chuàng)] DOIT.com.cn
4月10日、11日,2013年英特爾信息技術(shù)峰會(huì)(IDF)在北京國家會(huì)議中心舉行,本次IDF的主題為“未來,用‘芯’體驗(yàn)”,這意味著英特爾將繼續(xù)以用戶體驗(yàn)為核心,立足英特爾“芯”架構(gòu),擴(kuò)大和深化產(chǎn)業(yè)合作,全面推動(dòng)計(jì)算技術(shù)創(chuàng)新、芯片制造創(chuàng)新、應(yīng)用體驗(yàn)創(chuàng)新、終端形態(tài)創(chuàng)新和云端智能創(chuàng)新。會(huì)上,來自全球各地的技術(shù)公司及數(shù)千名軟硬件開發(fā)人員、技術(shù)管理人員、媒體和分析師共聚北京,一起體驗(yàn)最新技術(shù)進(jìn)展及探討未來計(jì)算的創(chuàng)新趨勢。敬請關(guān)注DOIT全程直播報(bào)道!
在IDF2013的技術(shù)課程上,來自英特爾的高級技術(shù)咨詢工程師段小平介紹了《英特爾至強(qiáng)融核協(xié)處理器編譯、調(diào)試和調(diào)優(yōu)的軟件工具》。重點(diǎn)闡述了如何使用英特爾Composer XE進(jìn)行offload編譯,以及使用英特爾VTune Amplifier XE進(jìn)行性能調(diào)優(yōu)。英特爾至強(qiáng)融核協(xié)處理器和英特爾至強(qiáng)處理器具有相同的并行編程方法,編程模型如下:
【圖】英特爾至強(qiáng)融核協(xié)處理器工具
英特爾至強(qiáng)融核協(xié)處理器平臺提供了非常豐富的工具,包括源自先進(jìn)編譯器的業(yè)界領(lǐng)先性能、全面的函數(shù)庫、并行編程模型和深入的分析工具。
【圖】英特爾至強(qiáng)融核協(xié)處理器的工具
使用英特爾Composer XE進(jìn)行offload編譯
在可運(yùn)行的主機(jī)代碼中加入指示和新的關(guān)鍵字就可以使代碼段運(yùn)行在基于英特爾集成眾核架構(gòu)(英特爾MIC架構(gòu))的協(xié)處理器上,類似于使用OpenMP指令或者Click Plus關(guān)鍵字在串行代碼中加入并行。
英特爾編譯器同時(shí)為兩種目標(biāo)架構(gòu)生成代碼,無論系統(tǒng)是否擁有協(xié)處理器生成的二進(jìn)制代碼都可以運(yùn)行,編譯器通過加入代碼來完成自動(dòng)傳輸數(shù)據(jù)到協(xié)處理器,這意味著程序員不需要編寫額外的代碼。
offload編譯器的數(shù)據(jù)傳輸時(shí),主機(jī)CPU和基于英特爾集成眾核架構(gòu)的協(xié)處理器在硬件上不共享物理或虛擬內(nèi)存。有兩種可用的數(shù)據(jù)傳輸模型:顯示拷貝和隱式拷貝。顯示拷貝是指程序員在offload progma、directive中制定需要在主機(jī)和擴(kuò)展卡之間拷貝的變量,隱式拷貝是指程序要標(biāo)記出需要在主機(jī)和擴(kuò)展卡之間共享的變量,于是相同的變量在主機(jī)和協(xié)處理器代碼中都可以使用。
英特爾VTune Amplifier XE可以對應(yīng)用進(jìn)行分析,哪里在消耗時(shí)間?VTune Amplifier XE可以針對最長時(shí)間函數(shù)進(jìn)行優(yōu)化,查看調(diào)用棧,基于遠(yuǎn)嗎查看時(shí)間開銷。哪里在浪費(fèi)時(shí)間?VTune Amplifier XE可以基于源碼查看緩存缺失區(qū),根據(jù)緩沖區(qū)缺失數(shù)據(jù)排序查看函數(shù);等待過長時(shí)間?可以根據(jù)等待時(shí)間查看鎖,等待期間使用紅/綠顯示CPU使用率。
公司簡介 | 媒體優(yōu)勢 | 廣告服務(wù) | 客戶寄語 | DOIT歷程 | 誠聘英才 | 聯(lián)系我們 | 會(huì)員注冊 | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.