并行科技CTO陳健詳解“Intel® Xeon Phi™協(xié)處理器高性能計(jì)算解決方案”
陳健首先以Intel® Cluster Ready為切入點(diǎn),介紹了并行科技的HPC機(jī)群建設(shè)整體解決方案:“ParaPlus是并行科技在國際通行的Rocks系統(tǒng)開源軟件基礎(chǔ)上,進(jìn)行二次開發(fā)后形成的一套經(jīng)濟(jì)穩(wěn)定的成熟方案,其標(biāo)準(zhǔn)實(shí)施軟件是經(jīng)過Intel® Cluster Ready認(rèn)證的。其中包括兩類機(jī)群管理軟件:第一,Rocks機(jī)群管理軟件,對于用戶而言,能夠免費(fèi)獲取軟件,只需支付少量服務(wù)費(fèi)用;第二,Bright Cluster Manager™,目前是英特爾主推的一個(gè)機(jī)群管理套件,已全部完成對Intel® Xeon Phi™協(xié)處理器的支持。BCM由Bright Computing公司提供,其可視化完成整個(gè)機(jī)群的安裝、使用及管理。對于用戶而言,最重要的是它已經(jīng)集成了所有Intel® Xeon Phi™協(xié)處理器的相關(guān)軟件,使得用戶能夠快速便捷地使用Intel® Xeon Phi™協(xié)處理器。”
隨后,陳健詳細(xì)闡述了針對Intel® Xeon Phi™協(xié)處理器的高性能計(jì)算解決方案,其包含三部分:(1)機(jī)群管理套件;(2)針對Intel® Xeon Phi™協(xié)處理器的調(diào)度系統(tǒng),可實(shí)現(xiàn)多種應(yīng)用模式的調(diào)度,比如調(diào)度MPI+Offload,或者把單進(jìn)程任務(wù)直接調(diào)度至Intel® Xeon Phi™協(xié)處理器上,以及將MPI的任務(wù)直接調(diào)度到Intel® Xeon Phi™協(xié)處理器的本地區(qū)運(yùn)行,另外,MPI任務(wù)還可以在常規(guī)服務(wù)器節(jié)點(diǎn)以及協(xié)處理器節(jié)點(diǎn)之間混合使用;(3)性能分析可視化軟件Paramon,盡可能地將高性能計(jì)算的程序開發(fā)、運(yùn)行可視化,實(shí)現(xiàn)動(dòng)態(tài)、實(shí)時(shí)地查看數(shù)據(jù)。
Intel® Xeon Phi™協(xié)處理器性能可視化分析
Paramon能夠?qū)崟r(shí)顯示基于Intel® Xeon Phi™協(xié)處理器的實(shí)時(shí)浮點(diǎn)性能Gflops值,此數(shù)值在以前并不存在獲取的較好辦法,而基于Paramon軟件可以實(shí)現(xiàn)秒級刷新,一秒一刷新當(dāng)前系統(tǒng)中正在運(yùn)行的所有程序。Paramon能夠做到以卡為單位,即以一個(gè)嵌入式操作系統(tǒng)為單位,來捕捉卡的利用率。在Paramon4.0中,預(yù)計(jì)8月31日發(fā)布,提供兩個(gè)最基本的Intel® Xeon Phi™協(xié)處理器的微架構(gòu)數(shù)據(jù)——CPI、向量化率,這是目前常規(guī)應(yīng)用移植到Intel® Xeon Phi™協(xié)處理器上所遇到的兩個(gè)瓶頸點(diǎn),并行科技已將這兩個(gè)瓶頸點(diǎn)解決。同時(shí)在執(zhí)行性能的移植與調(diào)優(yōu)時(shí),可通過Paramon、Paratune迅速定位問題,快速識別應(yīng)用性能瓶頸。
陳健說道:“目前對于高性能計(jì)算領(lǐng)域,幾百臺服務(wù)器的一套機(jī)群已經(jīng)較為常見,所以我們首先考慮大規(guī)模機(jī)群運(yùn)行狀態(tài)實(shí)時(shí)可視化,然后是盡可能地讓計(jì)算單元發(fā)揮最大性能,但如何能夠保證這一點(diǎn)?此時(shí)需要在一個(gè)界面內(nèi)看到所有CPU、內(nèi)存、網(wǎng)絡(luò)、磁盤四部分的數(shù)據(jù),而Paramon的設(shè)計(jì)則是將內(nèi)存、SWAP、本地磁盤、以太網(wǎng)、InfiniBand以及網(wǎng)絡(luò)文件系統(tǒng)的數(shù)據(jù)以可視化的方法置于同一界面中,此界面涉及已經(jīng)申請專利保護(hù),符合人腦學(xué)習(xí)習(xí)慣,在有限視野中涵蓋了豐富的數(shù)據(jù),長期使用能夠習(xí)得一種高效的模式識別!熟悉此界面的專家,掃一眼就能了解機(jī)群的運(yùn)行情況,包括是否存在閑置、性能瓶頸、故障判斷、非計(jì)劃任務(wù)等。”
并行科技CTO陳健
據(jù)悉,由并行科技和英特爾工程師團(tuán)隊(duì)合作翻譯的《Intel® Xeon Phi™協(xié)處理器高性能程序設(shè)計(jì)》中文版書籍,將在10月份由人民郵電出版社正式出版。此書巧妙地以賽車為例,由通用編程模式開始從硬件到軟件,操作系統(tǒng),編程實(shí)踐,數(shù)學(xué)庫到性能剖析和優(yōu)化層層展開,抽絲剝繭,是關(guān)于Intel® Xeon Phi™協(xié)處理器上高性能編程的最新工程專著。此次峰會(huì)上,并行科技展出了此書的試讀版本,與會(huì)人員表示了對此書的極大興趣,對于使用Intel® Xeon Phi™協(xié)處理器的用戶以及英特爾而言,這無疑不是進(jìn)行相關(guān)培訓(xùn)的最佳書籍。
最后,陳健總結(jié)道:“Paramon是目前唯一的秒級實(shí)時(shí)可視化性能工具,能夠看到程序運(yùn)行的當(dāng)前狀態(tài),實(shí)時(shí)的浮點(diǎn)計(jì)算性能、內(nèi)存帶寬、向量化以及CPI,相比于Intel® VTune Amplifier而言,較為便捷。并行科技的Paramon、Paratune軟件得到了能源行業(yè)的大力支持,全中國能源行業(yè)Paramon的安裝機(jī)群數(shù)多達(dá)80套,總安裝服務(wù)器數(shù)量已超過2萬臺,全中國HPC Top100裝機(jī)率超過30%。Paramon0.1版本在勝利油田的地質(zhì)院安裝使用,Paramon1.0版本在大慶油田安裝使用,Paramon1.2版本在中石油東方地球物理公司(BGP)實(shí)現(xiàn)價(jià)值,Paramon3.0在南京物探(中國石化石油物探技術(shù)研究院)安裝使用,而最新的Paramon可以將商用、應(yīng)用級作業(yè)調(diào)度嵌入到軟件中,后臺提交的作業(yè)對于黑匣子管理員來說是透明的。總體上,并行科技的Para應(yīng)用運(yùn)行特征文件實(shí)現(xiàn)了機(jī)群性能優(yōu)化循環(huán)的可查看、可記錄、可分析、可交流,是應(yīng)用用戶與性能專家之間進(jìn)行溝通交流的語言。”