Doserv 發(fā)表于:13年07月26日 10:00 [來稿] DOIT.com.cn
7月18-19日,英特爾集成眾核技術(shù)峰會在北京怡生園國際會議中心召開。本次峰會是英特爾集成眾核產(chǎn)品發(fā)布以來第一次專注于集成眾核技術(shù)的盛會。會議主要圍繞集成眾核技術(shù)深入展開,匯集了集成眾核技術(shù)的最新信息和行業(yè)前沿。參加此次會議并現(xiàn)場演講的嘉賓天河二號副總設計師盧凱研究員、并行科技CEO陳健、中國科學院網(wǎng)絡中心曹宗雁、東方地球物理公司物探技術(shù)研究中心副總工陳維、清華大學付昊桓、華大基因王丙強,以及英特爾的何萬青、陳媛、游亮、王哲等專家,與來自生命科學、石油化工、互聯(lián)網(wǎng)和科研機構(gòu)的客戶匯聚一堂,共同分享探討了Intel® Xeon Phi™協(xié)處理器產(chǎn)品特性及相關案例。并行科技(https://www.paratera.com)作為此次會議的獨立軟件開發(fā)商(ISV),由陳健帶來關于Intel® Xeon Phi™協(xié)處理器的高性能計算解決方案。
并行科技CTO陳健詳解“Intel® Xeon Phi™協(xié)處理器高性能計算解決方案”
陳健首先以Intel® Cluster Ready為切入點,介紹了并行科技的HPC機群建設整體解決方案:“ParaPlus是并行科技在國際通行的Rocks系統(tǒng)開源軟件基礎上,進行二次開發(fā)后形成的一套經(jīng)濟穩(wěn)定的成熟方案,其標準實施軟件是經(jīng)過Intel® Cluster Ready認證的。其中包括兩類機群管理軟件:第一,Rocks機群管理軟件,對于用戶而言,能夠免費獲取軟件,只需支付少量服務費用;第二,Bright Cluster Manager™,目前是英特爾主推的一個機群管理套件,已全部完成對Intel® Xeon Phi™協(xié)處理器的支持。BCM由Bright Computing公司提供,其可視化完成整個機群的安裝、使用及管理。對于用戶而言,最重要的是它已經(jīng)集成了所有Intel® Xeon Phi™協(xié)處理器的相關軟件,使得用戶能夠快速便捷地使用Intel® Xeon Phi™協(xié)處理器。”
隨后,陳健詳細闡述了針對Intel® Xeon Phi™協(xié)處理器的高性能計算解決方案,其包含三部分:(1)機群管理套件;(2)針對Intel® Xeon Phi™協(xié)處理器的調(diào)度系統(tǒng),可實現(xiàn)多種應用模式的調(diào)度,比如調(diào)度MPI+Offload,或者把單進程任務直接調(diào)度至Intel® Xeon Phi™協(xié)處理器上,以及將MPI的任務直接調(diào)度到Intel® Xeon Phi™協(xié)處理器的本地區(qū)運行,另外,MPI任務還可以在常規(guī)服務器節(jié)點以及協(xié)處理器節(jié)點之間混合使用;(3)性能分析可視化軟件Paramon,盡可能地將高性能計算的程序開發(fā)、運行可視化,實現(xiàn)動態(tài)、實時地查看數(shù)據(jù)。
Intel® Xeon Phi™協(xié)處理器性能可視化分析
Paramon能夠?qū)崟r顯示基于Intel® Xeon Phi™協(xié)處理器的實時浮點性能Gflops值,此數(shù)值在以前并不存在獲取的較好辦法,而基于Paramon軟件可以實現(xiàn)秒級刷新,一秒一刷新當前系統(tǒng)中正在運行的所有程序。Paramon能夠做到以卡為單位,即以一個嵌入式操作系統(tǒng)為單位,來捕捉卡的利用率。在Paramon4.0中,預計8月31日發(fā)布,提供兩個最基本的Intel® Xeon Phi™協(xié)處理器的微架構(gòu)數(shù)據(jù)——CPI、向量化率,這是目前常規(guī)應用移植到Intel® Xeon Phi™協(xié)處理器上所遇到的兩個瓶頸點,并行科技已將這兩個瓶頸點解決。同時在執(zhí)行性能的移植與調(diào)優(yōu)時,可通過Paramon、Paratune迅速定位問題,快速識別應用性能瓶頸。
陳健說道:“目前對于高性能計算領域,幾百臺服務器的一套機群已經(jīng)較為常見,所以我們首先考慮大規(guī)模機群運行狀態(tài)實時可視化,然后是盡可能地讓計算單元發(fā)揮最大性能,但如何能夠保證這一點?此時需要在一個界面內(nèi)看到所有CPU、內(nèi)存、網(wǎng)絡、磁盤四部分的數(shù)據(jù),而Paramon的設計則是將內(nèi)存、SWAP、本地磁盤、以太網(wǎng)、InfiniBand以及網(wǎng)絡文件系統(tǒng)的數(shù)據(jù)以可視化的方法置于同一界面中,此界面涉及已經(jīng)申請專利保護,符合人腦學習習慣,在有限視野中涵蓋了豐富的數(shù)據(jù),長期使用能夠習得一種高效的模式識別!熟悉此界面的專家,掃一眼就能了解機群的運行情況,包括是否存在閑置、性能瓶頸、故障判斷、非計劃任務等。”
并行科技CTO陳健
據(jù)悉,由并行科技和英特爾工程師團隊合作翻譯的《Intel® Xeon Phi™協(xié)處理器高性能程序設計》中文版書籍,將在10月份由人民郵電出版社正式出版。此書巧妙地以賽車為例,由通用編程模式開始從硬件到軟件,操作系統(tǒng),編程實踐,數(shù)學庫到性能剖析和優(yōu)化層層展開,抽絲剝繭,是關于Intel® Xeon Phi™協(xié)處理器上高性能編程的最新工程專著。此次峰會上,并行科技展出了此書的試讀版本,與會人員表示了對此書的極大興趣,對于使用Intel® Xeon Phi™協(xié)處理器的用戶以及英特爾而言,這無疑不是進行相關培訓的最佳書籍。
最后,陳健總結(jié)道:“Paramon是目前唯一的秒級實時可視化性能工具,能夠看到程序運行的當前狀態(tài),實時的浮點計算性能、內(nèi)存帶寬、向量化以及CPI,相比于Intel® VTune Amplifier而言,較為便捷。并行科技的Paramon、Paratune軟件得到了能源行業(yè)的大力支持,全中國能源行業(yè)Paramon的安裝機群數(shù)多達80套,總安裝服務器數(shù)量已超過2萬臺,全中國HPC Top100裝機率超過30%。Paramon0.1版本在勝利油田的地質(zhì)院安裝使用,Paramon1.0版本在大慶油田安裝使用,Paramon1.2版本在中石油東方地球物理公司(BGP)實現(xiàn)價值,Paramon3.0在南京物探(中國石化石油物探技術(shù)研究院)安裝使用,而最新的Paramon可以將商用、應用級作業(yè)調(diào)度嵌入到軟件中,后臺提交的作業(yè)對于黑匣子管理員來說是透明的。總體上,并行科技的Para應用運行特征文件實現(xiàn)了機群性能優(yōu)化循環(huán)的可查看、可記錄、可分析、可交流,是應用用戶與性能專家之間進行溝通交流的語言。”