ZDnet 發(fā)表于:14年06月04日 17:17 [綜述] DOIT.com.cn
基于開源軟件的集群和Linux操作系統(tǒng)統(tǒng)治著高性能計(jì)算(HPC)系統(tǒng),主要原因正是其成本效益以及靈活性,還有豐富的開源應(yīng)用可以使用。
IBM Platform HPC在單一產(chǎn)品中提供完整的高性能計(jì)算(HPC)管理解決方案,它包含豐富的即取即用功能集,通過減少HPC環(huán)境的復(fù)雜性和加速解決問題,賦予高性能技術(shù)計(jì)算用戶強(qiáng)大的能力。
IBM Platform HPC(PHPC)在單一產(chǎn)品中提供了基于Linux集群的一整套技術(shù)和高性能計(jì)算管理功能,通過自動(dòng)部署操作系統(tǒng)和軟件組件,系統(tǒng)管理員可以使用Platform HPC將復(fù)雜的集群作為單一系統(tǒng)進(jìn)行管理。Platform HPC提供了配置和維護(hù)能力,它還包括集中化的監(jiān)控,帶有警報(bào)和可定制的警報(bào)措施。
具體而言,Platform HPC包括以下功能:
<<集群管理(內(nèi)嵌的xCAT作為配置引擎)
<<工作負(fù)載管理(基于IBM Platform LSF Express)
<<工作負(fù)載監(jiān)控和報(bào)告
<<系統(tǒng)監(jiān)控和報(bào)告
<<強(qiáng)健的商業(yè)MPA Library(基于IBM Platform MPI標(biāo)準(zhǔn)版)
<<應(yīng)用支持(集成應(yīng)用腳本/模板)
<<加速器支持,包括GPU和英特爾至強(qiáng)Phi處理器調(diào)度、管理和監(jiān)控
<
<<統(tǒng)一的Web門戶
Platform HPC的應(yīng)用
通過一個(gè)易于使用的Web界面,IBM Platform HPC允許制造、石油、天然氣、生命科學(xué)以及高等教育等行業(yè)的技術(shù)型計(jì)算用戶配置、管理和使用他們的HPC集群,這為用戶最大限度減少了設(shè)置和管理集群所花費(fèi)的時(shí)間,讓他們把精力集中于應(yīng)用運(yùn)行,而不是管理基礎(chǔ)設(shè)施上。
IBM Platform HPC具有完整的針對(duì)ANSYS Mechanical、ANSYS Fluent、ANSYS CFX、LS-DYNA、MSC Nastran、Schlumberger ECLIPSES、Simulia、Abaqus、NCBI Blast、NWChem、ClustalW以及HMMER的任務(wù)提交模板。
通過配置這些基于環(huán)境的應(yīng)用設(shè)置模板,可以從一開始使用集群就不需要編寫腳本。那些配置自主或者開源應(yīng)用的集群用戶可以使用Platform HPC腳本指導(dǎo)方針。這些界面可以最大程度上減少任務(wù)提交錯(cuò)誤,并且是自我記錄的,讓用戶能夠創(chuàng)建自己的任務(wù)提交模板。
Platform Application Center(PAC)集成:Platform HPC中并不包含Platform LSF插件,用戶必須單獨(dú)下載并安裝這個(gè)插件。Platform HPC包括PAC的一些功能,如任務(wù)提交、任務(wù)管理以及應(yīng)用模板。
如果一個(gè)用戶購買了PAC標(biāo)準(zhǔn)版,同時(shí)會(huì)收到授權(quán),可以通過這個(gè)授權(quán),在現(xiàn)有的Platform HPC上啟用其他功能,如遠(yuǎn)程2D和3D可視化。不過,PAC雙體中包含PAC標(biāo)準(zhǔn)版的其他功能,因此,如果用戶需要這些功能,比如Role Based Access Control,必須單獨(dú)安裝PAC。
組件模型
Platform HPC軟件組件支持各種運(yùn)行于集群上的計(jì)算密集型應(yīng)用,為了支持這種應(yīng)用,圖2-1中顯示的Platform HPC軟件組件,并可以提供多項(xiàng)服務(wù)。
在開始任何軟件應(yīng)用之前,所有節(jié)點(diǎn)都要安裝操作系統(tǒng)和應(yīng)用軟件,這個(gè)功能是通過配置引擎提供的。在這里,用戶創(chuàng)建或者使用一個(gè)預(yù)先設(shè)定的配置模板,這個(gè)模板描述了計(jì)算節(jié)點(diǎn)軟件需要的特性。這個(gè)配置引擎通過一個(gè)選定的網(wǎng)絡(luò)接收啟動(dòng)請(qǐng)求,給系統(tǒng)安裝相應(yīng)的操作系統(tǒng)和應(yīng)用軟件,安裝完成之后,就可以運(yùn)行系統(tǒng)和目標(biāo)應(yīng)用了。
盡管計(jì)算圖像可以運(yùn)行應(yīng)用軟件,但是對(duì)這些圖像的訪問通常是被任務(wù)調(diào)度器(Platform LFS)控制的,它作為一個(gè)工作負(fù)載管理器運(yùn)行。這個(gè)調(diào)度器的功能是確保在計(jì)算節(jié)點(diǎn)上的計(jì)算資源不被序列化的訪問過度消耗。
這個(gè)調(diào)度器的屬性通常是在安裝過程中定義的,可以配置這個(gè)調(diào)度器,將不同工作負(fù)載分配提交給任務(wù)代理之一(Platform LSF代理),這個(gè)任務(wù)代理在接收到任務(wù)調(diào)度器的請(qǐng)求時(shí)開始特定的工作負(fù)載,系統(tǒng)中有多個(gè)任務(wù)代理,每個(gè)操作系統(tǒng)圖像上有一個(gè)。
這個(gè)監(jiān)控和資源代理向配置代理和任務(wù)調(diào)度器返回每個(gè)操作系統(tǒng)圖像的系統(tǒng)狀態(tài)報(bào)告,并提供一個(gè)機(jī)制,在發(fā)生故障的時(shí)候發(fā)出警報(bào),確保任務(wù)只在可用且有資源的操作系統(tǒng)圖像上進(jìn)行調(diào)度。
網(wǎng)絡(luò)門戶則為管理員提供了一個(gè)易于使用的機(jī)制,來控制和監(jiān)控整個(gè)集群,同時(shí)對(duì)于用戶來說,它提供了對(duì)系統(tǒng)易于使用的訪問,以進(jìn)行任務(wù)提交、管理和報(bào)告。
公司簡(jiǎn)介 | 媒體優(yōu)勢(shì) | 廣告服務(wù) | 客戶寄語 | DOIT歷程 | 誠(chéng)聘英才 | 聯(lián)系我們 | 會(huì)員注冊(cè) | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.