基于以上思考,華中科技大學(xué)的網(wǎng)格計(jì)算解決方案對(duì)高性能計(jì)算環(huán)境提出了如下需求:多臺(tái)高性能SMP計(jì)算節(jié)點(diǎn)和管理節(jié)點(diǎn)組成的高性能計(jì)算集群;每個(gè)計(jì)算節(jié)點(diǎn)配置2G 內(nèi)存;每個(gè)計(jì)算節(jié)點(diǎn)內(nèi)部系統(tǒng)和文件系統(tǒng)配置高速硬盤;計(jì)算節(jié)點(diǎn)間采用高帶寬低延遲的互聯(lián)設(shè)備,安全高效的網(wǎng)絡(luò)互聯(lián);開放通用的Linux操作系統(tǒng);通用高效率的并行模式,支持OpenMP、MPI等;多層次任務(wù)調(diào)度管理系統(tǒng);支持工業(yè)標(biāo)準(zhǔn)的語言環(huán)境,包括C、C++和Fortran等;針對(duì)高性能計(jì)算應(yīng)用的通用和擴(kuò)展數(shù)學(xué)庫,包含基本線性代數(shù)、矩陣運(yùn)算、快速傅立葉變換等科學(xué)運(yùn)算程序庫的相關(guān)軟件。
HP打造強(qiáng)大靈活的網(wǎng)格計(jì)算平臺(tái)
在對(duì)華中科技大學(xué)高性能計(jì)算需求進(jìn)行全面分析之后,HP設(shè)計(jì)了一個(gè)能夠使用戶在同樣的投資情況下、獲得最高性能并擁有靈活擴(kuò)展能力的高性能計(jì)算系統(tǒng)。
主機(jī)系統(tǒng)采用48臺(tái)rx2600服務(wù)器作為計(jì)算節(jié)點(diǎn),1臺(tái)rx2600服務(wù)器作為管理節(jié)點(diǎn),每個(gè)計(jì)算節(jié)點(diǎn)服務(wù)器配置一個(gè)千兆以太網(wǎng)作為計(jì)算網(wǎng)絡(luò),和一個(gè)100Mbps以太網(wǎng)作為管理網(wǎng)絡(luò)。2路HP Integrity rx2600動(dòng)能服務(wù)器配備了含6M三級(jí)高速緩存的1.5 GHz Intel安騰2處理器,或者含3M三級(jí)高速緩存的1.3 GHz Intel安騰2處理器以及高達(dá)24 GB的內(nèi)存,采用HP zx1芯片組,這一芯片組能夠通過降低內(nèi)存延遲并提高內(nèi)存與I/O子系統(tǒng)的可擴(kuò)展性,充分展現(xiàn)Intel安騰2處理器的強(qiáng)大動(dòng)力,使rx2600動(dòng)能服務(wù)器能夠?qū)崿F(xiàn)行業(yè)領(lǐng)先的性能和內(nèi)存的可擴(kuò)展性,處理更多的模擬數(shù)據(jù),更快地運(yùn)行復(fù)雜模型,并提供高品質(zhì)圖像,而在成本和復(fù)雜性方面卻更低。
在高性能計(jì)算系統(tǒng)應(yīng)用中,不僅需要高運(yùn)算能力,同時(shí)對(duì)存儲(chǔ)有著很高的要求,因?yàn)楦咝阅苡?jì)算應(yīng)用經(jīng)常需要短時(shí)讀寫大批量的數(shù)據(jù),這對(duì)存儲(chǔ)系統(tǒng)的性能特別是多道并行作業(yè)同時(shí)存取大量數(shù)據(jù)時(shí)的I/O性能提出很高要求。目前,在高性能計(jì)算領(lǐng)域中,當(dāng)節(jié)點(diǎn)數(shù)量比較少時(shí),可以采用SAN 存儲(chǔ)技術(shù),建立一個(gè)單獨(dú)的SAN存儲(chǔ)網(wǎng)絡(luò)。但由于目前SAN的建設(shè)成本還比較高,而且所支持的最大端口數(shù)僅為200~300個(gè)節(jié)點(diǎn)(不同廠商的具體數(shù)量不同),所以當(dāng)節(jié)點(diǎn)數(shù)量比較多時(shí),通常都采用網(wǎng)絡(luò)存儲(chǔ)技術(shù)。因此,在HP為華中科技大學(xué)設(shè)計(jì)的高性能計(jì)算系統(tǒng)中,采用一款低成本、可擴(kuò)展的高性能存儲(chǔ)系統(tǒng)HP MSA1000作為存儲(chǔ)系統(tǒng),存儲(chǔ)容量為5TB。
華工科技大學(xué)高性能計(jì)算系統(tǒng)方案采用Redhat Advance Server 2.1操作系統(tǒng)和Linux Beowulf集群技術(shù),它與通常意義上的網(wǎng)絡(luò)工作站(Network of Workstation)的最大區(qū)別在于兩個(gè)方面,一是集群系統(tǒng)提供兩個(gè)功能獨(dú)立的網(wǎng)絡(luò),有一個(gè)單獨(dú)的計(jì)算網(wǎng)絡(luò),獨(dú)立于管理網(wǎng)絡(luò),客戶與集群系統(tǒng)的通信是通過管理網(wǎng)絡(luò)來實(shí)現(xiàn);二是整個(gè)集群系統(tǒng)共享一個(gè)進(jìn)程ID號(hào),簡化了節(jié)點(diǎn)之間的通信。
方案特點(diǎn)突出,優(yōu)勢顯著
華中科技大學(xué)網(wǎng)格計(jì)算平臺(tái)不僅在芯片、操作系統(tǒng)和互聯(lián)等方面全面符合業(yè)界技術(shù)發(fā)展,而且能夠很好地滿足用戶處理能力的實(shí)際需要。通過采用處理器中浮點(diǎn)運(yùn)算性能最高、最先進(jìn)的安騰2處理器,使各種高性能應(yīng)用程序都可以得到最高的性能。目前在計(jì)算能力上達(dá)到了5000億次以上。華中科技大學(xué)從而也成為12個(gè)節(jié)點(diǎn)中第一個(gè)完成這一指標(biāo)的院校。
這一方案具有同等價(jià)格下的最優(yōu)性能,可以更好地滿足用戶在高性能計(jì)算方面的需求;該方案利用集群技術(shù)手段在節(jié)點(diǎn)計(jì)算能力提升或互聯(lián)設(shè)備上更為方便靈活地?cái)U(kuò)展和升級(jí),既充分保護(hù)了用戶的投資,又能夠確保系統(tǒng)的處理能力不斷適應(yīng)日益增長的應(yīng)用需求。
rx2600 動(dòng)能服務(wù)器用于集群解決方案,可進(jìn)一步增強(qiáng)安騰處理器和zx1芯片組的性能。由于每臺(tái)HP動(dòng)能rx2600服務(wù)器只有3.5英寸高(2U),在一個(gè)工業(yè)標(biāo)準(zhǔn)機(jī)柜中可以集群多達(dá)20個(gè)rx2600動(dòng)能服務(wù)器?D?D密集配置通過I/O、帶寬、內(nèi)存、海量存儲(chǔ)和計(jì)算容量等系統(tǒng)資源的整合,提供更高的效率和高可用性,從而能夠進(jìn)一步挖掘并增強(qiáng)rx2600價(jià)值和性能的巨大發(fā)展?jié)摿Α?BR>
在管理方面,方案采用了HP提供的集群管理軟件,使用效果比較好。華中科技大學(xué)原來自己也開發(fā)過管理軟件,但HP這套管理軟件更加穩(wěn)定可靠,使得整個(gè)系統(tǒng)的安裝和維護(hù)也更加方便。
另外,HP公司在很多高性能應(yīng)用領(lǐng)域具有極其豐富的經(jīng)驗(yàn),可以提供完整的解決方案給用戶。目前,HP的高性能計(jì)算系統(tǒng)在全球最大500臺(tái)計(jì)算機(jī)名單中占有168臺(tái),排名各廠家第一位,居于領(lǐng)先位置,已有許多使用類似節(jié)點(diǎn)的成功案例。
為什么選擇HP Integrity動(dòng)能服務(wù)器?
華中科技大學(xué)原來也有一些超級(jí)計(jì)算機(jī)系統(tǒng),但計(jì)算能力達(dá)不到要求,因此將需要重點(diǎn)鎖定為計(jì)算能力。作為適應(yīng)性系統(tǒng)成功典范,HP Integrity動(dòng)能服務(wù)器的64位計(jì)算能力比32位服務(wù)器更加強(qiáng)大,并且安騰處理器的浮點(diǎn)計(jì)算能力強(qiáng),存儲(chǔ)容量大,基于IA架構(gòu)也容易擴(kuò)展。
中國高性能計(jì)算及網(wǎng)格建設(shè)著名專家、華中科技大學(xué)金海教授表示:與主機(jī)相比,HP Integrity動(dòng)能服務(wù)器IA架構(gòu)的擴(kuò)展性好,成本相比低。如果采用大型機(jī),以華中科技大學(xué)目前構(gòu)建5000億次計(jì)算能力的超級(jí)計(jì)算機(jī)的預(yù)算,很難實(shí)現(xiàn)。
目前,華中科技大學(xué)已經(jīng)在這個(gè)超級(jí)計(jì)算機(jī)上運(yùn)行圖像處理應(yīng)用,三維虛擬人的重建,運(yùn)行效果非常好,而且,流體力學(xué)和物理方面的應(yīng)用也開始在這個(gè)超級(jí)計(jì)算機(jī)上運(yùn)行。該超級(jí)計(jì)算機(jī)已成為華中科技大學(xué)的公共計(jì)算平臺(tái),為整個(gè)學(xué)校的教育和科研提供服務(wù)。系統(tǒng)穩(wěn)定性很好,至今還沒有出現(xiàn)問題。應(yīng)用說,效果比預(yù)期的還要好。