曙光拓?fù)浣Y(jié)構(gòu)圖

集群 GPU 計(jì)算節(jié)點(diǎn)共配置 200 余塊 NVIDIA Tesla C2050 GPU 卡,共提供 118.15Tflops 計(jì)算能力,助中山大學(xué)進(jìn)入 2011 年中國(guó)高性能計(jì)算機(jī)性能 TOP100 排行榜。

曙光公司自主研發(fā)的Parastor并行文件系統(tǒng),兩個(gè)IO節(jié)點(diǎn),對(duì)計(jì)算節(jié)點(diǎn)提供80G的IO帶寬,可大大提升系統(tǒng)的IO性能。Parastor優(yōu)勢(shì)還包括: 基于對(duì)象存儲(chǔ),使存儲(chǔ)更具智能化;對(duì)單個(gè)目錄下的元數(shù)據(jù)操作進(jìn)行優(yōu)化;數(shù)據(jù)安全性,可選支持多副本方式,充分保護(hù)數(shù)據(jù)安全性;極佳的可擴(kuò)展性。基于對(duì)象存儲(chǔ)的體系結(jié)構(gòu)使系統(tǒng)可以支持幾萬(wàn)個(gè)客戶節(jié)點(diǎn),存儲(chǔ)容量支持Petabytes級(jí)別;由于Parastor已經(jīng)部署到多個(gè)不同規(guī)模大小的實(shí)際機(jī)群系統(tǒng)中,可滿足商業(yè)和安全應(yīng)用對(duì)正常運(yùn)行時(shí)間的要求;支持多種主流的網(wǎng)絡(luò)連接,包括TCP/IP,Myrinet,Infiniband,Qrandrics等;和曙光集群管理軟件結(jié)合,對(duì)文件系統(tǒng)部署、文件系統(tǒng)管理、文件系統(tǒng)快速恢復(fù)提供良好支持。

三套網(wǎng)絡(luò),專網(wǎng)專用。高速計(jì)算網(wǎng)采用Inifiband 40Gbps全互聯(lián)高速網(wǎng)絡(luò),用于并行計(jì)算時(shí)的數(shù)據(jù)交換和計(jì)算通訊;數(shù)據(jù)網(wǎng)亦稱接入網(wǎng),采用高性能千兆以太網(wǎng),主要用于用戶接入、IO讀寫等,同時(shí)數(shù)據(jù)網(wǎng)又作為高速計(jì)算網(wǎng)的備份;管理網(wǎng)采用千兆以太網(wǎng),用于系統(tǒng)管理控制、系統(tǒng)監(jiān)控、作業(yè)的遞交、作業(yè)監(jiān)控等監(jiān)控管理方面的數(shù)據(jù)通訊,同時(shí)管理網(wǎng)又作為數(shù)據(jù)網(wǎng)的備份。

眾多并行基礎(chǔ)軟件。集群應(yīng)用范圍很廣,因此需要很多基礎(chǔ)軟件。操作系統(tǒng):業(yè)界知名的Suse 64位企業(yè)版Linux操作系統(tǒng),性能卓越,安全可靠。MPICH和LAM-MPI:最穩(wěn)定、適用性最好MPI實(shí)現(xiàn),用于跨結(jié)點(diǎn)并行程序的開(kāi)發(fā)。并行虛擬機(jī)PVM:用于異構(gòu)系統(tǒng)下的并行程序開(kāi)發(fā)。編譯環(huán)境:提供GNU C/C++編譯器、GNU Fortran77/90/95編譯器、PGI/Intel C/C++、Fortran編譯器、Java、Python、QT、PERL開(kāi)發(fā)環(huán)境,滿足多種程序開(kāi)發(fā)需求;特別提供用于GPU程序開(kāi)發(fā)的驅(qū)動(dòng)、cudatoolkit和gpucomputing SDK.

數(shù)學(xué)庫(kù),程序優(yōu)化的重要手段。曙光提供AMD核心數(shù)學(xué)庫(kù)ACML、基本線性代數(shù)庫(kù)BLAS、針對(duì)特定平臺(tái)性能調(diào)優(yōu)的高性能BLAS庫(kù)GOTO和ATLAS、線性代數(shù)計(jì)算子程序包LAPACK、可擴(kuò)展線性代數(shù)庫(kù)ScaLAPACK、并行可擴(kuò)展科學(xué)計(jì)算工具箱PETSc、傅里葉變換數(shù)學(xué)庫(kù)FFTW。

高性能計(jì)算平臺(tái)管理軟件。曙光自主研發(fā)的Gridview支持GPU計(jì)算監(jiān)控,用戶可隨時(shí)了解GPU軟硬件信息,如GPU的型號(hào)、軟件版本、主頻、風(fēng)扇轉(zhuǎn)速和溫度變化等。

曙光高性能案例:曙光GPU集群管理全面護(hù)航中山大學(xué)

曙光Gridview軟件監(jiān)控界面

曙光公司表示,該系統(tǒng)的構(gòu)建主要遵從用戶的實(shí)際需求,秉承先進(jìn)型、成熟性、可靠性、以及可擴(kuò)展性的原則,不僅能夠滿足目前業(yè)務(wù)的需要,還能適應(yīng)未來(lái)技術(shù)發(fā)展的趨勢(shì),具備實(shí)用性與高性價(jià)比特點(diǎn),可有效保護(hù)用戶的投資。此次中山大學(xué)計(jì)算科學(xué)科研團(tuán)隊(duì)高性能計(jì)算系統(tǒng)的成功構(gòu)建,再一次說(shuō)明了曙光高性能解決方案綠色節(jié)能的獨(dú)特優(yōu)勢(shì)。

目前,中山大學(xué)的高性能計(jì)算平臺(tái)上有多個(gè)領(lǐng)域的各種應(yīng)用,例如生命科學(xué)領(lǐng)域的進(jìn)化基因組學(xué)與基因功能分析整合及應(yīng)用、地理科學(xué)領(lǐng)域的基于網(wǎng)格計(jì)算的地理模擬系統(tǒng)(GSS)平臺(tái)、環(huán)境科學(xué)領(lǐng)域的城市群空氣質(zhì)量數(shù)值預(yù)報(bào)和應(yīng)急救援污染擴(kuò)散預(yù)警、生物化學(xué)領(lǐng)域的QM/MM-FEP研究亞鐵螯合酶催化機(jī)制、信息科學(xué)領(lǐng)域的云計(jì)算-桌面虛擬化等等。

作為國(guó)內(nèi)高性能計(jì)算領(lǐng)域領(lǐng)軍企業(yè),曙光公司推出“產(chǎn)品+軟件服務(wù)+解決方案”一攬子GPU產(chǎn)品解決方案,以重點(diǎn)客戶、重點(diǎn)區(qū)域?yàn)橥黄泣c(diǎn),帶動(dòng)整體GPU產(chǎn)品銷售;并以其特有的GPU監(jiān)控、加速系統(tǒng)等國(guó)內(nèi)領(lǐng)先技術(shù)在GPU行業(yè)技術(shù)領(lǐng)域取得了重大的突破成果。

分享到

wangguang

相關(guān)推薦