華東理工大學(xué)地處人文薈萃、海納百川的大都市上海,原名華東化工學(xué)院,其辦學(xué)歷史可以追溯到100多年前的南洋公學(xué)和震旦學(xué)院,是1952年全國院系調(diào)整時由交通大學(xué)(上海)、震旦大學(xué)(上海)、大同大學(xué)(上海)、東吳大學(xué)(蘇州)、江南大學(xué)(無錫)等校的化工系合并組建而成的全國第一所以化工特色聞名的院校。
華東理工大學(xué)化工學(xué)院是學(xué)校重點院系,院系的師生這些年來在分子計算領(lǐng)域取得了極大的進展,以Gaussian,MS為中心的多種計算化學(xué)方面的高性能計算軟件和多幾點的高性能集群正在幫助材料學(xué)研究者以及理論化學(xué)研究者們實現(xiàn)多種計算機實驗和推導(dǎo)。
用戶需求:
由于計算化學(xué)領(lǐng)域計算問題非常復(fù)雜,采用高性能計算機系統(tǒng)成為理論化學(xué)計算的必由之路。而院系原來一直采用AMD處理器的服務(wù)器進行運算,目前已經(jīng)不能滿足院系師生的需求,學(xué)院決定更新高性能集群服務(wù)器,切實實現(xiàn)高性能并行計算應(yīng)用分析。
更高的性能價格比。更高的可擴展性。更高的可管理性。更高的系統(tǒng)強壯性。對應(yīng)用系統(tǒng)的支持。
項目實施:
寶德科技的技術(shù)工程師立足前期的成功合作案例和經(jīng)驗,在INTEL的大力支持下,通過長達2個月的校方應(yīng)用方向和需求分析,運用INTEL解決方案中心的測試條件,同時兼顧后期校方的更大規(guī)模網(wǎng)格計算的擴展需要,針對性的推出了POWER 8000 HPC應(yīng)用方案。
寶德技術(shù)人員投入極高的專注和熱情,針對華東理工的項目特點,設(shè)計了一整套符合學(xué)院軟件要求的集群方案,并在學(xué)院采購前和學(xué)院師生一起搭建測試平臺,驗證設(shè)計方案。
另外Intel提供了系列的優(yōu)化工具、編譯工具、集群工具等眾多高性能計算組件,為IA架構(gòu)、標(biāo)準(zhǔn)互聯(lián)的高性能計算系統(tǒng)應(yīng)用提供高效率的保證。成為本次HPC項目成功實施的關(guān)鍵。
方案描述:
寶德科技為華東理工大學(xué)高性能集群系統(tǒng)可提供標(biāo)準(zhǔn)的Intel服務(wù)器平臺系統(tǒng),先進的高性能服務(wù)器集群系統(tǒng),具有實時多任務(wù)并行操作的高性能、高可用性、高穩(wěn)定性、可靠性、可擴展性等優(yōu)勢。
寶德HPC解決方案充分結(jié)合客戶的實際需要,提供了以最新Woodcrest雙核服務(wù)器為計算節(jié)點的Power Cluster8000I高性能計算機系統(tǒng),采用免費OSCAR中間件實現(xiàn)節(jié)點管理、任務(wù)分發(fā)和集群監(jiān)控,使用以太網(wǎng)的優(yōu)化通信庫模塊來實現(xiàn)節(jié)點之間的進程通信。
再加上一套完整的Intel優(yōu)化編譯工具和函數(shù)庫等軟件來優(yōu)化化工院的應(yīng)用,使系統(tǒng)的性能得到充分的發(fā)揮,成為高校高性能計算系統(tǒng)推廣的表率之一。
華東理工大學(xué)高性能計算計算集群系統(tǒng)是一個是基于網(wǎng)絡(luò)、面向科研等的大型高性能并行計算系統(tǒng),該系統(tǒng)的基礎(chǔ)是主控節(jié)點、計算節(jié)點等硬件基礎(chǔ)平臺的建設(shè)和互聯(lián)系統(tǒng)的建設(shè)。
該HPC系統(tǒng)對研究方向所涉及的大規(guī)模高復(fù)雜性系統(tǒng)模型驗證算法、大規(guī)模數(shù)據(jù)處理與服務(wù)等問題的研究提供了有效的支撐平臺,性能超過語氣,而成本投入比小型機集群節(jié)省60%。”采用基于WOODCREST處理器的計算平臺和以太網(wǎng)互聯(lián)網(wǎng)絡(luò),在多個測試實例中,用Intel編譯器編譯應(yīng)用程序和MPI庫函數(shù)比用GNU編譯器獲得53%-60%的性能提升。
技術(shù)實現(xiàn):
寶德高性能計算集群系統(tǒng)分層次設(shè)計,按照Intel的高性能計算生態(tài)系統(tǒng)部署,自上而下,按照:HPC并行應(yīng)用程序→中間件集群管理和通信庫以及各類軟件優(yōu)化工具→操作系統(tǒng)→計算節(jié)點和主控節(jié)點的硬件平臺→系統(tǒng)環(huán)境的部署設(shè)計:包括散熱、電源、空間布局等規(guī)范化的設(shè)計。
Intel高性能計算生態(tài)系統(tǒng)是Intel在業(yè)界多年研究和分析的結(jié)晶,科學(xué)的層次化部署,將復(fù)雜的大型并行計算平滑移植到性價比良好的IA架構(gòu)的平臺上,并保證相當(dāng)?shù)男?,不但為大型并行計算問題開拓出了新的解決方案,也為未來的網(wǎng)格計算做好了相當(dāng)?shù)睦碚撛O(shè)計基礎(chǔ)。
HPC系統(tǒng)從各個關(guān)鍵部件如節(jié)點、網(wǎng)絡(luò)拓撲、中間件、管理平臺的選用最終決定了HPC系統(tǒng)本身的穩(wěn)定和可靠,以及最關(guān)鍵的效能。本系統(tǒng)采用純英特爾服務(wù)器機架式設(shè)計,繼承了Intel服務(wù)器平臺七大技術(shù),保證高性能計算系統(tǒng)平臺的高可靠、高可用和可維護性:
√指示燈引導(dǎo)診斷(Light-Guided Diagnostics):提高可維護性和故障的迅速恢復(fù)。
√電源和散熱空間(Power and Thermal Headroom):進行電源和散熱工程設(shè)計預(yù)算,以實現(xiàn)最高性能。
√主動氣流控制(Active Airflow Control):提供機箱散熱和風(fēng)扇控制,保證服務(wù)器冷卻和安靜。
√硬盤穩(wěn)定技術(shù)(Drive Stabilization Technology):提高硬盤的可靠性、使用壽命和性能
√驅(qū)動器電源隔離(Drive Power Isolation):為熱插拔硬盤提供關(guān)鍵緊急保護
√多路徑引導(dǎo)(Multi-Path Boot):保證系統(tǒng)即使在出現(xiàn)許多基礎(chǔ)錯誤時也能正常啟動。
√驗證壓力測試套件(Validation Stress Test Suite):有助于確保最新高性能服務(wù)器的數(shù)據(jù)完整性
并根據(jù)系統(tǒng)環(huán)境的各種物理機械、電磁兼容性設(shè)計及冗余設(shè)計等,嚴(yán)格按照國家規(guī)范進行。
推薦硬件:
節(jié)點采用寶德PR1510D服務(wù)器,采用INTEL 5110處理器,2GB ECC DDR RAM、SATA II 80G、Intel主板集成的雙千兆以太網(wǎng)卡Intel 。
軟件環(huán)境:
操作系統(tǒng):RedHat Linux AS 3.0(支持64位應(yīng)用);
應(yīng)用軟件系統(tǒng):MPICH(RedHat Linux自帶的模塊);
其他:GNU C/C++編譯器、Intel C/C++編譯器、Total View調(diào)試工具、Intel Vtune調(diào)試工具、Intel® Cluster Tools集群工具(生成、分析和優(yōu)化集群應(yīng)用)。
經(jīng)驗收獲:
寶德高性能計算集群系統(tǒng)的軟件和硬件以及基礎(chǔ)架構(gòu)都保證了規(guī)范、標(biāo)準(zhǔn)、開放、通用,可以方便使用和在其平臺上開發(fā)自己的應(yīng)用。最大限度的提高了應(yīng)用的效率和移植性,適合于客戶在化學(xué)領(lǐng)域多種應(yīng)用的部署。
華東理工化學(xué)計算研究中心主任黃偉民認為:“寶德科技的高性能計算集群系統(tǒng)由于采用了業(yè)內(nèi)領(lǐng)先的技術(shù),不僅性能突出,安全穩(wěn)定,對未來的擴展能力也極強,用戶完全可以放心將來的集群擴展問題。整個集群的峰值計算能力以及實際預(yù)算能力這兩項指標(biāo)都能躋身同類產(chǎn)品的前列,同時又有一個更低廉的價格?!?/P>
深圳寶德科技有限公司總經(jīng)理張云評價:本次采用INTEL架構(gòu)服務(wù)器搭建的HPC環(huán)境,充分體現(xiàn)了領(lǐng)先一代的Intel IA平臺從研發(fā)到制造工藝,Intel積累了近二十年的技術(shù)結(jié)晶,厚積薄發(fā),為高性能計算研究領(lǐng)域提供最好的計算平臺。