浪潮 發(fā)表于:14年07月23日 00:00 [來稿] DOIT.com.cn
新的集群讓應用的運算時間縮短了1/10,這對整體研發(fā)效率的提升作用是顯而易見的,讓我們能夠更加專注于對航空、航天、航海理論的研究和更多研究模型的建立。同時,浪潮視我們如Partner的感覺,也確實幫助我們解決了大量的應用問題。
——西北工業(yè)大學網絡中心負責人
西北工業(yè)大學是我國唯一一所以發(fā)展航空、航天、航海工程教育和科學研究為特色的研究型、多學科和開放式的科學技術大學,在三航的高性能計算領域承擔了多項國家自然科學基金重點課題,如大型航空整體結構軟件變型機理及精度保障技術、空天飛行器材料與結構的性能評價及關鍵理論研究、材料與制品性能預測的多尺度模型與計算方法等。
又快又準的雙重挑戰(zhàn)
航空、航天、航海領域的很多研究都離不開超級計算機,如飛行器材料篩選、外觀設計、飛行安全性預測、發(fā)動機機艙燃燒模擬、宇宙飛船所在的外太空分子模擬等。三航領域對超級計算機的要求非常高,不僅要求計算效率要足夠快、更重要的是要求計算出來的數(shù)據(jù)絕對可靠和精準,否則一個小小的偏差則有可能在實際制作中損失大量的經費。
西北工業(yè)大學計劃興建一套高性能計算集群,主要用于西工大航空、航天、航海、材料、機電等學科領域的材料計算、結構計算、流體計算、電磁計算、分子動力學計算、有限元計算等方面,并承擔西北工業(yè)大學Chinagrid教學科研平臺的一些任務。
新瓶如何裝舊酒?
西北工業(yè)大學原有的高性能計算集群上已運行了多個三航應用程序,如何將這些既有的應用順暢的遷移到新的集群之中,是迫切需要解決的問題。如西北工業(yè)大學的材料云管理系統(tǒng),用戶主要通過該系統(tǒng)進行計算任務的提交和管理工作,為了方便用戶使用新集群,需要把新集群的管理系統(tǒng)ClusterEngine和原有系統(tǒng)進行整合。但是ClusterEngine和西北工大材料云系統(tǒng)的開發(fā)語言和框架完全不同,整合難度和工作量非常大。
針對三航應用的特點,浪潮為西北工業(yè)大學設計構建了峰值計算性能達80萬億次的超級計算機系統(tǒng),在國內高校和三航應用領域處于領先地位。該集群具有計算性能優(yōu)越、功耗控制領先、監(jiān)控管理系統(tǒng)方便易用、系統(tǒng)開放易于擴展、服務體系完善等特點。
首先,系統(tǒng)采用性能強勁的Intel Sandybridge E5-2670處理器,CPU總體理論計算峰值高達53TFlops;系統(tǒng)存儲總容量219TB,分為并行存儲系統(tǒng)179TB,光纖存儲系統(tǒng)40TB;另外,考慮到節(jié)能、空間、擴展、維護等因素,浪潮選用了高密度刀片服務器作為計算服務器組;在網絡方面采用Mellanox Infiniband 高速網絡組成胖樹架構的計算網絡,保障全線速互聯(lián);并且為了更好的協(xié)助用戶提升新架構應用水平與能力,浪潮配置了最新Kepler K20 GPU加速節(jié)點。整體項目中采用了浪潮高擴展性并行存儲系統(tǒng)TSExaStor,具有更高的帶寬、更強的穩(wěn)定性、更友好的界面和更多的備份策略,并且配置了一套IPMI網絡,便于管理員的帶外管理。
軟硬一體化服務提升科研效率
為了讓客戶盡快使用集群,現(xiàn)場實施工程師和后臺研發(fā)工程師從客戶處要來資料熟悉材料云的實現(xiàn)方式,經過一周的努力,把ClusterEngine的主要模塊進行了移植,通過材料云管理系統(tǒng)可以無縫的對新集群進行管理和任務提交。
新的高性能計算集群進一步縮短了三航應用的運算時間,縮短了大約1/10左右的研發(fā)時間。同時,浪潮也深入參與到三航領域的高性能計算管理軟件的開發(fā)和應用軟件開發(fā)。目前,雙方共同開發(fā)的面向三航的ClusterEngine高性能計算服務平臺已獲得了顯著的成果。
同時,西北工業(yè)大學之前使用了多個商用軟件,這些軟件按照使用的license數(shù)量進行計費。為提高浮動 license的使用效率,西工大與浪潮合作開發(fā)了浮動 license調度系統(tǒng),該系統(tǒng)可以自動調度 license,提高了浮動 license的使用效率,加快了科研進度。
在異構應用研究領域,雙方共同開展基于GPU、MIC平臺的計算流體力學應用優(yōu)化也取得了豐碩成果,其中基于MIC平臺的計算流體力學應用優(yōu)化算法成為2012年IDF12大會的唯一MIC展示案例。