北京市環(huán)境保護檢測中心需要一個并行計算集群來運行北京市空氣質(zhì)量決策支持系統(tǒng),空氣質(zhì)量決策支持系統(tǒng)內(nèi)主要運行MM5氣象模型和Model-3 (CMAQ)空氣污染擴散模型。曙光公司全面分析了用戶的實際需求,根據(jù)實際的用戶需求,曙光公司制定出如下的方案設計原則:
實際原則,從實際應用出發(fā),遵照實際情況確定方案的選擇與實施。
先進原則,利用先進的計算機技術(shù)來建設一套完整的應用于科學計算的集群系統(tǒng)。
經(jīng)濟原則,系統(tǒng)采用廣泛應用且具有良好性能價格比的產(chǎn)品,既考慮節(jié)省投資,又保證產(chǎn)品的先進性和可用性。
安全原則,系統(tǒng)應該受到嚴格的安全監(jiān)控,保證系統(tǒng)的正常運行。
擴展原則,系統(tǒng)支持動態(tài)擴展,在系統(tǒng)性能需要提升時,可以很方便地進行擴展。易管理原則,64個節(jié)點的機群服務器的管理必須非常簡便,可以保證系統(tǒng)管理的有序性,高效性,避免管理上的混亂。
依據(jù)以上設計原則,曙光公司設計出面向高性能計算的曙光TC4000集群系統(tǒng)方案。該集群系統(tǒng)由1個管理節(jié)點、4個計算節(jié)點、一套MYRINET網(wǎng)絡、一套千兆以太網(wǎng)絡、機柜系統(tǒng)、電源系統(tǒng)、SKVM系統(tǒng)、硬件監(jiān)控系統(tǒng)以及其他附件組成。該集群系統(tǒng)通過四套網(wǎng)絡(MYRINET計算網(wǎng),千兆管理網(wǎng), SKVM網(wǎng)。IIC監(jiān)控網(wǎng))將管理節(jié)點、計算節(jié)點以及控制設備和監(jiān)控設備連接起來,組成了一個充滿活力的集群系統(tǒng),這個集群系統(tǒng)具備以下幾個特點:
管理節(jié)點和計算節(jié)點分開:能夠充分利用計算節(jié)點的計算能力,將管理任務分配給管理節(jié)點大大地提高了計算節(jié)點的運算能力。
千兆管理網(wǎng)絡:千兆以太網(wǎng)的作用是在MYRINET網(wǎng)出現(xiàn)故障的時候仍然能夠提供不間斷的計算服務,并且千兆以太網(wǎng)還提供了絕大多數(shù)的管理功能
SKVM網(wǎng)絡:使得管理節(jié)點就像管理本地計算機一樣輕松,并且這樣的事情可以在幾百米以外完成。
管理監(jiān)控網(wǎng)絡:采用基于硬件采集的監(jiān)控系統(tǒng),不占用系統(tǒng)資源,做到主板級的監(jiān)控。
提供千兆外部連接,用戶可以通過千兆網(wǎng)絡連接到管理節(jié)點從而使用整個集群系統(tǒng)。
曙光公司TC4000集群在北京市環(huán)境保護檢測中心的成功應用顯示了曙光在行業(yè)應用領(lǐng)域的領(lǐng)先地位。實際上,曙光公司一直致力于服務氣象行業(yè),特別是在國際型重大活動的舉辦中都有非常出色的發(fā)揮,同時在氣象行業(yè)積累了豐富的行業(yè)經(jīng)驗。2001年,曙光服務器成功地服務了第21屆大學生運動會。2002年曙光公司正式推出了專門面向氣象研究的氣象專用計算機,填補了國家空白,當年此類機型就應用于西藏和貴州省的氣象服務,去年又進入了山西氣象局等氣象系統(tǒng),開辟了一條科研和市場同步走的先河。作為引領(lǐng)IT潮流的曙光64位集群計算機,采用了國際領(lǐng)先的AMD OPTERON處理器,國內(nèi)運行次數(shù)最高的每秒運算10萬億次的超級服務器曙光4000A也采用了同種系統(tǒng)結(jié)構(gòu)。作為我國高性能計算領(lǐng)域的領(lǐng)頭雁,曙光公司在“整合計算,細分應用”的指導思想下,已經(jīng)在我國的氣象、石油等關(guān)系到國計民生的重點行業(yè)中積累了豐富的行業(yè)應用經(jīng)驗,而隨著浮點運算達到10萬億次的曙光4000A在上海超級計算中心投入運營,曙光高性能計算機在我國的現(xiàn)代化建設發(fā)揮愈來愈重要的作用。