曙光為高校構(gòu)建高效能計算機集群系統(tǒng)
曙光公司作為服務(wù)器行業(yè)的領(lǐng)軍者,服務(wù)器資源有著得天獨厚的優(yōu)勢。近年來,曙光公司為國內(nèi)眾多高校構(gòu)建了眾多具有高標準、高水平、高性能的系統(tǒng)平臺,能夠滿足不同高校多不同研究領(lǐng)域的計算需求。曙光為某華東高校構(gòu)建了全新的計算平臺,曙光服務(wù)器所構(gòu)建而成的系統(tǒng)在高性能計算方面的突出成就,令人滿意。
本系統(tǒng)采用曙光天潮系列高效能計算機架構(gòu)來構(gòu)建,采用CPU+GPU的混合架構(gòu),由7個機柜組成,用來安裝GPU專用機和曙光A840r-G計算節(jié)點,管理、登錄、I/O節(jié)點、高速交換機、存儲等設(shè)備。
曙光天潮高效能計算機力求在體系結(jié)構(gòu)、多處理機芯片組、高性能節(jié)點操作系統(tǒng)、高可擴展互連網(wǎng)絡(luò)、高吞吐率通信軟件、多線程分割全局地址空間編程模型及編譯器等核心技術(shù)上實現(xiàn)較大突破;并提供高效能計算機的高密度節(jié)點、可靠的系統(tǒng)結(jié)構(gòu)、虛擬化軟件、高效能海量存儲、并行文件系統(tǒng)、大規(guī)模系統(tǒng)的管理軟件、系統(tǒng)級魯棒性技術(shù)、超大規(guī)模并行算法等產(chǎn)品及技術(shù),從而實現(xiàn)系統(tǒng)的高性能、可編程性、可移植性和穩(wěn)定性。
本方案最大的特點是采用了全新的曙光四路服務(wù)器A840r-G作為計算節(jié)點,其所采用的AMD 最新一代8核或12 核Magny?Cours 處理器,同前代產(chǎn)品相比,進行各各項重大改進,A840r-G可最大支持48 個處理核心;A840r?G 服務(wù)器采用了AMD SR5690 系列高性能服務(wù)器芯片組,為用戶的各項應用提供更高的性能。同時,還支持先進的四通道DDR3 1333/1066 MHZ ECC 高性能內(nèi)存,內(nèi)存容量最大可達512GB,而且為用戶提供靈活且強大的內(nèi)存的配置選擇;此外,A840r-G服務(wù)器提供強大的虛擬化能力,AMD?V技術(shù)提供硬件IO 虛擬化支持,結(jié)合支持虛擬化的曙光高性能網(wǎng)卡技術(shù),將強大的A840r-G服務(wù)器虛擬成多個機器,可極大地提高整機性能和運行效率。
曙光A840r-G服務(wù)器的配備,更將其擁有的高穩(wěn)定性、強大計算性能、良好擴展能力、高可靠性、高可管理性以及節(jié)能減耗的優(yōu)勢應用到系統(tǒng)提升計算性能的技術(shù)需求當中,為該系統(tǒng)的節(jié)能減排以及提高計算性能提供了重要的技術(shù)保障。
在計算系統(tǒng)方面,曙光公司采用了開放的Cluster集群系統(tǒng),它擁有的獨特優(yōu)勢已經(jīng)占據(jù)了目前高性能計算機的主流位置,在TOP500中占據(jù)了80%以上的份額,在中小規(guī)模的高性能計算系統(tǒng)中更是占據(jù)統(tǒng)治地位。
同時,本方案的網(wǎng)絡(luò)系統(tǒng)的設(shè)計也從性能和可靠兩個原則出發(fā),采用2套網(wǎng)絡(luò)。網(wǎng)絡(luò)配置都考慮了擴展余量,以便系統(tǒng)擴充。該方案設(shè)計充分考慮到了計算節(jié)點、存儲節(jié)點、網(wǎng)絡(luò)交換機的性能參數(shù),在保證了系統(tǒng)穩(wěn)定的前提下,使每臺設(shè)備都能得到最大限度的利用。
存儲系統(tǒng)采用曙光新一代Gridview大型機綜合管理系統(tǒng)來提供統(tǒng)一的集中式監(jiān)控平臺,具備可擴展性、集成性、可靠性和易用性等特點。
曙光高效能計算機集群系統(tǒng)的優(yōu)勢
先進性
本系統(tǒng)采用先進而成熟的技術(shù)和產(chǎn)品,適應大規(guī)??茖W計算及數(shù)據(jù)處理的需要,所選設(shè)備指標應具有適度超前性,使整個系統(tǒng)具有較強的生命力,并具有更高的密度、更好的擴展性和更好的可管理性;
完整性
本方案為用戶提供了一個完整的、整體的解決方案。在系統(tǒng)基礎(chǔ)硬件之上,配置了SKVM系統(tǒng)和集群管理軟件、作業(yè)調(diào)度系統(tǒng),使得各個子系統(tǒng)可以完好整合。完整性還體現(xiàn)在:
硬件和系統(tǒng)的完整性:
本方案是一個完整的解決方案,用戶無需增加額外的硬件和軟件即可保證系統(tǒng)中所有設(shè)備正常運轉(zhuǎn)。
應用的完整性:
本方案不僅是硬件和系統(tǒng)軟件的解決方案,同時也是應用層的解決方案。
完整的培訓和文檔:
曙光公司不僅讓用戶能夠使用機器,而且還讓用戶能夠用好機器。為此本方案提供了一系列的培訓,培訓課程分別針對不同的人員,包括:普通用戶、系統(tǒng)管理人員、開發(fā)人員;培訓的內(nèi)容包括從集群的簡單使用到并行軟件的研制和并行算法的設(shè)計、從系統(tǒng)的管理和日常維護到設(shè)備的原理等一應俱全;訓的教師也包括一線經(jīng)驗豐富的技術(shù)工程師和長期從事科學研究的中科院計算所的專家。在有完備的培訓的同時,又為用戶提供了完備文檔。
兼容性
本方案采用了應用最廣泛的X86-64平臺,兼容性有了更好的保證??梢赃\行64位應用的同時,還可以兼容32位的應用,普通的32位應用軟件可以不經(jīng)過重新編譯直接運行在這樣的系統(tǒng)之下。這樣,用戶就可以由32位平滑的過渡到64位。
穩(wěn)定性
曙光高性能計算機具有較高的穩(wěn)定性和可靠性,受到了用戶的廣泛贊譽和有關(guān)部門的認可。
曙光公司為某高校量身定制的解決方案得到了用戶的高度認可,能夠有效的滿足某高校的研究以及計算需求。曙光公司作為國產(chǎn)服務(wù)器市場的領(lǐng)軍隊伍,歷年來為用戶提供了大量的行之有效的解決方案,曙光的產(chǎn)品技術(shù)均達到用戶對于大規(guī)模系統(tǒng)建設(shè)的需求。
此次為該國家重點高校構(gòu)建的曙光集群系統(tǒng)平臺為該校之后的課題研究、項目研究提供了重要的技術(shù)保障。在實現(xiàn)簡約管理的同時,大大減少了用戶的后期維護和管理成本。相信在曙光公司的助力下,該校將為我國的科學研究以及人才培養(yǎng)能夠做出更大的貢獻。
關(guān)于曙光:
公司是一家在科技部、信息產(chǎn)業(yè)部、中科院大力推動下,以國家"863"計劃重大科研成果為基礎(chǔ)組建的高新技術(shù)企業(yè)。它以中科院計算所、國家智能計算機研究開發(fā)中心和國家高性能計算機工程中心為技術(shù)依托,擁有強大的技術(shù)實力。曙光系列產(chǎn)品的問世,為推動我國高性能計算機的發(fā)展做出了不可磨滅的貢獻。2010年6月, 曙光推出了國內(nèi)首臺超千萬億次的高性能計算機系統(tǒng)曙光星云,獲得了第35屆全球TOP500排行榜中第二名,創(chuàng)造了中國歷年參選機器中的最好成績。
2010年,曙光天津產(chǎn)業(yè)基地二期落成投產(chǎn),不僅進一步提升了曙光公司企業(yè)的競爭力,更進一步推動了民族高性能計算機產(chǎn)業(yè)的發(fā)展。曙光高性能計算機連續(xù)15年穩(wěn)居國產(chǎn)高性能計算機市場第一,擁有國產(chǎn)高性能70%以上的份額,并在高性能集群領(lǐng)域?qū)崿F(xiàn)了國產(chǎn)機對進口產(chǎn)品的超越。曙光公司生產(chǎn)的系列服務(wù)器以技術(shù)先進、性能卓越、服務(wù)優(yōu)良見長,曾獲"國家科技進步一等獎、二等獎"、"中科院科技創(chuàng)新特等獎"、"2001、2003、2004中國十大科技進展"等多項國家級殊榮。
長期以來,曙光始終專注于服務(wù)器領(lǐng)域的研發(fā)、生產(chǎn)與應用,依托超級計算機的扎實功底,立足自主研發(fā),通過不斷技術(shù)創(chuàng)新,構(gòu)建出擁有完全自主知識產(chǎn)權(quán)的全系列精品服務(wù)器,能全面滿足用戶從超級計算機到普通PC服務(wù)器的各項應用需求,在互聯(lián)網(wǎng)、金融、電信、生物、氣象、石油、科研、電力等多個行業(yè)有著大量成功應用。