“目前大型超級計算機,特別是準E級或未來的E級系統(tǒng),在系統(tǒng)規(guī)模、擴展性、成本、能耗、可靠性等方面仍面臨著嚴峻挑戰(zhàn)。本次發(fā)布的硅元交換機是全球首款采用Torus架構(gòu)的高速網(wǎng)絡(luò)交換機產(chǎn)品,基于它構(gòu)建的超級計算機互連網(wǎng)絡(luò)系統(tǒng)具有領(lǐng)先的性能、超強的擴展能力、極佳的容錯能力,是邁向E級的最佳網(wǎng)絡(luò)技術(shù)路線?!笔锕夤綡PC產(chǎn)品事業(yè)部總經(jīng)理李斌介紹說。
與傳統(tǒng)胖樹網(wǎng)絡(luò)拓撲結(jié)構(gòu)相比,強調(diào)鄰近互連的Torus直接網(wǎng)絡(luò)在擴展性上具有明顯的優(yōu)勢,且網(wǎng)絡(luò)成本和系統(tǒng)規(guī)模呈線性關(guān)系。另外,因為具有很多冗余數(shù)據(jù)通路和采用動態(tài)路由,Torus網(wǎng)絡(luò)也具有天然的容錯性優(yōu)勢,這些都是超大規(guī)模系統(tǒng)所需要的網(wǎng)絡(luò)特性,也是國際主流的高速網(wǎng)絡(luò)技術(shù)發(fā)展方向。
李斌介紹說,曙光公司早在2015年的硅立方高性能計算機中就已實現(xiàn)了三維的3D-Torus。目前,曙光的Torus網(wǎng)絡(luò)技術(shù)研究又有了突破性進展。Torus網(wǎng)絡(luò)的維度從3D進化到了6D,提高Torus維度能有效降低大規(guī)模系統(tǒng)的最長網(wǎng)絡(luò)跳數(shù)。在軟件層面,支持6D-Torus的無死鎖動態(tài)路由算法已經(jīng)經(jīng)過實際環(huán)境檢驗;在硬件層面,本次發(fā)布的Torus硅元交換機就是一項重要的硬件實現(xiàn)。
“硅元”是指Torus高維直接網(wǎng)絡(luò)中的一個單元,一個硅元內(nèi)部采用3D-Torus拓撲結(jié)構(gòu),多個硅元可以構(gòu)建更高維的4D/5D/6D-Torus直接網(wǎng)絡(luò)。將一個3D-Torus硅元集成到一臺模塊化交換機,能夠極大提高系統(tǒng)集成度和密度,減少網(wǎng)絡(luò)線纜,降低部署復(fù)雜度,降低成本。本次發(fā)布的Torus硅元交換機可以支持多達192個100Gb高速網(wǎng)絡(luò)端口,Torus硅元交換機之間通過400Gb專用接口進行互連。
通過這樣的硬件實現(xiàn),也提高了Torus高速網(wǎng)絡(luò)技術(shù)的覆蓋范圍,一些中小規(guī)模的高性能計算系統(tǒng)也可以更便捷地享用這項先進技術(shù)。
值得一提的是,本次發(fā)布的Torus硅元交換機還支持冷板式直接液體冷卻,這標志著曙光的液體冷卻技術(shù)從計算設(shè)備延展到了網(wǎng)絡(luò)系統(tǒng)。液冷技術(shù)對提高大規(guī)模網(wǎng)絡(luò)系統(tǒng)的集成度和可靠性、降低能耗等方面同樣可以發(fā)揮重要的作用。
高性能計算和人工智能蓬勃發(fā)展的背后不僅需要計算能力的支撐和推動,也離不開高速互連網(wǎng)絡(luò)的保駕護航。未來,曙光將在計算、存儲、網(wǎng)絡(luò)等核心技術(shù)方面進行持續(xù)創(chuàng)新,逐步發(fā)展成為中國新形象、新技術(shù)創(chuàng)新力量的名片之一。
更多曙光相關(guān)資訊,歡迎搜索微信公眾號“中科曙光/sugoncn”,關(guān)注曙光公司官方微信。
—完—