著眼于未來的競爭力提升,從去年開始EPFL就計劃對其HPC系統(tǒng)進行升級擴容。升級的理由很簡單,資源不夠用了。在EPFL給出的需求表中,最顯眼的一欄是應用需求,HPC benchmark、HPL、HPCG等基準測試要滿足;科學、工程、生物、醫(yī)療等各種應用,其中既有EPFL自行開發(fā)的也包括開源的都要能運行。
除此之外,還有很多硬性條件,比如理論計算能力≥475TFlops,共享存儲≥340TB,讀寫帶寬40G/s,整個系統(tǒng)不能超過8個機柜,單機柜功耗不能高于25kw;系統(tǒng)要開放、易管理、易擴展,而且合作伙伴要有足夠的技術(shù)前瞻性,能為EPFL未來5年建設(shè)5PF HPC集群的總目標提供足夠的支撐力。
華為見招拆招
單獨看某一方面的需求可能還比較好滿足,但如果把所有需求都集中在一起,會發(fā)現(xiàn)這塊骨頭并不好啃。沒有壓力也就沒有動力,華為和當?shù)叵到y(tǒng)集成商Transtec迎難而上,經(jīng)過多次詳細分析,最終給出了現(xiàn)在的方案,拓撲圖如下:
其中,計算節(jié)點采用408個FusionServer XH620,每個節(jié)點是兩路至強E5-2690 v4處理器,理論計算峰值475.2TFlops,網(wǎng)絡(luò)采用2層Fat-Tree組網(wǎng),Infiniband高速網(wǎng)絡(luò),存儲系統(tǒng)是6套OceanStor 5800+GPFS并行文件系統(tǒng),容量計350TB。
在這套方案中,華為采用了很多領(lǐng)先的產(chǎn)品和技術(shù),帶來的效果也十分顯著。比如華為X6800高密度服務(wù)器的應用,使得單機柜計算能力提升70%的同時,機柜的部署數(shù)量也節(jié)省了40%。因為X6800在4U空間內(nèi)能最高容納8個計算節(jié)點、16路處理器,而采用普通的1U雙路服務(wù)器則需要8U空間。這樣一來,408個計算節(jié)點只需要6個機柜就能滿足,而不是10個。
再比如,X6800中采用的散熱工程設(shè)計,再加上DEMT動態(tài)節(jié)能技術(shù),使得能耗比傳統(tǒng)機架服務(wù)器降低10%-20%。
更多特性不再一一列舉。憑借高效、高性能、高可擴展性、易管理等特性,華為的這套方案受到認可并得以部署。而從現(xiàn)在的實際應用情況看,這套方案完全滿足用戶需求,402TFLOPS的實測數(shù)據(jù),計算效率達到89.3%。
今年6月,EPFL與華為共同宣布其科學IT和應用支持(SCITAS)部的Fidis HPC集群成功上線。
EPFL SCITAS執(zhí)行董事VittoriaRezzonico女士在接受采訪時對華為給予高度評價。她說:“Transtec和華為緊密合作,為EPFL提供了一個頂級高質(zhì)量的系統(tǒng),很好地滿足了我們在高性能計算學術(shù)領(lǐng)域的需求。華為技術(shù)工程師為我們介紹的出色的硬件解決方案以及Transtec專業(yè)的規(guī)劃、安裝和配置服務(wù),讓我們印象非常深刻。”
目前,華為的產(chǎn)品和解決方案已經(jīng)應用于170多個國家和地區(qū),服務(wù)全球1/3的人口。在全球財富500強中有172家,全球財富100強中有43家領(lǐng)先企業(yè)選擇了華為作為數(shù)字化轉(zhuǎn)型的伙伴。