重卡之于輕卡

集群技術(shù)的思想很簡單,就是用 "N臺輕型卡車協(xié)同完成一臺重卡的運(yùn)載任務(wù)"。但是10臺輕卡并不等于一臺重卡,現(xiàn)實中有許多無法分割的大型貨物離不開重卡,同樣,高性能計算中也有很多計算任務(wù),不能有效分布并行化,而離不開高擴(kuò)展、高性能的大服務(wù)器,這些服務(wù)器在高性能計算中被稱為胖節(jié)點。當(dāng)前高性能的胖節(jié)點有比例不斷增大的趨勢,這主要源于Open-MP計算程序的廣泛應(yīng)用,以及胖節(jié)點在完成大型計算任務(wù)時的優(yōu)勢。

大型服務(wù)器在高性能計算應(yīng)用中與中低端服務(wù)器的關(guān)鍵區(qū)別就是多處理器(8顆以上)共享大容量內(nèi)存(通常為4路及以下服務(wù)器的2倍以上)在進(jìn)行大模型計算時,大內(nèi)存允許中間數(shù)據(jù)存儲在內(nèi)存中,而不需要和硬盤交換數(shù)據(jù),可以減少I/O頻度,明顯提高計算速度。有時I/O問題是大問題求解的殺手,因此從技術(shù)上看,大型服務(wù)器設(shè)備具有更大優(yōu)勢。但是,真正導(dǎo)致高性能計算離不開大服務(wù)器的,是廣泛應(yīng)用的Open-MP程序。

大服務(wù)器與Open-MP

基于Open-MP開發(fā)編譯的應(yīng)用在CAE、計算化學(xué)、生命科學(xué)、石油勘探、環(huán)境科學(xué)等行業(yè)領(lǐng)域隨處可見。Open-MP是一個共享存儲方式的并行編程標(biāo)準(zhǔn),它采用"制導(dǎo)語句"的方式實現(xiàn),即在原有的串行程序中插入一些指導(dǎo)并行的語句,因此,Open-MP非常適合將原有的串行程序改造為并行程序。當(dāng)前GCC、Intel、PGI、MS VS.net等主流編譯工具均提供對Open-MP的支持。但是Open-MP只適用于硬件共享存儲的計算設(shè)備,如多核芯片、多處理器節(jié)點等,而不能跨節(jié)點運(yùn)行,因此Open-MP程序離不開多處理器共享容量大內(nèi)存的大型服務(wù)器。

浪潮TS850,理想的胖節(jié)點

2010年,浪潮推出了第一款中國自主設(shè)計的八路服務(wù)器TS850,為Open-MP程序和大模型計算做了大量的專門設(shè)計,作為胖節(jié)點可以在性能、內(nèi)存方面極好地滿足實際應(yīng)用需求。相比四路胖節(jié)點,TS850具有更多CPU核心,最大支持80處理器核心,160個線程;更大的共享內(nèi)存,最大支持2TB內(nèi)存。同時胖節(jié)點TS850在設(shè)計上完全按照高端需求設(shè)計,支持20余項RAS特性,在可靠性、可擴(kuò)展性、可管理性和可用性方面具有優(yōu)異表現(xiàn)。現(xiàn)在HPC遇到的問題是,隨著系統(tǒng)規(guī)模擴(kuò)大,出故障的概率就會增大。而系統(tǒng)本身的平均無故障時間越長,系統(tǒng)越可靠,做容錯和高可用的代價就會越小。TS850在承載重任的同時,還能有效降低用戶總體成本。目前,該產(chǎn)品已經(jīng)在天河一號工程、山東大學(xué)等多個大型高性能平臺成功應(yīng)用,下面簡單介紹該產(chǎn)品在不同應(yīng)用領(lǐng)域的解決方案和具體表現(xiàn)。

CAE

CAE即計算機(jī)輔助工程設(shè)計,在航空、航天、能源動力等工業(yè)領(lǐng)域有著廣泛應(yīng)用,CAE大計算量的特點決定了需要大容量內(nèi)存。對大內(nèi)存的支持讓CAE在前后處理方面獲得自由,使其在大模型的建立、大圖形的處理以及大數(shù)據(jù)庫的操作方面幾乎沒有障礙,用戶可以建立高保真模型。

對于CAE類的應(yīng)用,比如Ansys和ABAQUS,在某些網(wǎng)格數(shù)目巨大,并且網(wǎng)格劃分負(fù)載不平衡的情況下,采用MPI的效果非常差,必須采用Open-MP才能達(dá)到良好效果,并且對于這些隱式有限元分析軟件,其本身算法決定了擴(kuò)展性不會太好,單機(jī)計算能力才是重中之重。 中國科技大學(xué)的CAE領(lǐng)域科研計算工作面臨著通用節(jié)點無法提供大容量共享內(nèi)存,一些大模型的計算小節(jié)點無法完成,多節(jié)點使用并行效率又很低,每次模型的修改都會浪費(fèi)大量時間。浪潮HPC綜合解決方案中胖節(jié)點選用高端八路服務(wù)器TS850為中國科技大學(xué)化解了此項難題。浪潮TS850采用共享大內(nèi)存并行系統(tǒng)架構(gòu),能夠提供相足夠的共享內(nèi)存來運(yùn)行此類程序,提高程序的運(yùn)行效率。

計算化學(xué)

計算化學(xué)是理論化學(xué)的一個分支,主要目標(biāo)是利用有效的數(shù)學(xué)近似以及電腦程序計算分子的性質(zhì)用以解釋一些具體的化學(xué)問題。對于計算化學(xué)類的應(yīng)用,比如Gaussian、VASP,隨著計算規(guī)模的擴(kuò)大,內(nèi)存需求會隨基函數(shù)數(shù)量的平方而增加,特別是對于Gaussian而言,其支持Open-MP和TPC-Linda兩種并行方式,前者的并行效率要遠(yuǎn)遠(yuǎn)高于后者,另外Gaussian在選擇MP2計算方法時,會產(chǎn)生大量臨時文件常駐內(nèi)存,因此更適合在一臺大內(nèi)存高計算能力的胖節(jié)點上做大型Gaussian的計算任務(wù)。

山東大學(xué)在計算化學(xué)領(lǐng)域具備較強(qiáng)的實力,實力的背后離不開高性能的計算平臺。該計算平臺由浪潮承建,胖節(jié)點選用TS850,無論從性能方面,還是在內(nèi)存方面都具備領(lǐng)先優(yōu)勢,這也是該解決方案最大的亮點。該方案也應(yīng)用在了安徽大學(xué)計算化學(xué)領(lǐng)域的高性能計算。浪潮高性能解決方案借助胖節(jié)點浪潮TS850的共享大內(nèi)存并行系統(tǒng)架構(gòu),能夠提供足夠的共享內(nèi)存來運(yùn)行Open-MP程序,提高程序的運(yùn)行效率。

生命科學(xué)

隨著基因組學(xué)的快速發(fā)展,其產(chǎn)生的海量數(shù)據(jù)對存儲、計算機(jī)性能等方面以每12-18個月10倍的速度在增長,并已遠(yuǎn)超越著名的摩爾定律?;蛐蛄衅唇邮且粋€巨大數(shù)據(jù)量的處理過程,對CPU的頻率、內(nèi)存都有十分苛刻的要求。傳統(tǒng)四路服務(wù)器在運(yùn)行該類軟件Phrap,效率非常低,耗費(fèi)大量寶貴時間。TS850八路胖節(jié)點利用多線程技術(shù)加速其中具有并行性的部分,對Phrap程序的SMP機(jī)器并行版本有極佳的支持,獲得更好的時間效率。

中科院生物物理所作為我國頂尖的生命科學(xué)基礎(chǔ)研究所,對于高性能計算平臺有著極其苛刻的要求,浪潮憑借基于智能胖節(jié)點TS850的高性能解決方案在眾多方案中脫穎而出。浪潮TS850憑借其超大核心數(shù)和大容量內(nèi)存,以及優(yōu)異的并行性能最大限度地提升基因序列拼接軟件的效率。
"好用、用好"

以上是選取CAE領(lǐng)域、計算化學(xué)、生命科學(xué)三個行業(yè)進(jìn)行的詳盡解讀,由于篇幅所限,其他石油勘探、環(huán)境科學(xué)等行業(yè)不再進(jìn)行解讀。

浪潮高性能的業(yè)務(wù)理念是"好用用好",即"只有通用的平臺,沒有通用的應(yīng)用",提供定制化的方案,讓平臺"好用",并通過全程的技術(shù)服務(wù),讓客戶"用好"。用戶在搭建高性能系統(tǒng),應(yīng)用、成本、管理、效率等多種因素需要綜合考量。不可否認(rèn),一些平臺往往從成本考量,采用四路服務(wù)器做胖節(jié)點,但是采購成本僅占高性能平臺的全生命周期成本的一半不到,八路服務(wù)器的性能、效率等優(yōu)勢會在整個生命周期中顯現(xiàn)出來,提供更好的總體成本,因此,我們還是推薦客戶采用八路大型服務(wù)器,特別是運(yùn)行Open-MP程序和大型任務(wù)的平臺。

分享到

zhabin

相關(guān)推薦