高性能計(jì)算與高性能存儲 高能物理研究的基礎(chǔ)
著名的華裔科學(xué)家丁肇中在談到高能物理研究的時(shí)候,曾經(jīng)這樣形象地比喻:他發(fā)現(xiàn)陶粒子的工作量,就如同在北京的一場牛毛細(xì)雨中,尋找那唯一的一顆紅色雨滴。這一比喻充分顯現(xiàn)出現(xiàn)代高性能計(jì)算系統(tǒng)在現(xiàn)代高能物理研究中的重要性。隨著高能物理研究的不斷深入,高能物理研究對高性能計(jì)算工具的需求更是有增無減。西歐高能物理中心一臺高能粒子對撞機(jī)每年所獲取的數(shù)據(jù),用100萬臺個(gè)人電腦的硬盤都裝不下,而分析這些數(shù)據(jù),則需要更強(qiáng)的計(jì)算能力。由高能物理研究以海量數(shù)據(jù)的精密分析為基礎(chǔ)的特點(diǎn)所決定,高性能計(jì)算系統(tǒng)中高性能存儲的重要性也日益突出。
采用浪潮高性能計(jì)算系統(tǒng)和高性能存儲系統(tǒng)的山東大學(xué)高能物理研究在國內(nèi)物理界享有盛名,其研究領(lǐng)域涵蓋了加速器高能物理與高能宇宙線物理這兩個(gè)目前高能物理界的核心研究領(lǐng)域。在這一領(lǐng)域,山東大學(xué)高能物理系擔(dān)負(fù)著美、歐知名實(shí)驗(yàn)室和研究中心的多個(gè)項(xiàng)目。同時(shí)山東大學(xué)也參加了北京正負(fù)電子對撞機(jī)(BEPC)/北京譜儀(BES)合作組。在非加速器物理和粒子天體物理、高能宇宙線物理等領(lǐng)域,山東大學(xué)高能物理系還擔(dān)負(fù)著多個(gè)計(jì)劃。
對于這些目前物理界最前沿的研究項(xiàng)目,山東大學(xué)高能物理系對所采用的高性能計(jì)算系統(tǒng)有著相當(dāng)高的要求。實(shí)際上,浪潮為山東大學(xué)高能物理系提供的高性能計(jì)算系統(tǒng)也成為山大完成眾多科研項(xiàng)目的保障和基礎(chǔ)。
全面解決方案 筑起邁向科學(xué)頂峰的階梯
山東大學(xué)高能物理高性能計(jì)算解決方案拓?fù)鋱D
與其他的高性能計(jì)算系統(tǒng)不同的是,用于高能物理研究的計(jì)算系統(tǒng)不但要像其他領(lǐng)域的應(yīng)用一樣,需要強(qiáng)大的數(shù)據(jù)運(yùn)算、處理能力和高數(shù)據(jù)吞吐量,同時(shí)也對整個(gè)計(jì)算系統(tǒng)中的存儲系統(tǒng)提出了更高的要求。因?yàn)樵诒WC數(shù)據(jù)吞吐量和數(shù)據(jù)安全性的同時(shí),高能物理研究中需要對大量數(shù)據(jù)進(jìn)行頻繁的調(diào)用,與其它存儲系統(tǒng)中大部分?jǐn)?shù)據(jù)在寫入之后就很少調(diào)用的情況迥異。
浪潮在充分研究山東大學(xué)的需求之后,提出了上圖所示的高性能計(jì)算系統(tǒng)解決方案。這套系統(tǒng)使用浪潮AS500活性存儲系統(tǒng)與浪潮天梭10000高性能集群計(jì)算系統(tǒng)相配合,借助千兆以太網(wǎng)實(shí)現(xiàn)互聯(lián)。
在山大項(xiàng)目中應(yīng)用的天梭10000高性能計(jì)算系統(tǒng)總節(jié)點(diǎn)數(shù)量24個(gè),其中包括18個(gè)計(jì)算節(jié)點(diǎn);2個(gè)登陸節(jié)點(diǎn);管理節(jié)點(diǎn)1臺;2臺文件服務(wù)器;1臺安騰2開發(fā)服務(wù)器。系統(tǒng)峰值的計(jì)算能力達(dá)到268.8FLOTS。在這套系統(tǒng)中,還部署了Intel Vtune性能調(diào)優(yōu)工具、Intel MKL數(shù)學(xué)核心庫、Intel線程工具、Intel C++ 、Intel Fortran、JAVA編譯環(huán)境、浪潮天梭管理軟件、浪潮天梭監(jiān)控軟件、浪潮天梭集群部署軟件。
與天梭10000共同構(gòu)成整個(gè)計(jì)算體系的AS500是浪潮存儲在活性存儲技術(shù)戰(zhàn)略指導(dǎo)下開發(fā)的新一代存儲產(chǎn)品,具備高穩(wěn)定、高性能、靈活擴(kuò)展的特點(diǎn)。AS500采用完全模塊化的設(shè)計(jì)思路,控制器、電源等主要部件采用冗余熱插拔設(shè)計(jì),很大程度上消除了單點(diǎn)故障引起的系統(tǒng)當(dāng)機(jī);而兼容FC和iSCSI兩種主流主機(jī)接口的特性給用戶提供了多種不同的配置選擇,如FC SAN和IP SAN;在此次提供的方案中,客戶選擇了FC/iSCSI接口,其640MB/s的傳輸速度,4TB的存儲容量,充分滿足了高能物理海量數(shù)據(jù)處理的苛刻要求。
在充分考慮到山大高能物理研究計(jì)算的特點(diǎn)之后,浪潮特別為這一計(jì)算體系配置了兩套AS500存儲設(shè)備。在實(shí)際應(yīng)用中,兩套AS500各司其職,分別為登陸用戶提供數(shù)據(jù)以及為計(jì)算項(xiàng)目保存運(yùn)算結(jié)果,從而進(jìn)一步提升了計(jì)算系統(tǒng)的整體性能,為整個(gè)系統(tǒng)的運(yùn)作提供了更高的可靠性、可用性和可管理性。
這套高性能計(jì)算系統(tǒng)由于采用了全套的浪潮技術(shù)、產(chǎn)品和管理平臺,有著令人滿意的兼容性。在實(shí)際部署的過程中,浪潮還對整個(gè)系統(tǒng)的兼容性進(jìn)行了國際標(biāo)準(zhǔn)的完善測試,充分保證了系統(tǒng)的高效、穩(wěn)定。
目前,山東大學(xué)高能物理系的這套高性能計(jì)算體系已經(jīng)就位,成為山大高能物理研究的基礎(chǔ)。山大相關(guān)負(fù)責(zé)人表示:“高能物理系上下特別是研究人員對這套系統(tǒng)的表現(xiàn)非常滿意。其性能表現(xiàn)、穩(wěn)定性和可靠性足以和國外實(shí)驗(yàn)室中采用的系統(tǒng)相媲美。”