對于超級計算機來說,高性能計算的背后并非簡單產(chǎn)品上的比拼,而是國家信息化安全和實力的爭斗,然而對于普通老百姓來說,超級計算機究竟為何方神圣?與個人電腦相比,在運算速度上動輒以百萬億、千萬億次來計算的超級計算機,和信息化建設、日常生活有什么關系?筆者將打開超級計算機“大門”,為大家介紹你所不了解的超級計算機(Super computer)。

實力爭斗 超級計算機究竟為何方神圣?

超算維基百科

從維基百科了解,超級計算機(Super computer),相比PC規(guī)格與性能更加強大,能夠執(zhí)行一般個人電腦無法處理的海量與高速運算的電腦。“超級計算”這名詞第一次出現(xiàn)是在“紐約世界報”于1929年關于IBM為哥倫比亞大學建造大型報表機的報道。

1960年代,超級計算機由希穆爾·克雷(Seymour Cray)在Control Data Corporation里設計出來并領先市場直到1970年代克雷創(chuàng)立自己的公司“克雷研究”(Cray Research)。特別注意的是,隨著時代發(fā)展超級計算機的CPU數(shù)量成倍提升,數(shù)以萬計的處理器應用并行計算。

簡析超級計算機的歷史

1970年代,大部分超級計算機就已經(jīng)從標量處理器發(fā)展到矢量處理器,很多是新進者自行開發(fā)的廉價處理器來攻占市場。1980年代初期,業(yè)界開始轉(zhuǎn)向大規(guī)模并行運算系統(tǒng),這時的超級計算機由成千上萬的普通處理器所組成。1980年代中葉,將適量的矢量處理器(一般由8個到16個不等)聯(lián)合起來進行并行計算成為通用的方法。1990年代以后到21世紀初,超級計算機則主要由基于精簡指令集(RISC)的處理器互聯(lián)進行并行計算而實行。

實力爭斗 超級計算機究竟為何方神圣?

超級計算機時間軸

截止到2012年10月,隸屬于美國能源部的橡樹嶺國家實驗室將美洲虎改裝為“泰坦”(Titan)成為世界上運算速度最快的超級計算機,奪取上一屆由IBM為美國勞倫斯·利弗莫爾國家實驗室研發(fā)的Sequoia,它每秒能完成1.6億億次運算。

過往的超級計算機

2010年10月,中國研制的第一臺千萬億次超級計算機在湖南長沙亮相,全系統(tǒng)峰值性能為每秒1.206PFlops,是當時世界上最快的超級計算機。天河一號的研制成功使中國成為繼美國之后世界上第二個能夠研制千萬億次超級計算機的國家。

2008年11月,IBM的Roadrunner成為當時最快的超級電腦,運算能力為1.105PFlops。

2008年11月16日,美國Cray超級電腦公司推出Jaguar系列,運算能力為1.059PFlops,采用45376顆四核心的Opteron處理器,362TB的存儲器,傳輸總帶寬284GB/Sec,硬盤容量超過10PB,內(nèi)部的數(shù)據(jù)總線帶寬532TB/Sec。這臺電腦將放置在美國的國家高速電腦中心,并開放給各界有需要的團體申請使用。

2007年11月,IBM的Blue Gene/L,運算能力為478.2 TFlops,安裝了32768個處理器。它是PowerPC架構的修改版本,正式運作版本被推出到很多地點,包括羅蘭士利物摩亞國家實驗室(Lawrence Livermore National Laboratory)。

在Blue Gene/L之前,最快的超級計算機是日本電氣株式會社在橫濱地球科學學院的地球模擬器。它由640個特別設計的8階矢量處理器根據(jù)NEC SX-6架構所組成的叢集,使用UNIX的修改版本。

在地球模擬器之前,最快的超級計算機是美國加州羅蘭士利物摩亞國家實驗室的ASCI White,它的冠軍位置維持了2.5年。

超算機的硬件與架構

從超級計算機設計架構上,相比1960年代希穆爾·克雷(Seymour Cray)在Control Data Corporation里設計超級計算機有著令人激動的變化,早期Cray超級計算機依賴于緊湊型的創(chuàng)新設計和局部并行計算來實現(xiàn)卓越的計算峰值性能。但是隨著計算能力需求的增長迎來了大規(guī)模并行系統(tǒng)。

縱觀幾十年來,超級計算機在硬件配置和架構設計上有了明顯的變化,由數(shù)百數(shù)千甚至到如今數(shù)萬計的處理器組成,但并不是僅僅把上萬顆處理器“并聯(lián)”就可以,還要考慮到效率問題,如何才能充分發(fā)揮它們的性能。

如今的超級計算機的性能提升幅度很大,現(xiàn)在是千萬億次計算能力,下一個級是萬萬億次。為了更好理解超級計算機到底是何方神圣?筆者針對如今世界最快超級計算機和中國最快超級計算機硬件和軟件配置進行說明,給大家一個直觀的印象:

實力爭斗 超級計算機究竟為何方神圣?

“泰坦”超級計算機

就“泰坦”超級計算機而言,200個定制的19英寸機柜和18688個計算節(jié)點,每個節(jié)點由一個16核AMD Opteron 6274處理器和一個NVIDIA Tesla K20 GPU組成。但系統(tǒng)卻更換為最新的Cray XK7計算系統(tǒng),同時內(nèi)部配置也大為不同:

采用AMD高性能的皓龍?zhí)幚砥?,從原?2核心變?yōu)?6核心,總的核心數(shù)量從原來的224256個增加到如今299008個;每顆處理器搭配開普勒架構的NVIDIA Tesla K20高性能計算卡,總計有高達18688個GPU。

“泰坦”系統(tǒng)內(nèi)存每個節(jié)點也有原來的16GB翻番為32GB,而且還有6GB GDDR5顯存,總量從300TB增至710TB;硬盤是由一萬塊標準的1TB 7200轉(zhuǎn)2.5寸機械盤,總容量10PB。

泰坦的操作系統(tǒng)是Cray Linux Environment,基于SUSE 11。由于超算的大部分工作都是遠程執(zhí)行的,泰坦內(nèi)部還有幾十個10Gbps以太網(wǎng)鏈接,接入了能源部能源科學網(wǎng)絡(ESNET)的100Gbps骨干網(wǎng)內(nèi)。在峰值浮點性能方面,泰坦超過20PFlops,也就是每秒鐘可進行2億億次計算。

另外,當“泰坦”全速運行的時候,需要消耗高達900萬瓦特電力,典型負載下也要700萬瓦特,而這也是唯一限制它擴充的地方。為了減少供電線厚度,電壓是很高的480V而不是當?shù)貥藴实?08V。

GPU助力天河一號A 探秘全球最強超算機

“天河”千萬億次超級計算機

而作為中國最快的超級計算機,“天河一號”由140個機柜組成,由14336顆英特爾六核至強X5670 2.93GHz CPU、7168顆Nvidia Tesla M2050 GPU和2048顆自主研發(fā)的八核飛騰FT-1000 CPU。“天河一號”的硬件系統(tǒng)包括計算陣列、加速陣列、服務陣列,以及互連通信子系統(tǒng)、I/O存儲子系統(tǒng)和監(jiān)控診斷子系統(tǒng)等。

·計算陣列:2560個計算結點,每個計算結點集成2個Intel CPU,配32GB內(nèi)存。

·加速陣列:2560個加速結點,每個加速結點含2個AMD GPU、 2GB顯存。

·服務陣列:512個服務結點,每個服務結點含2個Intel EP CPU、32GB內(nèi)存。

·互連通信子系統(tǒng):采用兩級Infiniband QDR互,單個通信鏈路的通信帶寬為40Gbps、延遲1.2μs。

·I/O存儲子系統(tǒng):采用全局分布共享并行I/O系統(tǒng)結構,磁盤總容量1PB。

·監(jiān)控:采用分布式集中管理結構,實現(xiàn)全系統(tǒng)的實時安全監(jiān)測、系統(tǒng)控制和調(diào)試診斷等功能。

“天河一號”的軟件系統(tǒng)包括操作系統(tǒng)、編譯系統(tǒng)、資源管理系統(tǒng)和并行程序開發(fā)環(huán)境等四部分組成。

·操作系統(tǒng):操作系統(tǒng)采用64位Linux,面向高性能并行計算、支持能耗管理、虛擬化和安全隔離等進行了針對性設計。

·編譯系統(tǒng):支持C、C++、Fortran77/90/95、Java語言,支持OpenMP、MPI并行編程,提供異構協(xié)同編程框架,高效發(fā)揮CPU和GPU的協(xié)同計算能力。

·資源管理:提供全系統(tǒng)資源統(tǒng)一視圖,實現(xiàn)多策略資源分配與作業(yè)調(diào)度,有效提高資源利用率和系統(tǒng)吞吐率并行程序開發(fā)環(huán)境并行程序開發(fā)環(huán)境提供一體化圖形用戶界面。

就配置總結而言,筆者認為超級計算機無論從外形,還是在處理器、內(nèi)存以及硬盤這些傳統(tǒng)硬件方面可以說是以其數(shù)量遠遠高于用戶所理解的個人電腦,并不是僅僅把上萬顆處理器、內(nèi)存和硬盤“并聯(lián)”提供計算性能。而是還要考慮到效率問題,通過創(chuàng)新計算編譯和管理平臺,以及針對性設計的操作系統(tǒng)和網(wǎng)絡、加速陣列組成,實現(xiàn)全面的優(yōu)化集群的系統(tǒng)平臺來提供實際計算應用。

超算機的性能與應用

談及之前性能數(shù)值,更多的人應該沒有概念,超級計算機“泰坦”,以17590 TFlop/s的運算速度奪冠,這個運算速度代表什么?超級計算機實測浮點峰值是指Linpack測試值,也就是說在這臺機器上運行Linpack測試程序,通過各種調(diào)優(yōu)方法得到的最優(yōu)的測試結果。

實力爭斗 超級計算機究竟為何方神圣?

歷屆TOP500超算冠軍

其中有實測浮點峰值和理論浮點峰值,這兩個值只是作為衡量機器性能的一個指標,用來表明機器處理能力的一個標尺和潛能的度量。筆者更加直觀的通過數(shù)值來解析,升級后的“天河-1A”實測運算速度可達每秒2570萬億次,運算能力相當于17.5萬臺筆記本電腦。

實力爭斗 超級計算機究竟為何方神圣?

“天河-1A”超級計算機

正如之前談到的實測浮點峰值和理論浮點峰值,“天河一號”峰值性能為每秒4700萬億次,實測性能為每秒2570萬億次。這意味著,“天河-1A”計算一天的工作量相當于一臺家用電腦計算(PC)800年。

另外,“天河一號”的存儲量相當于4個國家圖書館(國圖藏書量為2700萬冊)之和,能夠為全國每人儲存一張1寸照片。“天河一號”由103臺機柜組成,總重量相當于19個神舟飛船。放置“天河一號”需要一個近一千平方米的房間。

對于上面的數(shù)值,很多人會一驚之后問到高性能的計算能力都應用于何處?“天河一號”的應用領域十分廣泛,在石油勘探、高端裝備制造、生物醫(yī)藥、動漫設計、新能源、新材料、工程設計與仿真分析、氣象預報、遙感數(shù)據(jù)處理、金融風險分析等領域都具有廣闊的應用前景。

據(jù)了解,用“天河一號”數(shù)值模擬蛋白質(zhì)、分子結構,研發(fā)生物醫(yī)藥,科學家就可以在較短時間內(nèi)從幾十萬甚至幾百萬種化學物中篩選出有效的藥物化學物,不僅能節(jié)省購買實物化合物的大量資金,而且能大大縮短研制周期,這就為疾病的治療提供了革命性的方法。

GPU助力天河一號A 探秘全球最強超算機

國家超級計算機天津中心

另外,通過國家超級計算天津中心,“天河一號”超級計算機與中新天津生態(tài)城國家動漫產(chǎn)業(yè)示范園正式簽署合作協(xié)議,雙方通力合作,立足濱海新區(qū)打造全國最大的動漫渲染平臺,讓濱海新區(qū)成為引領中國文化創(chuàng)意產(chǎn)業(yè)的先鋒區(qū)

與中國石油、中國石化、中海油三大石油公司建立合作,在生物醫(yī)藥領域已經(jīng)成為天津國際生物醫(yī)藥聯(lián)合研究院、中科院上海藥物所、軍事醫(yī)學科學院、北京生命科學研究所、北大等國內(nèi)著名研發(fā)機構的計算處理平臺。

此外,與清華地學院、北師大地學院合作,支持地球環(huán)境變化研究項目;與北大、浙大、中科院等國內(nèi)聚變研究機構簽署正式合作,開展核聚變能源開發(fā)研究工作。

相比國內(nèi)超算,傳統(tǒng)意義上的超級計算機一般僅應用在機械制造、設計、石油勘探、天氣預報以及軍事等方面,國外的超算發(fā)展更為領先,IBM沃森致力于醫(yī)療診斷,“泰坦”超級計算機的研發(fā)得到了美國能源部的資金支持,它將主要用于能源、氣候變化、 高效引擎、材料及其他科學領域的研究。

然而,筆者了解,對于國內(nèi)超算應用來說,加強我國超級計算機應用型人才儲備,完善超級計算機應用的生態(tài)環(huán)境,從人才、政策、資金等方面多管齊下,充分發(fā)揮超算對經(jīng)濟、社會的推動作用。

通過設立超級計算機應用創(chuàng)新獎勵基金,加大應用創(chuàng)新獎勵力度。浪潮集團已經(jīng)設立高性能計算獎勵基金,建議以此為基礎,呼吁更多的單位和組織加入進來,擴大基金規(guī)模,加大對超級計算機應用創(chuàng)新人才發(fā)展推進整個超級計算機行業(yè)發(fā)展。

超算機離我們有多遠?

了解到超級計算機的結構設計、性能以及應用,似乎大家看到的更多只和科學研究聯(lián)系在一起。但事實上,在和我們生活息息相關的各個領域都可以看到超級計算機的身影。

對于高速發(fā)展的互聯(lián)網(wǎng)行業(yè),面對數(shù)千萬、數(shù)億用戶的訪問請求,服務器必須有強大的數(shù)據(jù)吞吐和處理能力,高性能服務器每秒鐘可以處理數(shù)千萬乃至數(shù)億次服務請求,及時提供用戶所需要的信息和服務。

颶風預測 揭秘最快氣候研究“黃石”超算

高成本的超算

“黃石”超級計算機不僅能允許研究者預測未來一個世紀內(nèi)天氣是否會變得更暖,而且還能預見未來十年或是二十年的情況,對給定地區(qū)的未來天氣狀況變化做出接近于事實的預測。

另外,在天氣預報方面是由超級計算機計算而來。目前世界最高水平可預報8天,我國為5至6天。但目前世界上的超級計算機仍然是無法滿足氣候預報,因為天氣預報的計算需要10的18次方也就是每秒百萬萬億次的速度,天氣預報時效每增加一天,氣象和計算機界需要努力10年。

人才培養(yǎng)帶動超算改變生活

正如之前談到,超級計算機的計算能力不直接面向用戶,但是在影視制作和渲染平臺應用方面,隨著超級計算機的服務能力的拓展,會衍生出一系列計算服務產(chǎn)業(yè)并面向個人用戶提供服務。

然而,與國外相比,軟件應用上的差距是中國超級計算“短板”,真正實現(xiàn)應用改善還任重而道遠。特別是缺乏完善的應用軟環(huán)境,具體表現(xiàn)在人才儲備、應用意識、政策導向等方面,特別是人才欠缺的問題是一直制約我國超算技術發(fā)展的瓶頸。

國內(nèi)領先的高性能計算廠商浪潮與曙光一直致力于人才培養(yǎng),推動整個高性能計算產(chǎn)業(yè)的發(fā)展,曙光通過SSC這個平臺為人才培養(yǎng)提供了一種獨特的培訓模式,即堅持以“軟件+硬件共同開發(fā)、實踐與應用結合”為原則、以培養(yǎng)HPC專業(yè)人才為目標,強化企業(yè)主體創(chuàng)新意識,并通過審核嚴格的“曙光服務器專業(yè)認證”等途徑實現(xiàn)人才可持續(xù)發(fā)展。

浪潮也不斷推動國內(nèi)高性能產(chǎn)業(yè)的發(fā)展,曾先后設立了浪潮高性能計算創(chuàng)新獎勵基金、組織中國首屆大學生超級計算機競賽、舉辦中國高性能計算用戶大會、與Intel成立并行計算聯(lián)合實驗室、并連續(xù)支持中國高校參加SC、ISC全球超級計算機大賽,特別在人才培養(yǎng)方面與清華大學共同設立的“清華大學—浪潮集團計算地球科學青年人才基金”計劃,更為推進國內(nèi)地球系統(tǒng)科學與高性能計算領域的人才培養(yǎng)和挖掘。

亞洲高校全力角逐ASC13超算大賽十強席位

官方網(wǎng)站

通過一系列項目與國內(nèi)計算機科學方面的青年人才與專家共同探討HPC發(fā)展,浪潮在高性能計算應用方面提供平臺和軟件應用的支持,特別是即將召開的2013亞洲大學生超級計算機競賽,通過HPC平臺的技術比拼與交流,為國內(nèi)高性能計算持續(xù)發(fā)展做出貢獻。

由此可見,對于超級計算機而言,無論是硬件結構和軟件應用的發(fā)展,還是性能不斷的攀升,對于普通用戶而言并不在陌生。隨著世界大學生超級計算機等競賽的推廣,讓這個看似高不可攀的“大塊頭”把“大智慧”普及應用,使得從大學生到行業(yè)專家共同帶動超級計算機的發(fā)展,最終幫助人才在高性能計算的應用技術軟件技術等方面培養(yǎng),有更進一步的提高和更大空間的發(fā)展,從而使得整個中國的高性能計算產(chǎn)業(yè)有更好的發(fā)展。

分享到

zhaohang

相關推薦