“兩全其美”的至強融核
其實,早在至強融核還不是一個成熟可用的產品,而是以其核心技術——英特爾集成眾核(MIC)架構在兩年多前初次亮相時,它就理所當然地成為了焦點,原因就在于它是現階段惟一一個能夠帶來“兩全其美”應用體驗的解決方案。
所謂兩全之一,就是具備較高的并行處理性能。有別于通用用途的至強處理器,至強融核協處理器是專為高性能計算中應用越來越普遍的高并行化工作負載而開發(fā),旨在全力加速這類應用負載處理速度的產品。在最新款至強處理器浮點計算能力還停留在約150 GFLOPS時,至強融核旗下兩個產品家族——3100和5110的雙精度浮點運算性能已分別達到了1,000 GFLOP以上和1,011 GFLOPS,而設計熱功耗則分別為300瓦和225瓦。前者可以用于運行計算密集型工作負載,如生命科學應用和金融模擬,后者則適用于數字內容創(chuàng)建和能源研究等內存密集型工作負載,可以說,在日常運行這些應用負載的用戶面前,它們在性能方面都有著難以抵擋的誘惑力。
而兩全之二,則是能夠讓用戶能夠更為輕松、容易地對其現有的針對英特爾架構開發(fā)的高性能應用軟件進行優(yōu)化,使之能充分利用自己的性能潛力。這一點要得益于它采用了人們熟悉的和廣為接受的英特爾架構,可以充分利用英特爾公司為這一架構提供的、應用已經非常普及的編程語言、并行模式、技術和開發(fā)人員工具,來支持用戶優(yōu)化已有的、構建于英特爾架構平臺之上的高性能計算應用代碼。
以上這“兩全”兼顧,就形成了至強融核獨一無二的應用優(yōu)勢——其性能和能效既出眾,針對它優(yōu)化現有應用的成本又低、耗時又短,見效又快,這就使得眾多高性能計算用戶開始對它產生強烈的興趣,并開始進行相關的測試和應用。在今年11月與至強融核同期發(fā)布的最新高性能計算機500強排行榜上,就有7套上榜系統采用了這一創(chuàng)新產品,而且其中既包括了排名前十的系統,也包括了本屆TOP500榜單上能效最高的系統。
中國用戶見證至強融核優(yōu)勢
就在至強融核亮相于新一期TOP500榜單的同時,四家來自中國的重量級高性能計算用戶也發(fā)布了他們對于這款協處理器的測試心得,這還是中國用戶首次就其應用體驗發(fā)表見解。
這四家用戶中,有兩家是國內石油勘探領域中應用高性能計算技術的翹楚,即中國石化石油物探技術研究院和中國石油東方地球物理勘探有限責任公司。另外兩家則是國內權威的科研機構——中國科學院計算技術研究所和中國科學院過程工程研究所。
兩家石油行業(yè)的用戶都使用了各自最新的石油勘探用高性能計算應用和算法對至強融核進行了測試,結果是:中國石化石油物探技術研究院的疊前深度偏移應用在單個至強融核計算節(jié)點(雙路至強E5+雙至強融核協處理器)上運行時的性能,要比在優(yōu)化后的單個雙路至強E5計算節(jié)點上運行時提升高達2.53倍,而與未經優(yōu)化的單個雙路至強E5計算節(jié)點相比,兩個至強融核計算節(jié)點則可實現相當于其10.3倍的性能;中國石油東方地球物理勘探有限責公司的疊前時間偏移應用在單個至強融核計算節(jié)點上的運行性能,也是其在單個優(yōu)化后雙路至強E5計算節(jié)點上運行時的3.86倍。
值得一提的是,在至強融核上獲得上述性能提升并沒有讓這兩家用戶付出更多的軟件調優(yōu)成本,中國石化石油物探技術研究院副院長兼總工程師趙改善就指出,在測試時他們在至強融核計算節(jié)點上沿用了與至強E5計算節(jié)點相同的編程方法、MKL庫、DFT程序和源代碼。因此這一成績的獲得進一步展示了至強融核優(yōu)良的擴展性能,證明它可“大大提升中石化的iCluster地震資料成像系統的處理能力”。 中國石油東方地球物理勘探有限責任公司物探技術研究中心副總工程師陳維也斷言:“至強融核處理器將會在地震勘探數據處理中具有廣闊的應用前景”。
上述兩家來自科研領域的用戶,也在至強融核協處理器的測試中獲得了與石油行業(yè)用戶類似的體驗。中科院計算所所做的測試是基于時域有限差分法的電磁仿真計算,它在單個至強融核PCI-E插卡上實現的性能,相當于單個優(yōu)化后雙路至強E5平臺的1.28倍,比未經優(yōu)化的雙路至強E5平臺,其性能提升更是高達3.2倍。中科院過程所進行的測試則是用于化學、生物物理領域,旨在分析粒子間相互作用的IPE分子動力學模擬,結果發(fā)現單個至強融核PCI-E插卡的性能表現,相當于優(yōu)化后雙路至強E5平臺的1.98倍,而與未經優(yōu)化、單路單線程的至強E5平臺相比,性能提升更是高達157.76倍。
同樣,在領略了至強融核帶來的性能優(yōu)勢的同時,兩家科研領域用戶也對其軟件優(yōu)化的便利性大加贊賞。中科院計算所高性能計算機研究中心主任張佩珩表示:“時域有限差分算法通過輕松的移植和簡單的并行優(yōu)化,在英特爾至強融核協處理器上獲得了很好的擴展性和較高的性能提升,同時保證了代碼一致性和可維護性,大大節(jié)約了時間和人力成本。”中科院過程所身兼中國顆粒學會理事一職的研究員、博士生導師葛蔚則指出:“MIC作為一種x86架構的眾核處理器,其編程模式能夠大大減少串行程序到眾核程序移植的工作量,對于一些簡單移植甚至能夠接近‘0工作量’,并且可以利用大量CPU上原有的調優(yōu)工具,為用戶移植代碼提供了很大方便。”
相信上述用戶對于至強融核的測試,以及對其應用優(yōu)勢的見證將掀開這款創(chuàng)新產品在中國廣泛應用的開端,或許在未來一兩年內,就會有更多中國用戶分享它們在至強融核上獲取的出色體驗,他們還很可能于2020年前,在英特爾公司的支持下,通過采用至強處理器平臺、至強融核產品線和與之相配套的更多先進技術,順利跨入百億億級高性能計算的時代。(IT168)