英特爾(中國)有限公司服務(wù)器平臺產(chǎn)品經(jīng)理張振宇先生

走向百億億次 混合結(jié)構(gòu)成必然

Q:高性能計算領(lǐng)域的發(fā)展已經(jīng)有很多年了,英特爾剛剛也發(fā)布了“至強融核”品牌。英特爾為什么要在高性能計算領(lǐng)域推出這個品牌?

A:在推動千萬億次向百億億次級的過程當(dāng)中,至強扮演著非常重要的角色。至強本身是非常強大的平臺,它能夠適應(yīng)各種各樣的工作負(fù)載。尤其是我們今年3月發(fā)布的至強E5-2600系列處理器,其采用的“AVX”指令集對高性能計算非常有用,能夠把性能提升5倍。實際上,至強E5平臺也是高性能計算歷史上被采用最快的一種技術(shù)。在最新的榜單里,3月份才發(fā)布的產(chǎn)品,到目前為止已經(jīng)有45套在TOP500里出現(xiàn),在新系統(tǒng)當(dāng)中占據(jù)的比例達到了78%。

但是,要發(fā)展到百億億次,僅僅依賴至強是不夠的,還需要用“至強融核”架構(gòu)來提高高度定型應(yīng)用的計算效率。這是因為,當(dāng)計算規(guī)模達到一定程度的時候,CPU和功耗和計算效率都不足以解決大規(guī)模的計算問題,這就需要采用例如GPU或協(xié)同處理器等方式進行加速。至強本身是通用處理器,能夠適應(yīng)各種各樣的工作負(fù)載。“至強融核”是至強品牌下的一部分,英文名是“Xeon Phi”,Phi是希臘文的第11個字母,代表黃金分割,有科學(xué)、創(chuàng)新、和諧、完美的喻意,主要是在一些高度定型的應(yīng)用,為數(shù)據(jù)中心、高性能領(lǐng)域以及工作站提供更強的計算能力。英特爾希望通過它為客戶提供高性能計算的同時,為客戶實現(xiàn)創(chuàng)新、達到完美。同時,“融核”也體現(xiàn)集成眾核的含義。

Q:如您所說,混合架構(gòu)是走向未來高性能計算的必然趨勢,但這種混合架構(gòu)也包括多種混合方式。例如,早前的GPGPU+CPU方式,就曾在業(yè)績獲得廣泛認(rèn)可。您如何看待融核架構(gòu)的前景?

A:至強融核最大的特點就是“單一源程序”,經(jīng)過簡單編譯可以在至強融核和至強兩種架構(gòu)上同時運行。因為采用了通用的編程和開發(fā)工具,能夠幫助客戶實現(xiàn)更有效的計算。確實如你所說,GPGPU+CPU模式在高性能計算領(lǐng)域當(dāng)中已有一些應(yīng)用,但這種模式也有其弊端——會帶來編程上復(fù)雜性。由于GPGPU和x86架構(gòu)在編程方面有極大的不同,客戶需要花費大量時間學(xué)習(xí)。

作為對比,“至強融核”的“單一源程序”特性為科學(xué)工作者帶來了福音。例如,Altair和SGI用SGI UV2在我們的平臺上進行汽車和汽車模擬的碰撞,客戶印象最深的就是編程連續(xù)性,客戶無需為了提升計算效率而重新學(xué)習(xí)另一種編程語言。實際上,我們期望至強融核能夠改變高性能計算游戲規(guī)則。過去,人們鼓吹GPU,利用CPU來進行浮點加速來提高計算性能,但用戶應(yīng)該將精力放在科學(xué)研究上,而不是放在學(xué)習(xí)編程語言上。

Q:至強融核架構(gòu)適合哪些應(yīng)用場景?會有桌面高性能計算這類應(yīng)用嗎?

A:在高性能計算領(lǐng)域,石油、地質(zhì)勘探、氣象、動漫渲染、生命科學(xué)以及一部分的金融行業(yè),金融風(fēng)險分析,這一類應(yīng)用都比較適合至強融核架構(gòu)。在國內(nèi),英特爾也選定了一些目標(biāo)客戶,例如去年就選擇了6個客戶將其應(yīng)用移植過來。實際上,這個過程也是客戶跟我們相互認(rèn)可的過程。同時,我也強調(diào)一點,至強融核產(chǎn)品是定位在數(shù)據(jù)中心、工作站、高性能計算領(lǐng)域。目前主要是著眼在高性能計算,下一代英特爾會幫助客戶在工作站里完成并行計算工作;在數(shù)據(jù)中心當(dāng)中的一些互聯(lián)網(wǎng)應(yīng)用和大數(shù)據(jù)應(yīng)用未來也能從至強融核產(chǎn)品當(dāng)中受益,流媒體監(jiān)控也大有用武之地。

Q:我們發(fā)現(xiàn),榜單上的至強融核混合架構(gòu)的效率是65.53%,未來會有提升的余地嗎?

A:凡是混合的架構(gòu),它的效率都不會太高。完全由至強組成的系統(tǒng),其Linpack效率可以達到90%;但 GPU+至強的結(jié)構(gòu),其效率甚至只有40%多。因此,至強融核混合架構(gòu)的集群效率達到65%,這已經(jīng)非常不錯了。英特爾在國內(nèi)的測試結(jié)果顯示,單節(jié)點效率超過70%。因此,集群效率能夠達到65%是不錯的成績。

CPU不是瓶頸 互聯(lián)才是

Q:現(xiàn)在的融核有大約50顆內(nèi)核,要實現(xiàn)了億億次計算,需要多少核?如何解決多核系統(tǒng)之間的通信問題?

A:要實現(xiàn)百億億次計算不是簡單地對核進行堆疊就能實現(xiàn)的。英特爾預(yù)測到2018年會出現(xiàn)百億億次計算系統(tǒng),這需要互連技術(shù)的進展、編程工具的進展,以及其他方面的進展,這些因素會直接影響到系統(tǒng)最終的計算內(nèi)核數(shù)。如果用理論值計算的話,簡單地用浮點值相乘即可。不過,我相信到2018年,技術(shù)會比現(xiàn)在有很大的進步,所以現(xiàn)在很難準(zhǔn)確預(yù)測系統(tǒng)的內(nèi)核數(shù)。

至于多核系統(tǒng)之間的互聯(lián)通信,這確實是在發(fā)展百億億次計算時急需解決的一個問題。在高性能計算領(lǐng)域,有這么一句名言,“計算是免費的,移動是昂貴的,”指的就是通信問題。高性能計算發(fā)展到現(xiàn)在,計算已經(jīng)不是瓶頸,通信互聯(lián)才是。英特爾本身已有萬兆網(wǎng)卡,在過去一年內(nèi)在互聯(lián)方面投入了很多資源,收購了生產(chǎn)高速交換機的一家公司、Qlogic和Infiniband業(yè)務(wù)和Cray的互聯(lián)技術(shù)。我們也期待有更新的技術(shù)來幫助解決百億億次規(guī)模集群的通訊問題。,我們本身有萬兆網(wǎng)卡,以太網(wǎng)這樣的產(chǎn)品,去年7月份我們收購了一家公司是“Knights Corner”是生產(chǎn)高速交換機的廠商,今年收購了Qlogic和Infiniband業(yè)務(wù)和Cray的互聯(lián)技術(shù)。

Q:既然互聯(lián)通信對高性能計算如此重要,那么,在高性能計算選型時,英特爾如何向客戶推薦Infiniband技術(shù)和萬兆網(wǎng)技術(shù)?

A:Infiniband和萬兆網(wǎng)各有各的特點,萬兆網(wǎng)定義成下一代的統(tǒng)一網(wǎng)絡(luò)(Unified networking),可以把存儲和網(wǎng)絡(luò)整合在一起,能夠提供很大的帶寬,整體的成本也比較好。有的應(yīng)用,例如石油和對計算帶寬要求不太高的環(huán)境,對計算延遲要求也不是那么嚴(yán),可以采用萬兆網(wǎng)技術(shù);而對于像氣象、汽車模擬碰撞、移動,這一類的應(yīng)用就適合應(yīng)用延遲比較低的Infiniband技術(shù)。當(dāng)然,萬兆網(wǎng)技術(shù)的延遲也在逐步降低,縮短了跟Infiniband技術(shù)之間的差距,這時候,我們會根據(jù)客戶的應(yīng)用需求看看到底是適合Infiniband還是適合萬兆網(wǎng)。實際上,高性能計算的應(yīng)用非常不同,不同的應(yīng)用會有特別不同的需求。在大規(guī)模超算上,例如Petaflop級別,萬兆網(wǎng)技術(shù)就不是最合適的。

另一個例子,絕大多數(shù)應(yīng)用都適合在至強上跑,但也有5%到10%的應(yīng)用是高度定制的,例如大數(shù)據(jù)應(yīng)用、動態(tài)學(xué)應(yīng)用等等,這些就比較適合融核應(yīng)用。因此,在至強融核產(chǎn)品發(fā)布之前,英特爾就開始就跟行業(yè)內(nèi)的一些互聯(lián)網(wǎng)廠商和最終用戶幫助把合適的用戶移植到至強融核產(chǎn)品上進行評估,看看什么應(yīng)用最適合。

超算領(lǐng)域 多極并存

Q:您提到在超算領(lǐng)域,CPU已不再是瓶頸。我們也注意到,在TOP 10榜單中,專有系統(tǒng)還有很大的比例。這是否意味著,超算領(lǐng)域的格局已經(jīng)處于專有系統(tǒng)和x86系統(tǒng)的相對平衡狀態(tài)?

A:這個情況與應(yīng)用領(lǐng)域的U2L(UNIX 2 Linux) 或者說RISC Migration(RISC遷移)的情況類似。你會發(fā)現(xiàn),有一些應(yīng)用放在RISC架構(gòu)上有其存在的必然性,超算也一樣。在關(guān)注通用性的時候,尤其是對一般用戶而言,借助商用的互聯(lián)設(shè)備、用開源軟件來搭建一個相對低廉的計算的環(huán)境,這是一個合適的選擇。但是為了追求極限速度,專有系統(tǒng)有其存在價值。因此,專有系統(tǒng)并不會消亡,在頂尖超算系統(tǒng)當(dāng)中,還會出現(xiàn)專用系統(tǒng)的身影。但大家也可以關(guān)注一下,基于至強處理器的高性能計算系統(tǒng),在Top 500榜單當(dāng)中是保持了一個穩(wěn)定上升的趨勢。

Q:在高性能計算領(lǐng)域,英特爾已有處理器、芯片、互聯(lián)架構(gòu),并且能夠幫助用戶進行軟件調(diào)優(yōu),已經(jīng)形成了一條相對完整的產(chǎn)業(yè)鏈。那么,英特爾會在高性能計算領(lǐng)域推行平臺化戰(zhàn)略嗎?就好像在筆記本電腦領(lǐng)域推行迅馳平臺一樣?

A:英特爾現(xiàn)在還沒有做平臺化一體機的想法,但是你會發(fā)現(xiàn),英特爾逐步從處理器生產(chǎn)商的角色逐步向平臺或者系統(tǒng)供應(yīng)商的角色轉(zhuǎn)換。在高性能計算系統(tǒng)當(dāng)中,CPU很重要,但整個系統(tǒng)的效率如何,不僅取決于CPU,還取決于其中的各種子系統(tǒng),例如“內(nèi)存子系統(tǒng)、互聯(lián)通信子系統(tǒng)。英特爾為客戶提供各種各樣的組件,包括Infiniband、萬兆網(wǎng)互聯(lián)的設(shè)備、存儲設(shè)備、計算設(shè)備,甚至還給出一些主板設(shè)計模板、軟件開發(fā)工具,通過這些模塊(Building)來幫助客戶搭建自己最適合的系統(tǒng)。但是,英特爾自身并不會提供一體機之類平臺化的產(chǎn)品。

分享到

zhaohang

相關(guān)推薦