筆者初次來計(jì)算所是1998年,參加一個關(guān)于PC維護(hù)方面的培訓(xùn);2002年曾過來組裝過一臺雙路Intel Xeon 2.4GHz CPU、SuperMicro主板+勤誠機(jī)箱的服務(wù)器,那次在樓里還路過了倪光南院士的辦公室。如今到這里采訪,原來的大門和招牌已經(jīng)被現(xiàn)在高樓前的地標(biāo)所替代。

中國科學(xué)院計(jì)算技術(shù)研究所——英特爾聯(lián)合實(shí)驗(yàn)室揭牌儀式昨天在京舉辦。旨在通過進(jìn)一步擴(kuò)大科技開放合作,提高我國科技發(fā)展國際化水平,在更高起點(diǎn)上推進(jìn)自主創(chuàng)新,中國科學(xué)院計(jì)算技術(shù)研究所與英特爾正式簽署研究與發(fā)展合作協(xié)議,通過整合雙方資源優(yōu)勢,共同推動中國科學(xué)研究技術(shù)發(fā)展。中國科學(xué)院計(jì)算技術(shù)研究所所長孫凝暉博士與英特爾資深院士、數(shù)據(jù)中心及互聯(lián)系統(tǒng)事業(yè)部首席技術(shù)官、英特爾架構(gòu)事業(yè)部和數(shù)據(jù)中心及互聯(lián)系統(tǒng)事業(yè)部前瞻研究部總經(jīng)理 Stephen S. Pawlowski 先生參加了本次揭牌儀式。

本次簽署的研究與發(fā)展合作協(xié)議將會以英特爾與中國科學(xué)院計(jì)算技術(shù)研究所共同建立的聯(lián)合實(shí)驗(yàn)室為平臺,憑借英特爾對于微處理器、芯片組、軟件和計(jì)算與互連產(chǎn)品的設(shè)計(jì)、制造與分發(fā)等優(yōu)勢,與中國科學(xué)院計(jì)算技術(shù)研究所在信息科技領(lǐng)域的研發(fā)資源整合,展開針對即將面世的英特爾集成眾核架構(gòu)(Intel MIC )平臺的領(lǐng)域編程與優(yōu)化、應(yīng)用程序調(diào)優(yōu)以及開發(fā)數(shù)據(jù)中心評估基準(zhǔn),更加深入地探索高效的數(shù)據(jù)中心服務(wù)器體系結(jié)構(gòu),開發(fā)相應(yīng)的硬件和軟件系統(tǒng),特別是基于英特爾至強(qiáng)處理器與英特爾集成眾核架構(gòu)的混合架構(gòu)系統(tǒng)。同時(shí)合作的研究方向還有通過基于英特爾至強(qiáng)處理器平臺針對基因測序的可重構(gòu)計(jì)算系統(tǒng)等。

大規(guī)模并行計(jì)算將不局限于HPC

ChinaByte比特網(wǎng):“我想問一下孫所長,您覺得使用Intel MIC(Xeon Phi)異構(gòu)計(jì)算的產(chǎn)品,與曙光6000這樣的CPU+GPU異構(gòu)HPC相比有哪些優(yōu)勢嗎?”

孫凝暉:“我們共同認(rèn)為異構(gòu)計(jì)算,無論是Xeon級的超級計(jì)算機(jī),還是數(shù)據(jù)中心級的超級計(jì)算機(jī)都是同樣的發(fā)展方式。通用的結(jié)構(gòu)在現(xiàn)在的能耗下追求效率,不僅僅是追求速度,它不能解決所有的問題?;蛘咴跇O端負(fù)載下不是高效率,通用平臺只有在負(fù)載不那么極端的情況下做的挺好。我們認(rèn)為這樣的異構(gòu)平臺應(yīng)該是高性能計(jì)算的技術(shù),也能夠用到量大面廣的企業(yè)級計(jì)算。如果某一項(xiàng)主流的技術(shù)只用在高性能計(jì)算里是沒有生命力和市場的,這是我們共同的看法。

我們不去做特定于高性能計(jì)算領(lǐng)域的很狹小市場的技術(shù),這和計(jì)算所一貫追求的目標(biāo),有三個關(guān)鍵詞代表我們的技術(shù),算的快、應(yīng)用廣、易產(chǎn)業(yè)化。我們研究的技術(shù),開發(fā)的技術(shù),一定要在這三個維度都能夠有所幫助,要算得快或者算得多,數(shù)據(jù)中心應(yīng)用是算得多,第二是應(yīng)用廣,不能只支持十個算法、兩個用戶,那這個是很難有前途的,第三要易于產(chǎn)業(yè)化,有些技術(shù)雖然很好,很多好技術(shù)但是最后死掉了,因?yàn)椴灰桩a(chǎn)業(yè)化。所以下一代的高性能計(jì)算機(jī),十億次、百億次的一定是這樣的異構(gòu)平臺。

針對MIC我們要做三部分的工作:第一、算法和編譯器的研究,對性能進(jìn)行優(yōu)化;第二、中國當(dāng)前的數(shù)據(jù)中心用戶負(fù)載特征已經(jīng)比較明顯,我們想從中抽象出一些作為BenchMark,就像SPEC CPU2000(2006)和LINPACK是測試計(jì)算性能那樣,現(xiàn)在我們?nèi)狈τ跀?shù)據(jù)中心的基準(zhǔn)測試;第三、縮短眾核用戶的開發(fā)周期。”

孫凝暉博士在揭牌儀式中講到:“這次與計(jì)算創(chuàng)新領(lǐng)域的全球領(lǐng)先廠商英特爾公司合作,將會結(jié)合英特爾公司在計(jì)算架構(gòu)和半導(dǎo)體技術(shù)方面的優(yōu)勢,并緊密結(jié)合中國國內(nèi)科研對高性能計(jì)算的需求,充分發(fā)揮各自的技術(shù)優(yōu)勢,為關(guān)鍵領(lǐng)域科學(xué)研究實(shí)現(xiàn)原創(chuàng)性重大突破提供創(chuàng)新引擎。”

TOP500僅是一項(xiàng)比賽,計(jì)算定制通用十年輪回

ChinaByte比特網(wǎng):“目前國際上的HPC TOP500,和國內(nèi)排名前幾位的系統(tǒng)中,都有以RISC架構(gòu)CPU作為主要計(jì)算單元,并包含部分自主知識產(chǎn)權(quán)(核心技術(shù))的系統(tǒng)入選。而曙光近些年研究和生產(chǎn)的超級計(jì)算機(jī)都是x86平臺。請問您站在計(jì)算所的角度,怎樣看待RISC架構(gòu)在編程和應(yīng)用性方面的不同,以及自主知識產(chǎn)權(quán)對本國的意義?”

注:這個問題,我其實(shí)是想得到孫所長對江南所研發(fā)的神威藍(lán)光,以及富士通“京”這些產(chǎn)品的看法。

孫凝暉:“自主知識產(chǎn)權(quán)首先肯定非常重要,沒有自主技術(shù)根本沒有機(jī)會做領(lǐng)先的事情,這是毫無疑問的。這并不是中國獨(dú)有的問題,世界上任何一個領(lǐng)導(dǎo)型的國家或者領(lǐng)導(dǎo)型的企業(yè)一定要有自主知識產(chǎn)權(quán),所謂自主的核心技術(shù)、自己的核心部件,不然就是二流角色,是跟隨者角色,是價(jià)值鏈、產(chǎn)業(yè)鏈的末端。這和某一個技術(shù)選擇沒有關(guān)系,是兩個維度的事情。我們中國過去在這方面追求的太少了,我們能夠拿出來參與國際競爭的東西太少了,所以我們要更多地在這方面投入力量。

至于RISC這個問題,談不上誰好誰壞。我們以前可能是站在比較低的位置上看世界,覺得這個很奇怪,總是用階級斗爭的想法。其實(shí)這個世界是多樣性的,中國現(xiàn)在應(yīng)該更加自信,我們應(yīng)該站在國際舞臺上,站在更高的地方來俯視來看,這樣就一點(diǎn)也不奇怪了。不同的人、不同的用戶需求不同,都可以Enjoy在他們喜歡的東西里面。

你看TOP500僅僅是一項(xiàng)比賽,僅僅是奧運(yùn)會的一個110米欄。我們無非是劉翔贏了一次金牌,但是可能下次摔倒。里面有一些機(jī)器贏得了奧運(yùn)會的金牌,但并不代表它們有市場。當(dāng)然除了這些滿足企業(yè)廣大用戶的機(jī)器,還有和國家安全有關(guān)的應(yīng)用、有關(guān)的需求,美國有、中國有,那些應(yīng)用并不需要考慮市場,所有世界大國都需要這樣的技術(shù),都在做類似的事情,可能TOP500里面有幾個高端機(jī)器是面向那個目標(biāo)的,也是非常有價(jià)值的,應(yīng)該全力以赴做的,但是不代表有市場,我們更多影響老百姓普通生活的那些東西也是非常重要的,iPhone難嗎?你會做嗎?它也是非常要緊的事情。所以這是不同維度的事情,都非常重要。”

還有記者朋友提問:“高性能計(jì)算應(yīng)用領(lǐng)域根據(jù)行業(yè)不同軟件的差異化、定制化比較明顯,請問孫所長,以后有沒有專門針對于不同行業(yè)進(jìn)行軟硬件系統(tǒng)的研究和優(yōu)化,或者說現(xiàn)在有沒有針對于行業(yè)應(yīng)用的研究成果?”

孫凝暉:“現(xiàn)在有一個專業(yè)詞“Co-Design(定制設(shè)計(jì))”,當(dāng)計(jì)算機(jī)技術(shù)或者處理器技術(shù)發(fā)展很順利的時(shí)候不需要,就是摩爾定律很順利時(shí)我們只要等著就可以了,為什么今天需要(Co-Design)呢?今天這些技術(shù),尤其是半導(dǎo)體工藝的限制,所以我們把結(jié)構(gòu)弄的更加復(fù)雜,這其實(shí)是不可持續(xù)的??赡苓@十年沒有辦法,也許現(xiàn)在都在做(Co-Design)了,看未來十年二十年后,肯定另外一個進(jìn)步會減少我們的工作量,讓用戶更容易達(dá)到他的性能?,F(xiàn)在沒有辦法,所以看到這么多的多核、眾核結(jié)構(gòu)。

其實(shí)用一個復(fù)雜的、并且是多樣的結(jié)構(gòu)來面對這些新需求、新應(yīng)用,這其實(shí)是很糟糕的一個方式,但是這一段方式我們只有這樣做。我們看計(jì)算技術(shù)發(fā)展歷史都是這樣的,現(xiàn)在處在計(jì)算機(jī)是發(fā)展的低谷,我們看英特爾的利潤發(fā)展曲線應(yīng)該是這樣的。在這樣的低谷上,中科院過程所有一臺機(jī)器就是Co-Design的機(jī)器,中科院最早和曙光合作,根據(jù)過程計(jì)算應(yīng)用提供了非常適合它的硬件架構(gòu)、軟件架構(gòu)來支持。就舉科學(xué)院的例子,高能物理所,大家知道的核聚變點(diǎn)火工程、高能物理的對撞實(shí)驗(yàn),它的平臺也是Co-Design定制化的。

從去年開始我們找美國、日本這些領(lǐng)域的技術(shù)專家,都在研究算法如何,現(xiàn)在因?yàn)榻Y(jié)構(gòu)復(fù)雜,算法變得更復(fù)雜了,以及算法怎么更好地適配現(xiàn)在的硬件?,F(xiàn)在好幾個橫向擴(kuò)展(Scale-out)很復(fù)雜,片內(nèi)并行也很復(fù)雜,MIC是片內(nèi)并行維度的復(fù)雜,我們有更多的Cache的層次,里面更加復(fù)雜,還有片上的網(wǎng)絡(luò),數(shù)據(jù)移動變得很重、很貴、很耗能,這又是一維復(fù)雜性。你說的問題是這十年來,學(xué)術(shù)界、企業(yè)界應(yīng)該努力的方向。

我個人認(rèn)為ExaScale級的計(jì)算一定不是這種我們現(xiàn)在看的曙光4000、曙光5000這樣通用的平臺。曙光6000用了異構(gòu)計(jì)算,不能說特別通用了,因?yàn)楹芏鄳?yīng)用上面用不到(GPU)加速就不好;但另外一些應(yīng)用就不是這樣的應(yīng)用架構(gòu),你做一個4000、5000那樣通用的,所有的應(yīng)用都能利用得很好。在ExaScale級的不現(xiàn)實(shí),ExaScale級的系統(tǒng)一定是Co-Design的。當(dāng)我們的器件發(fā)生巨大的變化,我肯定不如Pawlowski研究得更深刻,在微電子、半導(dǎo)體技術(shù)帶來巨大改變以后,我個人預(yù)測十年后可能會重新走向通用的曲線上。”

筆者猜測,到那時(shí)可能就是今天的CPU和協(xié)處理器(包括GPU和Intel MIC)進(jìn)一步實(shí)現(xiàn)融合的時(shí)候。當(dāng)然應(yīng)該也包含軟件對異構(gòu)計(jì)算的普遍支持和優(yōu)化。

分享到

zhaohang

相關(guān)推薦