圖1 左起依次為浪潮公司HPC應(yīng)用技術(shù)經(jīng)理張清、浪潮集團(tuán)高性能服務(wù)器產(chǎn)品部總經(jīng)理劉軍、NVIDIA(英偉達(dá))中國區(qū)技術(shù)與解決方案高級顧問鄧培智
K40亮點:顯存空間提升 降低編程難度
從K40的性能指標(biāo)可以看出,相比之前的K20而言,最大的改進(jìn)就是顯存容量增加了一倍,這對于數(shù)據(jù)量高的應(yīng)用是一個很好的改進(jìn)。其次是,K40新增了GPU Boost的功能,應(yīng)用可以充分利用GPU Boost功能,提升GPU的能力,GPU Boost最高可以提高10-20%的性能。盡管性能有所提升,但Tesla K40的熱設(shè)計功耗依然保持在235W,而散熱方式除了被動式之外還增加了主動式。
浪潮高性能計算專家張清表示,“Tesla K40性能方面提升了10-30%,更重要的是編程方面的進(jìn)一步改進(jìn),我想CUDA 6.0版本出來之后,對CPU和GPU會建立統(tǒng)一的尋址方式,對編程的難度會有進(jìn)一步的降低。另外,顯存空間的提升,以及PCI-E帶寬的提升,對這種大數(shù)據(jù)量高性能行業(yè)應(yīng)用是一個福音。我們之前做了很多應(yīng)用,數(shù)據(jù)擱不下,導(dǎo)致編程難度加大。所以硬件直接升級,將大大降低編程的難度”。
由于Tesla K40和K20的制程工藝沒有差別,因此,用戶在升級時可以直接用K40加速卡替換K20。對于服務(wù)器廠商而言,也無需改變服務(wù)器的設(shè)計。當(dāng)然,K20和K40在市場上將會并行存在一段時間,并逐步過渡到K40。
聯(lián)手推動GPU的應(yīng)用 關(guān)鍵在應(yīng)用和人才
理論上,很多其他行業(yè)的大數(shù)據(jù)問題,都可以通過高性能計算機(jī)來解決。只是,應(yīng)用軟件的缺乏導(dǎo)致高性能計算機(jī)的計算能力沒有卻辦法“動起來”,而應(yīng)用軟件缺乏的主要原因則是人才的缺乏。
用一個不恰當(dāng)?shù)谋扔鱽砝斫?,高性能計算機(jī)就好比是米飯,而應(yīng)用軟件就像是電飯煲,而人才就是會用電飯煲做飯的巧婦。如果空有米飯,卻沒有電飯煲和會使用電飯煲的巧婦,那我們永遠(yuǎn)都吃不到香噴噴的米飯。
浪潮和NVIDIA的一致共識就是要從應(yīng)用端去推動GPU的應(yīng)用。目前,許多客戶在使用的商業(yè)軟件或是使用國際上比較成熟的計算軟件,已經(jīng)有CUDA的版本,可以利用GPU的加速技術(shù)。據(jù)了解,在中國一些比較典型的行業(yè)應(yīng)用,比如石油、生命科學(xué)、互聯(lián)網(wǎng)、圖像等方面,浪潮通過與軟件開發(fā)者進(jìn)行廣泛合作,開發(fā)了基于Tesla GPU加速器的軟件版本。
除了傳統(tǒng)的超大型超算中心之外,目前,GPU客戶的范圍正在不斷擴(kuò)展,還有很多其他新興行業(yè)的客戶,比如互聯(lián)網(wǎng)、通訊、金融等等。從浪潮的銷售數(shù)據(jù)來看,GPU的增長速度已經(jīng)達(dá)到了三倍,超過了NVIDIA統(tǒng)計的兩倍的增長速度。未來,GPU在互聯(lián)網(wǎng)的應(yīng)用需求將非常大,所以我們也在和NVIDIA一起積極推進(jìn)互聯(lián)網(wǎng)行業(yè)的應(yīng)用。據(jù)介紹,浪潮和NVIDIA的戰(zhàn)略合作中,有一個專門的研究課題,就是針對GPU和大數(shù)據(jù)結(jié)合的研究。
“在互聯(lián)網(wǎng)領(lǐng)域,目前是采用CPU來做計算,但是互聯(lián)網(wǎng)的圖片搜索,視頻、音頻的轉(zhuǎn)碼分析這一塊陸續(xù)即將要采用GPU的架構(gòu)來做,像奇虎和阿里巴巴等互聯(lián)網(wǎng)企業(yè),都在一起做這一方面的合作,還有在安防行業(yè),也準(zhǔn)備采用GPU架構(gòu)來做這一方面的加速”,張清介紹了互聯(lián)網(wǎng)領(lǐng)域如何跟GPU相結(jié)合。
事實上,浪潮和NVIDIA去年就共同發(fā)布了“GPU卓越人才計劃”,目前,通過認(rèn)證的工程師已經(jīng)達(dá)到了100人。雙方在人才和應(yīng)用方面的共同發(fā)力,將會對GPU的應(yīng)用和生態(tài)系統(tǒng)的進(jìn)一步完善,起到非常重要的推動作用。