MIC架構(gòu)發(fā)展路線圖(圖片來(lái)自驅(qū)動(dòng)之家,下同)

當(dāng)然了,這里的“核心”跟Tesla里邊的CUDA核心是沒(méi)有直接可比性的,它們分別來(lái)自CPU、GPU的世界。

前后做了這么多紙面上的介紹,想不想看看Xeon Phi究竟是個(gè)什么樣子呢?田納西州大學(xué)的田納西高級(jí)計(jì)算中心(TACC)正在他們的新超級(jí)計(jì)算機(jī)“Stampede”(驚跑)里安裝Xeon Phi,也讓我們得以一睹其真容:

至強(qiáng)融核首曝 Intel揭百倍加速性能假象

至強(qiáng)融核

不明說(shuō)的話肯定會(huì)以為這是塊標(biāo)準(zhǔn)的顯卡吧?Tesla其實(shí)也是這個(gè)樣子,標(biāo)準(zhǔn)的雙插槽體積PCI-E x16擴(kuò)展卡,而且是因?yàn)閷S糜谟?jì)算的,都沒(méi)有視頻輸出接口(AMD的還有)。

Xeon Phi也有主動(dòng)散熱、被動(dòng)散熱兩種版本,這里用的是被動(dòng)散熱的,外殼下邊是大量厚重的散熱片和熱管,尾部則能看到一個(gè)六針和一個(gè)八針輔助供電接口,最大供電能力300W。

只可惜人家不讓拆,看不到里邊的樣子。

至于實(shí)際性能如何,很可能現(xiàn)在哪兒都不具備測(cè)試條件,畢竟這玩意兒因?yàn)榧軜?gòu)的緣故要求操作系統(tǒng)、工具軟件都得在一定程度上重新編寫(xiě)和優(yōu)化,Intel也一再?gòu)?qiáng)調(diào)優(yōu)化的重要性。

至強(qiáng)融核首曝 Intel揭百倍加速性能假象

性能提升幅度

Intel也沒(méi)有一味夸大加速計(jì)算的優(yōu)勢(shì),而是首先澄清了一個(gè)誤解。Intel拿出了一段Fortran代碼,先運(yùn)行未優(yōu)化的單線程代碼,然后優(yōu)化并以Xeon Phi運(yùn)行,性能差異達(dá)到了恐怖的300倍。

NVIDIA Tesla宣稱的性能提升差不多就是這樣對(duì)比而來(lái)的,讓加速計(jì)算的結(jié)果和單線程結(jié)果對(duì)比,幾十乃至幾百倍的提升就輕松得來(lái)。

至強(qiáng)融核首曝 Intel揭百倍加速性能假象

來(lái)自客戶實(shí)際應(yīng)用的性能提升

Intel則證明了其謬誤:在雙路Xeon E5上重新運(yùn)行相同的代碼,Xeon Phi只快了大約兩倍而已。也就是說(shuō),如果代碼本身就針對(duì)多核心處理器做過(guò)優(yōu)化,加速計(jì)算的真實(shí)優(yōu)勢(shì)會(huì)小得多。

在另一個(gè)C++的例子中,109倍的提升被證明其實(shí)只有2-2.5倍。

至強(qiáng)融核首曝 Intel揭百倍加速性能假象

綜合基準(zhǔn)測(cè)試摘要

隨后,Intel展示了Xeon Phi協(xié)處理加速計(jì)算所帶來(lái)的真正性能提升,通過(guò)Intel MKL理論測(cè)試得到的幅度為最多2.2-2.9倍,實(shí)際應(yīng)用中則普遍只有最多1.7-2.53倍,只有金融服務(wù)方面取得了10倍左右的突飛猛進(jìn)(布萊克斯克爾斯期權(quán)定價(jià)模型和蒙特卡羅算法)。

Intel還請(qǐng)來(lái)了軟件和技術(shù)供應(yīng)商Altair的一名代表,讓他證明把代碼移植到Xeon Phi平臺(tái)上是多么的簡(jiǎn)單,并證明崩潰測(cè)試模擬之類的應(yīng)用一般可以帶來(lái)2.5倍左右的性能提升。

分享到

zhaohang

相關(guān)推薦