国产精品无码AV,亚洲高清一区二区三区不卡

MIC架構(gòu)發(fā)展路線圖(圖片來自驅(qū)動之家，下同)

當(dāng)然了，這里的“核心”跟Tesla里邊的CUDA核心是沒有直接可比性的，它們分別來自CPU、GPU的世界。

前后做了這么多紙面上的介紹，想不想看看Xeon Phi究竟是個什么樣子呢?田納西州大學(xué)的田納西高級計算中心(TACC)正在他們的新超級計算機“Stampede”(驚跑)里安裝Xeon Phi，也讓我們得以一睹其真容：

至強融核

不明說的話肯定會以為這是塊標(biāo)準(zhǔn)的顯卡吧?Tesla其實也是這個樣子，標(biāo)準(zhǔn)的雙插槽體積PCI-E x16擴展卡，而且是因為專用于計算的，都沒有視頻輸出接口(AMD的還有)。

Xeon Phi也有主動散熱、被動散熱兩種版本，這里用的是被動散熱的，外殼下邊是大量厚重的散熱片和熱管，尾部則能看到一個六針和一個八針輔助供電接口，最大供電能力300W。

只可惜人家不讓拆，看不到里邊的樣子。

至于實際性能如何，很可能現(xiàn)在哪兒都不具備測試條件，畢竟這玩意兒因為架構(gòu)的緣故要求操作系統(tǒng)、工具軟件都得在一定程度上重新編寫和優(yōu)化，Intel也一再強調(diào)優(yōu)化的重要性。

性能提升幅度

Intel也沒有一味夸大加速計算的優(yōu)勢，而是首先澄清了一個誤解。Intel拿出了一段Fortran代碼，先運行未優(yōu)化的單線程代碼，然后優(yōu)化并以Xeon Phi運行，性能差異達到了恐怖的300倍。

NVIDIA Tesla宣稱的性能提升差不多就是這樣對比而來的，讓加速計算的結(jié)果和單線程結(jié)果對比，幾十乃至幾百倍的提升就輕松得來。

來自客戶實際應(yīng)用的性能提升

Intel則證明了其謬誤：在雙路Xeon E5上重新運行相同的代碼，Xeon Phi只快了大約兩倍而已。也就是說，如果代碼本身就針對多核心處理器做過優(yōu)化，加速計算的真實優(yōu)勢會小得多。

在另一個C++的例子中，109倍的提升被證明其實只有2-2.5倍。

綜合基準(zhǔn)測試摘要

隨后，Intel展示了Xeon Phi協(xié)處理加速計算所帶來的真正性能提升，通過Intel MKL理論測試得到的幅度為最多2.2-2.9倍，實際應(yīng)用中則普遍只有最多1.7-2.53倍，只有金融服務(wù)方面取得了10倍左右的突飛猛進(布萊克斯克爾斯期權(quán)定價模型和蒙特卡羅算法)。

Intel還請來了軟件和技術(shù)供應(yīng)商Altair的一名代表，讓他證明把代碼移植到Xeon Phi平臺上是多么的簡單，并證明崩潰測試模擬之類的應(yīng)用一般可以帶來2.5倍左右的性能提升。

分享到

zhaohang

相關(guān)推薦

近期文章

熱門標(biāo)簽