從AMD四核皓龍?zhí)幚砥鞯慕Y(jié)構(gòu)圖(左圖)中可以看出,每個(gè)CPU都擁有自己獨(dú)立的內(nèi)存通道及對外通道,相互之間也能夠靈活通信,實(shí)現(xiàn)出色的并行性。而與競爭對手的產(chǎn)品相比(右圖),AMD的每個(gè)處理器有自己獨(dú)立的一、二級緩存及共享的三級緩存,無需通過前端總線,避免了瓶頸。

超傳輸總線高速互連

超傳輸總線,也是AMD應(yīng)用于速龍64及皓龍?zhí)幚砥髦械幕ミB技術(shù),是實(shí)現(xiàn)AMD四核皓龍?zhí)幚砥髁己貌⑿行缘牧硪恢匾?。它是摒棄了傳統(tǒng)的前端總線之后的新一代互連技術(shù)。傳統(tǒng)的處理器與內(nèi)存交換數(shù)據(jù),是處理器-北橋-內(nèi)存這樣的交換形式,而這種形式的弊端在于交換數(shù)據(jù)的延遲比較大,而AMD超傳輸技術(shù)正是解決這一問題的,即將原本集成在北橋里的內(nèi)存控制器集成到CPU內(nèi)部,這樣內(nèi)存與處理器之間交換數(shù)據(jù)的延遲大大縮短。

超傳輸總線是一種可變速率的串行接口,而傳統(tǒng)的方式則是使皓龍?zhí)幚砥骶邆涿棵? GB的帶寬,而且因?yàn)橹С蛛p向同時(shí)傳輸,所以相當(dāng)于每個(gè)超傳輸接口的總帶寬為每秒8 GB。串行接口的帶寬在設(shè)計(jì)時(shí)就具備一定的彈性。隨著更多核心的加入,皓龍?zhí)幚砥骺梢栽黾映瑐鬏斂偩€數(shù)量,另一方面超傳輸總線的頻率也可以不斷提升,保證有足夠的帶寬可用。

CPU的核心越多,系統(tǒng)中CPU越多路,超傳輸總線就能夠提供越大帶寬,實(shí)現(xiàn)提高服務(wù)器運(yùn)算性能,超傳輸總線的效果也就越明顯。通過HT總線進(jìn)行數(shù)據(jù)傳輸,性能的提升大幅超過僅僅只是靠系統(tǒng)總線作為數(shù)據(jù)傳輸數(shù)據(jù)交換。在即將推出的代號為"上海"的45納米4核皓龍?zhí)幚砥魃希瑐鬏斂偩€將從1.0版本跨越式升級到3.0版本,時(shí)鐘將從1000MHz提升到2.6MHz,超傳輸?shù)膸捯矎?GB/秒躍進(jìn)到16GB/秒,為CPU之間數(shù)據(jù)交換提供了通暢的渠道。

創(chuàng)新提升高性能計(jì)算平臺

真四核直連架構(gòu)和超傳輸總線集成內(nèi)存控制器作為AMD多核處理器的兩項(xiàng)獨(dú)特創(chuàng)新,為快速提升處理器的性能,特別是處理器的并行性打下了堅(jiān)實(shí)的基礎(chǔ)。兩項(xiàng)技術(shù)的共同特點(diǎn)是為多核處理器的核心性能充分發(fā)揮鋪好了高速通道,無論是核心之間還是CPU與外界的通信都游刃有余。而且這樣的高速通道具備高度可擴(kuò)展性,能夠隨著多核處理器核心不斷增加而不斷拓寬,不會產(chǎn)生其它架構(gòu)的瓶頸問題。

周會群教授表示,他曾經(jīng)接觸過AMD從單核到雙核及四核的系列產(chǎn)品,性能都非常出色。這也是AMD四核皓龍?zhí)幚砥髟谀暇┐髮W(xué)的選型測試中取得好成績的關(guān)鍵。好的并行性,使得每個(gè)節(jié)點(diǎn)的CPU性能充分發(fā)揮,正是從根本上解決了提升集群與網(wǎng)格性能的關(guān)鍵性問題,實(shí)現(xiàn)高性能計(jì)算平臺整體性能提升。

分享到

多易

相關(guān)推薦