圖示一

內(nèi)存控制器中的探聽過濾器"snoop filter"為了獲取更佳的性能也進行了擴展。探聽過濾器為了適應(yīng)24GB的雙路Harpertown處理器中較大的高速緩沖存儲器,也進行了擴充。作為一種特別的緩沖器,探聽過濾器Snoop Filter中儲存了緩存Tag結(jié)構(gòu)。由于使用了MESI協(xié)議,為確保多核平臺中緩存的一致性,每一個處理器必須時刻注意另一顆處理器的總線情況,而使用探聽過濾器Snoop Filter將有助于減少處理器總線發(fā)生數(shù)據(jù)堵塞情況的發(fā)生。

當(dāng)出現(xiàn)高速緩存未中時,探聽過濾器Snoop Filter將增加到發(fā)起的CPU總線上。隨后,探聽過濾器攔截探聽,并確定是否必須將探聽傳遞到四核中的另一個總線線段上。如果讀取請求同一總線上的另一個處理器得到滿足,則取消探聽過濾器訪問;如果沒有得到滿足,探聽過濾器訪問的結(jié)果將確定是否進行下一個操作。當(dāng)然,也有可能在讀取請求過程中丟失探聽過濾器,此時就直接從內(nèi)存返回數(shù)據(jù),進入下一個循環(huán)。

從終端用戶透視圖上可以看到最顯著的變化來自于輸入/輸出I/O系統(tǒng)。Seaburg芯片集采用兩塊x86 PCI-Express Gen2顯卡,對圖形圖像處理和視頻編輯有較大幫助。上一代工作站芯片集Greencreek還不夠完善,只能用于單圖形顯卡。這些通道可以支持4×8 PCI-E Gen1或者8×4插槽來連接不同種類的存儲子系統(tǒng)或者高性能網(wǎng)絡(luò),諸如10GB以太網(wǎng)。

系統(tǒng)配置情況

讓我們對基于Stoakley服務(wù)器平臺的超微2U系統(tǒng)和的基于Bensley平臺(使用過時的65納米四核Clovertown處理器)的英特爾系統(tǒng)做一個比較。在一種理想狀態(tài)下,我們使用相同頻率的MPU能更直觀的看到Harpertown處理器和Seaburg芯片組的進步,但不幸的是這根本是不可能做到的。仔細的分析和推論或許能彌補頻率上的差異。但是卻會引發(fā)更多不確定的因素。

Stoakley服務(wù)器平臺采用雙獨立前端總線,8個雙列直插內(nèi)存模組,16GB內(nèi)存。但是我們只選取了一半的內(nèi)存用于測試,這顯然無法充分發(fā)揮Stoakley服務(wù)器平臺的優(yōu)勢而使得測試結(jié)果顯得有失公允。SPECjbb2005也能受益于額外的容量。多數(shù)的測試由于每個信道增加了多重雙列直插內(nèi)存模組,也能充分利用額外的帶寬。FB-DIMM信道能同時對獨立的雙列直插內(nèi)存模組進行讀寫,因此每個信道使用兩組雙列直插內(nèi)存模組就能提升可使用的帶寬容量。

 

下面所有基準(zhǔn)性能測試我們都運行了3次,最后結(jié)果取3次結(jié)果的平均值。初始循環(huán)數(shù)據(jù)通常會棄置不用來保證循環(huán)運算的準(zhǔn)確性。我們特意擴大了基準(zhǔn)測試的數(shù)量和范圍。在此先特別感謝技術(shù)支持部門的斯科特.沃森與我們分享多線程程序MyriMatch和循環(huán)運算測試軟件Euler3D。全套基準(zhǔn)測試的軟件包括:

POV-Ray3.7測試版22 (64位)

FlamMap(64位)

Valve VRAD地圖生成測試(秒)

Sungard金融風(fēng)險分析軟件(62位)

Euler3D循環(huán)運算測試軟件

MyriMatch多線程程序

SPECjbb2005 BEA JRockit 6 R27.4(Java服務(wù)器商業(yè)測算基準(zhǔn))

XMLMark數(shù)據(jù)結(jié)構(gòu)

這些基準(zhǔn)涵蓋了多類應(yīng)用軟件領(lǐng)域:有三個主要用于傳統(tǒng)的高性能計算領(lǐng)域,兩個是JAVA服務(wù)器基準(zhǔn),還有兩個是內(nèi)容創(chuàng)建基準(zhǔn)。

POV Ray

POV-Ray 3.7測試版作為我們的標(biāo)準(zhǔn)透視圖基準(zhǔn)已經(jīng)最新升級到版本22.根據(jù)每秒的像素(Pixels/Sec)來反映在基準(zhǔn)場景中的性能。

 

圖示二:POV Ray性能

對于POV Ray圖形軟件來說,Harpertown處理器在單時鐘基礎(chǔ)上比Clovertown處理器速度提高了大約2.3%。這并不讓人驚訝,因為POV Ray圖形軟件能夠?qū)Χ嗑€程技術(shù)提供原生支持。但芯片組額外的帶寬和高速緩存對微體系架構(gòu)的改變沒什么幫助。

大體來說,在2.33兆赫茲和3兆赫茲的芯片之間對IPC進行比較并不完全準(zhǔn)確。只有在POV Ray性能測試考慮到頻率,內(nèi)核數(shù)量等因素才能提供更準(zhǔn)確的線性測量。這種比較關(guān)系就是有效的。

關(guān)注:45納米四核Harpertown處理器性能預(yù)覽(2)

關(guān)注:45納米四核Harpertown處理器性能預(yù)覽(3)

分享到

多易

相關(guān)推薦