相比桌面運(yùn)算系統(tǒng),Intel早就給服務(wù)器系統(tǒng)準(zhǔn)備了1333MHz總線,至強(qiáng)5335不僅總線速度高,價(jià)格甚至還要比頻率稍低的至尊版更便宜。
可能是因?yàn)榉?wù)器領(lǐng)域?qū)偩€的要求更高,大量的數(shù)據(jù)請(qǐng)求需要在同時(shí)并發(fā),這樣,1333MHz總線就能夠體現(xiàn)出優(yōu)勢(shì)來了。服務(wù)器領(lǐng)域嘗了鮮,但要付出的卻不會(huì)因?yàn)樘幚砥鲀r(jià)格便宜而有所收斂,不同的芯片組加上內(nèi)存等,一系列算下來,成本可要高上很多。
有沒有別的辦法呢?最簡(jiǎn)單的就是等待,Intel預(yù)計(jì)在今年的第三季度推出1333MHz總線的桌面產(chǎn)品,為了凸顯與以前產(chǎn)品的不同,在處理器的型號(hào)上做了一些改動(dòng),改為EXX50。這好像是Intel的慣用伎倆,升級(jí)改動(dòng)比較小的或者不是頂級(jí)系列的產(chǎn)品,往往就在后面添加一個(gè)類似5的后綴,這樣的事情在主板領(lǐng)域就更是不計(jì)其數(shù)了。只提高總線的運(yùn)行頻率,并不會(huì)帶來太多的性能提升,所以Intel還是很乖巧的,并沒有使用更為激進(jìn)的命名方式,尤其是一些對(duì)數(shù)據(jù)交換不是很敏感的應(yīng)用。這個(gè)名字的改變,其實(shí)還代表了不同頻率產(chǎn)品的出現(xiàn),號(hào)稱總線為1333MHz的產(chǎn)品,基頻已經(jīng)達(dá)到了333MHz,所以按照以前的倍率,處理器的頻率會(huì)稍有些提升,計(jì)算能力也會(huì)得到提高。
不過Intel也發(fā)現(xiàn),單純提高處理器的頻率,效果已經(jīng)不是很明顯了。每年幾十億美元的研發(fā)所帶來的性能和架構(gòu)的改變,很容易就被微軟這樣的軟件廠商浪費(fèi)掉了,一些不知名的軟件也很可能讓它的英名掃地。改進(jìn)架構(gòu)是一個(gè)方面,而提高電腦系統(tǒng)里面真正的瓶頸??存儲(chǔ)是另一個(gè)好方案。尤其是Intel最近也比較專注混合磁盤的研究,估計(jì)等非易失性存儲(chǔ)設(shè)備成為內(nèi)存之后,這方面的擔(dān)心會(huì)少一些。
可這些都是遠(yuǎn)水,真正讓我們提前進(jìn)入這個(gè)時(shí)代的是超頻。我們想辦法把手頭的QX6700外頻提到了1333MHz,最后居然還成功登上了1400MHz的頂峰,這讓我們興奮不已??蛇x的精英主板倒是挺多,電壓甚至可以按照0.0125V的幅度調(diào)整,不過就是有些不準(zhǔn),比如電壓調(diào)整,有時(shí)候通過BISO把電壓調(diào)整上去了,但實(shí)際結(jié)果卻是降低了。
還有一點(diǎn)很麻煩的是,要調(diào)整內(nèi)存的參數(shù)以及不同頻率之間的搭配,不能僅僅考慮處理器,還要考慮到周邊的一些情況,一旦某個(gè)條件無法滿足都會(huì)讓我們前功盡棄。且不說為了讓系統(tǒng)能夠正常運(yùn)行,就是為了能夠讓處理器進(jìn)入Windows就已經(jīng)是很讓我們高興的了,然后再繼續(xù)慢慢一步一步地調(diào)整,不僅需要耐心,還要慢慢地思索一些變化。
實(shí)際上,到了1333MHz已經(jīng)差不多觸頂了,處理器開始變得不夠穩(wěn)定,一些測(cè)試也是莫名其妙地過不去,要么是因?yàn)檫^熱,要么是因?yàn)閮?nèi)存錯(cuò)誤,煩不甚煩。每次失敗之后,還得重新來過,時(shí)間就這樣被浪費(fèi)掉了。問題是,各種參數(shù)的搭配相當(dāng)多,我估計(jì)試驗(yàn)了上百次才捉摸到了一點(diǎn)門道,提高了內(nèi)存和處理器的電壓,而把總線的終端截止電壓降低,總算成功了,此后諸事順利。1333MHz之旅從此展開……
提前感受1333MHz
先說平臺(tái),我們選擇的是精英NF650iSLIT-A,只能算是一個(gè)二流的產(chǎn)品。本來沒有想到能夠?qū)崿F(xiàn)總線的超頻,卻是源于這個(gè)主板居然不支持倍頻往高處調(diào)整,只有往低調(diào),這點(diǎn)連Intel的原裝主板都比不上,好歹它都允許電壓倍頻調(diào)整,把處理器超頻到3.43GHz是一點(diǎn)問題都沒有,難道這個(gè)板子這么一點(diǎn)能耐都沒有?沒有這個(gè)能耐,但卻有另外一個(gè)能耐,最大外頻能夠達(dá)到的是處理器所達(dá)不到的,內(nèi)存支持也是相當(dāng)了得,是市面上的產(chǎn)品幾乎都達(dá)不到的。
且不管它。最重要的是,它提供了完善的手動(dòng)選項(xiàng)。我還在暗想,nVIDIA的芯片組就是不一樣,做出的板子都與眾不同,不過要是想充分利用其中的選項(xiàng),沒有幾天幾夜的仔細(xì)搭配估計(jì)也是白搭,偶爾玩玩到是沒什么問題。像我們這樣超頻之后還要經(jīng)歷測(cè)試,估計(jì)就不行了。
這讓我們看到了一絲曙光。Intel的這塊QX6700能不能順利實(shí)現(xiàn)我們的愿望呢?看看它的同胞兄弟,都能在速度更快的總線上運(yùn)行,估計(jì)這個(gè)余量是沒有問題的。而我擔(dān)心的是四個(gè)核心超頻之后,主板供電應(yīng)付不了,所以在電壓調(diào)整上都比較謹(jǐn)慎。Intel的原裝主板都能夠?qū)崿F(xiàn)四核和雙核的轉(zhuǎn)變,而精英的這款就差點(diǎn)意思了,居然沒有。這就是差異,最初X6800測(cè)試的時(shí)候,能夠勉強(qiáng)到3.73GHz,這應(yīng)該是Intel現(xiàn)在的頻率極限。不過,Intel倒是不太在意處理器的頻率提升,盡管IBM放出話來,要超過4GHz,達(dá)到5GHz甚至6GHz,不過這個(gè)離桌面運(yùn)算還是遠(yuǎn)了點(diǎn)。
1333MHz總線的確是很快,不過由于內(nèi)存不同步,貌似需要做一些緩沖,因而一般來說第二次測(cè)試的成績(jī)會(huì)相對(duì)好一些。另外,我們還是用了DDR2 800,表面看來有些寒磣,不過對(duì)處理器的性能影響并不大。Core2架構(gòu)以計(jì)算為中心,頻率的變化對(duì)計(jì)算能力的影響更為顯著。不過,也出了一個(gè)小意外,由于1400MHz總線并不標(biāo)準(zhǔn),我們發(fā)現(xiàn)測(cè)試商用性能的時(shí)候,系統(tǒng)得分反而更低了,最初還懷疑是硬盤的問題,結(jié)果發(fā)現(xiàn)是因?yàn)橄到y(tǒng)總線不同步,導(dǎo)致的同步時(shí)間消耗過多,得分也就降低了。
而對(duì)渲染這樣的運(yùn)算,倒是很需要強(qiáng)大的前端總線,讀寫的東西變得相當(dāng)快,尤其是四核協(xié)同作戰(zhàn)的時(shí)候,效率提升了很多。我們也發(fā)現(xiàn)了不同的算法對(duì)處理器利用率是不同的:基于循環(huán)式的運(yùn)算,對(duì)處理器的利用率幾乎是100%,多核性能的提升基本上是100%;而基于遞歸方式的運(yùn)算,處理器的利用率要打折扣,這也與操作系統(tǒng)的任務(wù)調(diào)度有關(guān)。
另外,我們還注意到,QX6700的巨大緩存還是起到了很大的作用,四個(gè)核心,一共8MB緩存,對(duì)測(cè)試的第一次和第二次的結(jié)果影響巨大,尤其是隨機(jī)讀取比較多的測(cè)試。而對(duì)循環(huán)套用比較多的測(cè)試,也因?yàn)榫彺婢薮蠖兴斋@。
這樣看來,1333MHz總線似乎更適合四核以上的處理器。一方面是因?yàn)镮ntel總線架構(gòu)決定了處理器之間的通信也必須通過總線實(shí)現(xiàn),總線速度提高,核越多效果越好;并且這也將影響處理器的使用方式,只能是盡量減少對(duì)總線的依賴,降低處理器之間的通信,盡量減少遞歸的應(yīng)用。
所以,1333MHz首先出現(xiàn)在服務(wù)器領(lǐng)域還是有道理的,它們服務(wù)的對(duì)象都是多線程,因而差距可能就會(huì)有25%的樣子,就像我們測(cè)試的Cinebench和POVWin的差距。至于我們通常的應(yīng)用,可能是在打開電源的那一剎那,感覺進(jìn)入系統(tǒng)似乎快了一些,至于其他的,總線能夠帶給我們的就很少了。
測(cè)試情況解析
在這次測(cè)試中,主要是得益于處理器頻率的大幅度提升,從而使得整體性能得到了躍升。比如,特別仰賴處理器頻率的渲染,以及一些多媒體的應(yīng)用,因?yàn)樘幚砥黝l率的提升,性能差異比較明顯。另一方面則是因?yàn)橛行╉?xiàng)目數(shù)據(jù)交換比較多,所以仰賴操作系統(tǒng)進(jìn)行調(diào)度,加上Intel處理器的核之間通信需要與芯片組溝通,導(dǎo)致了一些阻塞問題,也因?yàn)榭偩€速度的提高而有所改變。
在四核處理器的運(yùn)算中,核間通信問題對(duì)系統(tǒng)性能的影響較大。這也是因?yàn)镃inebench這樣的渲染軟件,比較仰賴處理器之間的通信,使得多核性能提升的幅度大大減小。比如,在雙核條件下,它的最大性能提升能夠達(dá)到1.87倍,這是考慮到操作系統(tǒng)所能夠?qū)崿F(xiàn)的最大倍率提升。而四核最多就是3倍的水平,也就是說大約有一個(gè)核的計(jì)算能力被消耗在任務(wù)分配方面了,損失還是相當(dāng)慘重的,這樣對(duì)總線的依賴就比較大了,總線的快慢將很大程度地影響最后的測(cè)試得分。
POVwin就不同了,它預(yù)先做好了分配,并且很少有處理器之間的通信,每個(gè)核預(yù)先分配好一定的工作量,讓它們各自把自己的工作運(yùn)行完,這樣反而多核的性能提升得非???。它的重點(diǎn)是在任務(wù)的提前分配上,因而這個(gè)階段耗時(shí)比較多,不過與單核比較起來,性能的提升幅度就比較大了,達(dá)到了4倍,簡(jiǎn)直就是一個(gè)倍增器,一般很少能夠看到這么大幅度地性能提升。
不過,這也暴露了一個(gè)問題:看待多核與單核,還需要注意不同的軟件和不同的算法帶來的差異。當(dāng)然,Intel沒有在處理器內(nèi)部集成內(nèi)存控制器,在一定程度上影響了核與核之間的通信,也就是說,Intel處理器的核心缺乏核與核之間的通信機(jī)制。根據(jù)規(guī)劃,在不久的將來,Intel可能首先在服務(wù)器端推動(dòng)集成內(nèi)存控制器的處理器,相信它們也將會(huì)在處理器內(nèi)部實(shí)現(xiàn)核與核之間的通信機(jī)制,因?yàn)槿绻缓芎玫亟鉀Q這個(gè)問題,將很難應(yīng)付未來的多核時(shí)代。
IBM的做法就聰明多了,也把這一招仍給了AMD。加上AMD數(shù)次攻擊Intel假多核,使得Intel也反唇相譏,說AMD是自取滅亡,原生多核處理器的生產(chǎn)風(fēng)險(xiǎn)太高,導(dǎo)致成品率無法大幅度提高。所以,不管是何種機(jī)制,有一點(diǎn)很明確,就是Intel處理器的核間通信問題必須解決。
AMD的架構(gòu)很適合多數(shù)據(jù)量在多核之間的穿行,因而更適合服務(wù)器領(lǐng)域的應(yīng)用。在這種條件下,計(jì)算的重要性可能放在次席,相比之下,處理器的通信能力更為重要。
這讓我們感受到,不同的軟件對(duì)處理器的不同應(yīng)用方式可能帶來不同的功率消耗。為了對(duì)比不同軟件對(duì)處理器的應(yīng)用情況,我們拿來了海韻電子的功率表,發(fā)現(xiàn)功率之間的差異,籍此,我們也看到了軟件利用處理器之間的效率差異。結(jié)果很有意思,像Cinebench對(duì)處理器的利用率明顯比POVWin低,全功率下要低10多瓦;而在單核條件下,操作系統(tǒng)對(duì)處理器功耗影響比較大,因此效率相差不大。另外,Cinebench對(duì)處理器資源利用不足還來自它利用處理器時(shí)候的功率波動(dòng),POVWin卻要穩(wěn)定得多,這種巨大的差異是一個(gè)很明顯的暗示,POVWin的算法要更優(yōu)秀。但對(duì)多核的應(yīng)用,軟件的分量似乎更大。
我們還需要注意的是,Intel的四核處理器本身給操作系統(tǒng)的認(rèn)知就是一個(gè)遞歸的過程,它是通過類似HT的技術(shù),通過兩個(gè)核再虛擬出兩個(gè)核,以便取得操作系統(tǒng)的識(shí)別,而這兩個(gè)核與HT技術(shù)不同的是,它是實(shí)實(shí)在在的,這也在一定程度上影響了Cinebench的性能。
附件功不可沒
除了精英主板這樣的主力悍將,散熱器和電源也是功勛卓著。精英這款板子已經(jīng)讓我們對(duì)它刮目相看了,最近也從同事嘴里聽到了對(duì)它的認(rèn)可,很難得,精英逐漸得到了認(rèn)同。而精英也在逐漸改變以前只做廉價(jià)產(chǎn)品的形象,像NF650iSLIT-A這款板子這么出色,也是我沒有料到的,可以把QX6700從2.66GHz沖上3.5GHz,內(nèi)存調(diào)整功能的豐富加上選項(xiàng)的繁多,已經(jīng)足夠了。
不過也存在問題,這款板子啟動(dòng)特別慢,尤其是在更改BIOS之后,很讓人心懸,總讓人懷疑是不是不成功了,不過它帶給我的還是喜悅多于失望,值得推薦。
話又說回來,因?yàn)樘幚砥黝l率的提升,功耗就提高了,就需要增加電壓以彌補(bǔ)標(biāo)準(zhǔn)電壓下功率的不足,這就會(huì)對(duì)主板提出相當(dāng)苛刻的要求。QX6700標(biāo)稱最大功耗為125W,超頻之后,頻率提升了30%多,而功率提升一定超過了30%,這就意味著主板的供電必須接近200W的峰值,同時(shí)散熱器如果不夠好,也可能就烤糊了。
我們選擇的是海韻電子的600W電源,效率超過80%,功率因素在324W的時(shí)候達(dá)到了98%;散熱器則是華碩的新款SilentKnight,全銅制造,熱管加風(fēng)扇,十分安靜,最重要的是,散熱能力很強(qiáng)。在QX6700默認(rèn)頻率、室內(nèi)溫度20℃下,處理器溫度只有22℃,超頻到3.5GHz,溫度也就上升3度,這是風(fēng)冷方式中相當(dāng)驚人的成績(jī)。
這一套東西搭配下來,實(shí)現(xiàn)了我們的超頻夢(mèng)想,也讓我們提前感受到了1333MHz的威力。而海韻電子的600W電源也相當(dāng)安靜,如果不是華碩顯卡的散熱風(fēng)扇太大,這幾乎是一個(gè)完美的組合了,如果封裝在機(jī)箱里面,我們將幾乎聽不到任何噪音。
這次測(cè)試也讓我們看到Core2架構(gòu)的潛力,不僅頻率潛力驚人,就是外頻的變化也讓我們刮目相看,尤其是一些渲染類的軟件,對(duì)外頻的仰賴還是很大的。1333MHz對(duì)于那些經(jīng)常需要視頻處理的用戶來說,是相當(dāng)好的消息??墒?,什么時(shí)候才能把硬盤這個(gè)瓶頸解決呢?這不是僅僅通過改接口就能解決的問題,說不定,在1333MHz總線之后,這是下一個(gè)議題吧。
鏈 接:總線頻率與處理器頻率
總線頻率一般是低于處理器頻率的,處理器與總線之間通過倍頻實(shí)現(xiàn)同步。總線頻率就如同整個(gè)系統(tǒng)的基準(zhǔn)頻率一樣,實(shí)現(xiàn)I/O、內(nèi)存等與處理器之間的數(shù)據(jù)交換。
既然外頻跟前端總線的頻率是呈倍頻關(guān)系,知道了總線頻率,也就知道了處理器的運(yùn)行頻率(在倍率一定的情況下)。處理器的頻率就是CPU頻率=FSB頻率×倍率。同一級(jí)別的處理器,處理器廠商往往通過設(shè)定不同的倍頻,實(shí)現(xiàn)頻率差異,從而制造出不同的處理器,從本質(zhì)上說可能基本一樣的,只是品質(zhì)上略有差異而已。
這就直接導(dǎo)致了超頻。超頻專家認(rèn)為,只要是同批次的產(chǎn)品、同樣的工藝、同樣的體系結(jié)構(gòu),那么處理器的最大工作頻率就是相當(dāng)?shù)?,只不過有些能夠更穩(wěn)定一些,而大部分在這個(gè)頻率下可能不能用。
在處理器的制造過程中,可以利用新的工藝逼近硅材料的極限,比如Intel的拉伸硅技術(shù),還有未來的high K技術(shù),都會(huì)讓處理器的功耗和頻率帶來變化。但是,頻率高的處理器面臨的問題更多,它們的發(fā)熱量更大,功耗并不與處理器的頻率完全成正比。一般來說,處理器的功耗大部分是被緩存消耗的,它們需要通過持續(xù)的電流保證數(shù)據(jù)的存儲(chǔ),而計(jì)算邏輯的開關(guān)模式跟頻率成正比,這是理想的情況;而超頻之后,泄漏電流增加,無用功耗增加直接導(dǎo)致處理器發(fā)熱大大增加,使得繼續(xù)超頻成為不可能。
這就要加強(qiáng)散熱,但是一定材質(zhì)和體積的晶體管密度的產(chǎn)品,散熱的能力就確定了,為了獲得更多的超頻能力,需要采取極限措施,比如液氮、半導(dǎo)體以及干冰等制冷,把處理器頻率提升到新的水平。
頻率增加、制造工藝提高,這就會(huì)帶來新的干擾,雖然工作電壓降低了,但是降低到一定程度硅也就不可用了。比如,硅的開關(guān)電壓是0.7V左右,現(xiàn)在處理器最低工作電壓已經(jīng)在1V左右,空間已經(jīng)很小。而超頻過程中增加電壓,按道理對(duì)提高處理器的頻率是不利的,這么做主要是為了提供給處理器足夠的、在高頻率下的功率。
Intel目前使用的是QDR數(shù)據(jù)傳輸觸發(fā)形式,也就是說,把地址尋找和數(shù)據(jù)傳輸分開,在一個(gè)周期的4個(gè)拐點(diǎn)進(jìn)行數(shù)據(jù)觸發(fā),從而把實(shí)際的數(shù)據(jù)傳輸4倍乘積,1333MHz的總線頻率對(duì)應(yīng)的實(shí)際頻率為333MHz。
AMD采取了不同的策略,它把總線內(nèi)建于處理器,使得處理器成為信息交換的中心,這能夠大大提高數(shù)據(jù)交換的效率,使得它能夠特別適合服務(wù)器應(yīng)用,并且處理器之間的直接通信也成為可能。
從現(xiàn)在來看,Intel處理器在計(jì)算能力上還有很大的空間,因而提升總線頻率意義重大,還會(huì)讓未來的四核主流處理器的性能得到大幅度地提升,同時(shí)也為未來強(qiáng)悍的集成圖形芯片提供了很好的空間。