就像一個人要提升工作效率就必須采用更為先進的工作方法一樣,從處理器的設計角度來說,要想提升其效率,主要途徑就是必須采用新的、在IPC上表現(xiàn)更佳的微架構(Microarchitecture,或稱微體系架構)。
從理論上來說,處理器微架構就是對處理器所采用的指令集體系結構,如x86、PowerPC的一種邏輯實現(xiàn)。處理器微架構的設計,實際上涵蓋了對處理器中所有模塊,如控制單元、指令預取單元、高速緩存單元、分支預測單元、運算單元、總線接口單元及這些模塊的連接和協(xié)作方式的設計,其目標則是一方面要使指令集體系結構定義的功能能夠得以實現(xiàn),另一方面就是要不斷提升整個處理器的工作效率。
與發(fā)展緩慢、甚至是許多年穩(wěn)固不變的指令集體系結構不同,處理器微架構幾乎每隔幾年就會有升級換代。如人們所熟悉的英特爾奔騰處理器家族,從奔騰、奔騰2、奔騰3再到奔騰4,他們的換代就主要是源于微架構的改進。而去年英特爾推出的酷睿2與之前的奔騰4及奔騰D的差別,也在于它使用了效率更高、耗能更低的酷睿(Core)微架構,而不是后者所用的NetBrust微架構。
我們或許可以通過對比酷睿與NetBrust微架構的一些差異來理解微架構的改進對處理器效率提升帶來的有益作用。實際上,在酷睿微架構采用的五大創(chuàng)新技術中,多數均與處理器效率提升有直接或間接的關系,例如其寬位動態(tài)執(zhí)行技術,就是通過將解碼器從前一代微架構的3個增加到4個,來提升處理器的IPC值;又如它采用的高級數字媒體增強技術,就將前一代產品必須用兩個時鐘周期才能處理完的SSE指令改為在一個時鐘周期內完成,這也有助于處理器效率的提升。此外,酷睿微架構還采用了宏融合(Macro-Fusion)技術,在解碼時可將同類指令融合為單一的指令,以減少待處理的指令總數,這與處理器性能公式強調減少待執(zhí)行程序指令數目的要求相合,也能夠起到提升性能的作用。
選芯須兼顧架構與速度
所上文所述,評估處理器性能的高下,較為科學的方法應是綜合考察微架構和時鐘頻率兩個方面的差異,這種方法尤其適用于采用不同微架構的處理器產品。而要在基于同一微架構的處理器產品中進行性能評估時,以時鐘頻率作為衡量標準的方法事實上并未過時,當然,在時鐘頻率之外,消費者也需要了解它們在系統(tǒng)總線頻率、緩存容量上是否還有差異。
以英特爾現(xiàn)有的PC處理器產品為例,不論是它定位于高端的四核酷睿2(Core 2 Quad)、定位于中高端的雙核酷睿2(Core 2 Duo)、還是它主攻低端市場的雙核奔騰和單核賽揚主力產品,現(xiàn)在都采用了目前業(yè)界效率最為出色的酷睿微架構,當消費者需要將它們與其他廠商或微架構的產品進行對比時,消費者就不能只看時鐘頻率上的差異,但如果消費者只需在這四款酷睿微架構的產品中進行選擇,那么就只需考慮它們在核心數量、時鐘頻率、緩存容量及前端總線頻率上的差別即可。
或許有人還會追問:既然時鐘頻率一直以來就不是衡量處理器性能的惟一標準,那為什么在過去很多年中,這種"速度即性能"的觀點卻一直能夠大行于道呢?為什么現(xiàn)在人們在選擇PC處理器時還要多考慮微架構的差異呢?
其實,造成這一情況的原因在于過去三十多年間,處理器在時鐘頻率上的增長幅度要遠遠超過了其效率的提升幅度。從上世紀70年代初英特爾推出全球首款處理器4004以來,處理器的時鐘頻率增長幅度已經達到了近30000倍,而IPC提升幅度只有幾十倍,處理器性能的提升很大程度上要歸功于時鐘頻率的飛速增長,而今,時鐘頻率的提升因為處理器功耗的不斷增加已經遇到瓶頸,而其在效率上的改進,即微架構的改進對性能提升的作用開始變得越來越重要,實際上,處理器從單核走向多核,也是微架構上的革新,也是為了大幅提升處理器的效率。因此,在多核時代,評估PC處理器性能要兼顧微架構與時鐘頻率已經成為必然趨勢。
軟件優(yōu)化情況不可忽視
PC處理器多核時代的來臨,不但讓消費者們在選購處理器及PC時不再以時鐘頻率作為衡量其性能的惟一標準,還在逐漸引導他們關注軟件優(yōu)化的問題,即操作系統(tǒng)和應用軟件是否能夠針對多核PC處理器進行調優(yōu),以充分發(fā)揮或發(fā)掘其性能優(yōu)勢,尤其是其出色的并行處理能力。
軟件優(yōu)化問題的出現(xiàn),與PC處理器從單核過渡到多核的"突然性"不無關系。同早就導入對稱多處理器技術、在軟件上也偏重多線程化的服務器相比,而以往的PC,不論是家用產品還是商用產品,多是基于單顆處理器,其多數軟件也一直缺乏對多核處理器并行處理能力的支持,雖然在基于多核處理器的平臺上,它們的運行性能也能獲得一定的提升,但它們還沒有做到真正的物盡其用。
要讓更多的PC軟件針對全新的多核處理器平臺進行優(yōu)化,就需要它們的編程方式從傳統(tǒng)的串行編程革新為并行編程,不過,如果沒有合適的工具提供輔助,并行編程的難度和成本較高、開發(fā)效率也較低,這將使許多軟件開發(fā)商不太愿意為針對多核處理器重新編譯自己已經在市場上獲得成功的軟件,而這種多核PC應用軟件的缺失對于多核處理器及相應PC產品的推廣必然會有不利影響。
面對多核PC軟件優(yōu)化中存在的這些問題,英特爾的準備較為充分,它旗下的軟件與解決方案事業(yè)部在最近兩年陸續(xù)推出用于多核軟件開發(fā)和優(yōu)化的各種工具,包括相應的分析器、編譯器和檢查器,它們可以幫助軟件開發(fā)商快速、低成本地實現(xiàn)其產品對于多核處理器的優(yōu)化和支持,讓多核處理器的性能優(yōu)勢能夠真正落到實地。
據了解,英特爾推出的這些多核軟件開發(fā)和調優(yōu)工具,已經獲得了眾多軟件開發(fā)商的青睞,就國內來說,許多商用及商用PC軟件商都利用它們對自己的產品進行了優(yōu)化。例如廣州圓方計算機軟件工程有限公司開發(fā)的個人家居室內設計軟件通過優(yōu)化,可以在基于酷睿2的PC上獲得相當于奔騰4系統(tǒng)3.18倍的運行速度,東軟的醫(yī)療影像系統(tǒng)利用英特爾相應工具優(yōu)化后也能在基于英特爾酷睿2的PC的獲得1.5倍的性能提升,而金山的3D網絡游戲引擎在進行同樣的優(yōu)化后,不但運行速度在酷睿2 PC有了1.5倍的增長,其流暢性和交互性也得到了增強。
需要說明的是,由于英特爾的競爭對手還比較欠缺對于多核軟件開發(fā)和調優(yōu)的支持,這實際上也就意味著在多核時代選擇基于英特爾處理器的PC,用戶也就無須為多核應用軟件的缺失而擔憂。
對于廣大消費者來說,要盡享多核PC的快感,僅僅以科學的性能評估方法對其處理器進行選型還是遠遠不夠的。畢竟,處理器早已不是PC性能的瓶頸,I/O和存儲子系統(tǒng)的性能表現(xiàn)才是影響PC整體性能優(yōu)劣的關鍵環(huán)節(jié),而它們也成為了業(yè)內廠商技術攻關的重點。值得一提的是,英特爾在這些領域的技術開發(fā)或推廣上也起到了至關重要的作用–它不但在業(yè)界率先支持最新的內存技術,如過去的DDR2和即將普遍使用的DDR3內存,還領導了新一代PCI-E總線技術和USB等技術的研發(fā)和應用,此外,它與業(yè)內合作伙伴對于固態(tài)硬盤和混合硬盤技術的推動也加快了這兩種高性能存儲設備走入PC的步伐。