首先是美洲虎、山貓的對比,進步可以說是全方位的,幾乎每一項指標都有了大幅度甚至經(jīng)常是翻番的提升。

– 生產(chǎn)工藝:從40nm升級為28nm,均來自臺積電(GlobalFoundries再踩你一腳)

– 單個內(nèi)核面積:從4.9平方毫米減小到3.1平方毫米

– 最大核心數(shù)量:x86-64,從2個翻番至4個

– 緩存:基本保持不變,還是一級雙路32KB指令、八路32KB數(shù)據(jù),二級每核心十六路512KB,當然二級緩存總量會從1MB翻番至2MB

– 核心平面布局:從159900個增至194490個。這個你只要簡單地理解為核心電路設計規(guī)模增大了20%以上就差不多了

– 發(fā)射寬度:雙寬度不變

– 物理尋址:36-bit增至40-bit

– 載入/存儲帶寬:每時鐘周期8Byte翻番至16Byte

– 浮點單元數(shù)據(jù)路徑:64-bit翻番至128-bit

– 調(diào)度器查詢:增大25-50%

再來看美洲虎架構(gòu)上的一些主要特性:

– ISA指令集架構(gòu)增強:這個是重中之重,包括SSE4.1/4.2、AVX、AES、F16C、BMI1等等相當豐富,比高性能核心并不遜色多少,這也是Atom所無法比擬的

– 4×32B指令緩存循環(huán)緩存,改進功耗

– 改進指令緩存預取器,提升IPC,估計可比山貓?zhí)岣?5%以上

– 增加硬件整數(shù)除法器

– 二級緩存預取器

– 改進C6、CC6電源狀態(tài)開關延遲

– 典型應用中,時鐘柵極可占整個平面布局的92%以上

制造技術上,美洲虎使用的是臺積電28nm Bulk HKMG,11個金屬堆棧,比山貓多出1個,但因為工藝先進,間距小了很多,所以核心面積才縮小了三分之一以上。

處理器內(nèi)部模塊分布示意圖(局部):下方是四個CPU核心(不知道雙核心是屏蔽還是原生?),上方是共享的二級緩存。

核心平面布局圖:這是單個核心的各個模塊,都是和真實情況一一對應的,當然是偽色彩。

核心電源柵極:這是降低功耗尤其是低負載、待機功耗的關鍵,也是最高效的方式。它可以徹底關閉暫時無用處的模塊,而不同于簡單的屏蔽。

這個是講如何控制電源柵極的,我們就不管它了。

最后是說電源柵極的電壓控制效果。簡單地說,整個核心都可以從此中獲益。正是新工藝加電源柵極,美洲虎的功耗可以大大降低,也可以在同等功耗水平下大大提升頻率和性能。根據(jù)相關消息,美洲虎架構(gòu)CPU的熱設計功耗從5-25W不等。

分享到

zhaohang

相關推薦