需要特別注意的是,這份路線圖展示的服務(wù)器產(chǎn)品規(guī)劃,和桌面上并不完全同步。一般來(lái)說(shuō),Intel的新工藝、新架構(gòu)都是首先用在桌面領(lǐng)域,移動(dòng)領(lǐng)域基本同時(shí)或者稍晚一些,而服務(wù)器領(lǐng)域則要延后很長(zhǎng)一段時(shí)間,而且不同定位的系列產(chǎn)品也有很大差異。

Intel目前已經(jīng)進(jìn)入32nm工藝的鼎盛時(shí)期,服務(wù)器架構(gòu)正在從上代Westmere向新的Sandy Bridge過(guò)渡,接下來(lái)就是22nm新工藝的改進(jìn)版Ivy Bridge,以及未來(lái)的10nm Skymont。下面我們就來(lái)一起梳理一下Intel服務(wù)器架構(gòu)這些年的發(fā)展路線。

Intel 65nm Core

因?yàn)槭袌?chǎng)需求,Intel高性能處理器產(chǎn)品線轉(zhuǎn)移。

65納米到10納米的巨變服務(wù)器架構(gòu)梳理
停產(chǎn)的“扣肉”

早在2008年65nm Core就已經(jīng)陸續(xù)停產(chǎn),在此我們就不做過(guò)多贅述了。

Intel 45nm Penryn

65納米到10納米的巨變服務(wù)器架構(gòu)梳理
Penryn核心

45nm的Penryn雖然同樣標(biāo)示為65W TDP,在同一功耗下Penryn的性能將比65nm的Core更佳,全因Penryn核心頻率將會(huì)由3GHz起跳,雙核心將會(huì)擁有3MB及6MB :2版本,四核心則最高可達(dá)至12MB L2容量,雖然L2增加了,但由于采用上45納米,Wolfdale Die Size只有107平方毫米,相比上代Conroe的143平方毫米減少約25%,令成本進(jìn)一步下降。

65納米到10納米的巨變服務(wù)器架構(gòu)梳理

在電源管理方面,Intel在下一代Penryn微架構(gòu)加入全新的power state,稱為Deep Down Power State。加上新的power state后,Penryn的C-State將增至五個(gè)。C0為正常狀態(tài),C2、C3及C4則為不同的省電模式。新增的Deep Down (C6)與C4模式類近,除關(guān)閉核心頻率、PLL及消除Cache外,在Deep Down模式下,整個(gè)Cache亦將會(huì)被關(guān)閉以達(dá)到更佳的省電效果。與C4相較,據(jù)稱 Deep Down耗電量將可減少達(dá)300%。

在下一代Penryn微架構(gòu)中,Intel亦首次加入全新Intel Dynamic Acceleration(IDA)單線程加速技術(shù)于桌面處理器上,令系統(tǒng)在運(yùn)作單線或串行多線程程序時(shí),可提供自動(dòng)超頻作運(yùn)算,而另一顆則進(jìn)入閑置狀態(tài)。

當(dāng)雙核心處理器運(yùn)作單線或串行行線程程序時(shí),當(dāng)中只有一顆核心是處于運(yùn)算狀態(tài),而另一顆只會(huì)處于閑置(C3或更高的省電模式)時(shí), IDA技術(shù)則可以在系統(tǒng)只需要運(yùn)作一組串行的程序時(shí),把運(yùn)算中的核心的頻率提高,令系統(tǒng)可以提早完成這一組串行程序,而另一顆核心仍然保持閑置狀態(tài)。

雖然其中一顆核心頻率被自動(dòng)超頻,但由于另一顆核心處于省電的C3或更高的閑置狀態(tài),因此處理器的最高功耗指不會(huì)因IDA技術(shù)而被提高,在不用增加成本的情況下,用家可獲得更優(yōu)秀的單線程運(yùn)算效果。

65納米到10納米的巨變服務(wù)器架構(gòu)梳理>>

Intel 45nm Nehalem

Nehalem處理器同樣上一代的 Penryn至強(qiáng)一樣,都是采用了45nm的生產(chǎn)工藝,它屬于第二代的45nm產(chǎn)品,但它卻和上一代產(chǎn)品有著很大的區(qū)別。簡(jiǎn)單說(shuō)來(lái),Nehalem還是基 本建立在Core微架構(gòu)(Core Microarchitecture)的基礎(chǔ)上,外加增添了SMT、3層Cache、TLB和分支預(yù)測(cè)的等級(jí)化、IMC、QPI和支持DDR3等技術(shù)。

65納米到10納米的巨變服務(wù)器架構(gòu)梳理
45nm晶圓

Intelligent Performance 超強(qiáng)的性能

首先,XEON 5500系列集成內(nèi)存控制器(IMC),說(shuō)到這里,我們不得不把時(shí)間拉回到XEON 5300系列的時(shí)代,由于其競(jìng)爭(zhēng)對(duì)手AMD在其K8架構(gòu)時(shí)代,就集成了內(nèi)存控制器,正因?yàn)槿绱?,這大大的提升了AMD處理器的性能,這也成了AMD驕傲的 資本,再來(lái)看看intel,CPU訪問(wèn)內(nèi)存的延遲,大大的影響了XEOn產(chǎn)品的性能,所以在XEON 5400時(shí)代,intel開(kāi)發(fā)了一種高速全緩沖內(nèi)存技術(shù),就是我們通常說(shuō)的Fully-buffer DIMM,他是在內(nèi)存上面加載了一個(gè)處理芯片,來(lái)提高與CPU交換的速度,從實(shí)際情況來(lái)看,這確實(shí)為解決之法,但是,從另外的技術(shù)方面,我都為intel 捏了一把汗,這為治標(biāo)不治本。從各大OEM廠商和使用者的回饋反應(yīng)來(lái)分析:FBD內(nèi)存發(fā)熱量大,為此還穿上了金屬的馬甲,功耗也比REG ECC內(nèi)存高出許多。

65納米到10納米的巨變服務(wù)器架構(gòu)梳理
集成內(nèi)存控制器

其次是超線程技術(shù),超線程技術(shù)是在一顆CPU同時(shí)執(zhí)行多個(gè)程序而共同分享一顆CPU的資源,理論上要像兩顆CPU一樣在同一時(shí)間執(zhí)行兩個(gè)線程,處理器需 要多加入一個(gè)Logical CPU Pointer(邏輯處理單元)。而其余部分如ALU(整數(shù)運(yùn)算單元)、FPU(浮點(diǎn)運(yùn)算單元)、L2 Cache(二級(jí)緩存)則保持不變,這些部分是被分享的。

雖然采用超線程技術(shù)能同時(shí)執(zhí)行兩個(gè)線程,但它并不象兩個(gè)真正的CPU那樣,每各CPU都具有獨(dú)立的資源。當(dāng)兩個(gè)線程都同時(shí)需要某一個(gè)資源時(shí),其中一個(gè)要暫時(shí)停止,并讓出資源,直到這些資源閑置后才能繼續(xù)。因此超線程的性能并不等于兩顆CPU的性能。

65納米到10納米的巨變服務(wù)器架構(gòu)梳理
超線程技術(shù)

需要注意的是,含有超線程技術(shù)的CPU需要芯片組、軟件支持,才能比較理想的發(fā)揮該項(xiàng)技術(shù)的優(yōu)勢(shì)。

再次是XEON的自動(dòng)超頻,Turbo Boost,(也叫渦輪推進(jìn)技術(shù)),很多時(shí)候,CPU在處理數(shù)據(jù)或者在運(yùn)行的時(shí)候,都達(dá)到了100% 的使用率,為了解決這個(gè)問(wèn)題,在新一代的XEOn處理器中,可以自動(dòng)實(shí)現(xiàn)2級(jí)超頻功能,從原來(lái)頻率基礎(chǔ)上,增加2個(gè)133M的頻率。

65納米到10納米的巨變服務(wù)器架構(gòu)梳理
自動(dòng)超頻Turbo Boost

不過(guò),并不是所有的XEON都會(huì)支持這個(gè)功能,例如面對(duì)低端市場(chǎng)的XEON 5502和XEON5504,這兩個(gè)型號(hào)的CPU,也將會(huì)有可能只有2個(gè)核心的版本,共享了4M二級(jí)緩存,也不支持超線程技術(shù),從這方面來(lái)看,intel 把改省的都省下了,呵呵。從中端的XEON E5506,到XEON E5540都支持了Turbo Boost。不同的是高功耗版本的XEON X5550,功耗達(dá)到了95W,它可以在使用2個(gè)核心的情況下,實(shí)現(xiàn)3級(jí)超頻功能,也就是133M×3。例如XEON X5570本來(lái)頻率是2.93G,如果四個(gè)核心同時(shí)使用,那么每個(gè)核心可以自動(dòng)超頻到3.2G;如果只使用了2個(gè)核心,那么這2個(gè)核心可以自動(dòng)超頻到 3.33G運(yùn)行。

65納米到10納米的巨變服務(wù)器架構(gòu)梳理

Automated Energy Efficiency 自動(dòng)化能源控制

在XEON5500以前,通常情況下,一個(gè)企業(yè)使用的服務(wù)器都 是全天24小時(shí)運(yùn)行,功耗基本上都是滿負(fù)荷狀態(tài)運(yùn)行,在我們提倡節(jié)約能源的今天,這是一個(gè)巨大的浪費(fèi)。不過(guò),從這一代開(kāi)始,處理器更加智能,能夠根據(jù)使用 時(shí)的狀態(tài),自動(dòng)調(diào)節(jié)功耗。下面是一個(gè)企業(yè)一天中監(jiān)測(cè)服務(wù)器的功耗情況圖,可以看出在早上7點(diǎn)以前,晚上8點(diǎn)以后,功耗大大降低,為企業(yè)節(jié)省了不少的開(kāi)支。

65納米到10納米的巨變服務(wù)器架構(gòu)梳理
不同時(shí)段服務(wù)器的功耗并不相同

XEON 5400和XEON5500的對(duì)比情況:SPECpower_ssj2008是一個(gè)利用標(biāo)準(zhǔn)Java的JDK計(jì)算整體服務(wù)器性能,根據(jù)其中11個(gè)不同工作 負(fù)載區(qū)域段的功耗得出服務(wù)器的工作負(fù)載/能耗比的測(cè)試方式。是一個(gè)較為客觀的服務(wù)器的能耗標(biāo)準(zhǔn):簡(jiǎn)單說(shuō)來(lái),這一切只與服務(wù)器的節(jié)能設(shè)計(jì)有關(guān),也就是 XEON5500的自動(dòng)能源控制。

65納米到10納米的巨變服務(wù)器架構(gòu)梳理
Nehalem架構(gòu)的至強(qiáng)服務(wù)器明顯在節(jié)能方面有更好的表現(xiàn)

Flexible Virtualization 靈活的虛擬化技術(shù)

除此之外,英特爾還在強(qiáng)化了Flex-Magretion虛擬化技術(shù)。這一技術(shù)雖然在在Penryn里就已經(jīng)實(shí)現(xiàn),但是英特爾在XEON5500里得到 了加強(qiáng)。相較于之前的英特爾VT技術(shù),F(xiàn)lexMigration則更偏向傳統(tǒng)對(duì)虛擬化技術(shù)的定義,這種技術(shù)可以讓虛擬機(jī)上的應(yīng)用在英特爾不同產(chǎn)品線的處 理器上進(jìn)行動(dòng)態(tài)遷移,提高處理器使用率。新一代的XEON5500 平臺(tái)上,包括了chipset芯片,還有network,都對(duì)虛擬化有了良好的支持,這使得整個(gè)服務(wù)器性能有了巨大的提升。>>

Intel 32nm Westmere

Westmere-EP采了 32納米第二代high-k金屬柵技術(shù),先進(jìn)的制程工藝使得Westmere-EP具備更多的處理核心抑或在保持同樣TDP封裝前提下提高處理器的主頻。 鑒于Thermal Police(熱量排放政策)的緣故,處理器的主頻都有所限制,英特爾計(jì)劃為Westmere-EP增加更多的處理核心以及緩存。

65納米到10納米的巨變服務(wù)器架構(gòu)梳理
Westmere-EP芯片結(jié)構(gòu)

具體而言,45納米向32納米的進(jìn)步,使得Westmere-EP能增加兩個(gè)處理核心并且每個(gè)核心的三級(jí)緩存也增長(zhǎng)了50%達(dá)到12MB之多。英特爾架 構(gòu)事業(yè)部資深高級(jí)工程師Nasser Kurd確認(rèn)Westmere-EP將支持Turbo Boost特性(智能加速技術(shù)),即在芯片其他芯片元素靜默狀態(tài)下小幅提高處理器核心的主頻。

總體而言,Westmere-EP的主頻和熱封裝范圍同現(xiàn)有的至強(qiáng)5500一樣,此外在處理器插槽、主板芯片組和DDR3內(nèi)存的支持方面也同至強(qiáng)5500一樣,每個(gè)插槽都有著三個(gè)內(nèi)存通道。

六核Westmere-EP處理器有著11.7億個(gè)晶體管,芯片面積為為240平方毫米。正如上圖所示,六個(gè)處理核心被一分為二,每組三個(gè)核心。處理核 心區(qū)域有著專門的時(shí)鐘頻率和電源供給,三級(jí)緩存和內(nèi)存控制器在優(yōu)化設(shè)計(jì)之后歸為“uncore”(非核心)區(qū)域,有著獨(dú)立的功率門限(power gating)。在Nehalem家族芯片中,英特爾為每個(gè)核心的晶體管引入了功率門限,當(dāng)核心處于閑置狀態(tài)時(shí)就會(huì)被自動(dòng)關(guān)閉。核心狀態(tài)存儲(chǔ)于芯片緩存 中,但是非核心區(qū)域依舊保持全功率運(yùn)行。但是在Westmere家族中,非核心區(qū)域也引入了功率門限,由此可以看出Westmere更加綠色節(jié)能。

Westmere-EP芯片保持了英特爾HyperThreading同步多線程特性,每一個(gè)核心都有著兩個(gè)虛擬線程,此外Westmere還具備新的 加密指令集在加密解密數(shù)據(jù)之時(shí)實(shí)現(xiàn)AES算法。另外一個(gè)新特性在于其嵌入式的內(nèi)存控制器能夠支持低壓的DDR3內(nèi)存,這樣在無(wú)需損失性能的前提下能夠減少 20%的熱量。

Intel 32nm Sandy Bridge

隨著鐘擺的又一次擺動(dòng),時(shí)間跨入了2011年。這將是制程-架構(gòu)的又一次轉(zhuǎn)換,2011年英特爾的Tick-Tock發(fā)展戰(zhàn)略迎來(lái)了Sandy Bridge架構(gòu)年的到來(lái)。桌面以及移動(dòng)版的Sandy Bridge已經(jīng)面世,服務(wù)器領(lǐng)域的至強(qiáng)版本也將在稍后登場(chǎng)。

65納米到10納米的巨變服務(wù)器架構(gòu)梳理
與上一代架構(gòu)各產(chǎn)品線相對(duì)應(yīng)的Sandy bridge家族產(chǎn)品

從產(chǎn)品定位看

與現(xiàn)有至強(qiáng)產(chǎn)品線3000、5000、7000系不同,新一代Sandy Bridge產(chǎn)品線將劃分的更為明確。過(guò)去一路產(chǎn)品線由至強(qiáng)3000系獨(dú)占,而現(xiàn)在將被細(xì)化為面向入門級(jí)一路產(chǎn)品的Sandy Bridge-DT和主流一路/入門級(jí)兩路產(chǎn)品Sandy Bridge-EN構(gòu)成,一部分原屬于過(guò)去雙路至強(qiáng)5500/5600系的市場(chǎng)將被劃歸這條產(chǎn)品線。而與此同時(shí),主流級(jí)兩路產(chǎn)品則被劃歸到Sandry Bridge-EP產(chǎn)品線。在高端四路服務(wù)器市場(chǎng)則被細(xì)分為入門級(jí)四路產(chǎn)品和主流性能級(jí)四路產(chǎn)品,入門級(jí)產(chǎn)品線將由Sandry Bridge-EX占據(jù)。

從產(chǎn)品接口看

   從圖中右側(cè)我們可以看到,QPI總線一定程度上了決定了產(chǎn)品定位不同,既多路的擴(kuò)展性。接口也被劃分為一路產(chǎn)品LGA1156-Socket H2;兩路產(chǎn)品LGA1356-Socket B2;四路產(chǎn)品LGA 2011-Socket R。這與AMD在2010年的G34/C32平臺(tái)有異曲同工之處(皓龍6100支持2路與4路,皓龍4100支持1路與2路),在四路與兩路產(chǎn)品上不在做 明確劃分而是提供統(tǒng)一的芯片組,給用戶以彈性的選擇。按照如此定位的話,今年推出的Sandy Bridge-EX性能將不及我們已知的Westmere-EX。

  到這里,筆者有了一定疑問(wèn),Socket R的市場(chǎng)將面向誰(shuí)?生命周期依然是2年?相比起Westmere-EX提供更好的性價(jià)比?這個(gè)問(wèn)題我們稍后再討論。

65納米到10納米的巨變服務(wù)器架構(gòu)梳理
Sandy Bridge家族 從PC到Server1路、2路、4路產(chǎn)品

從圖中我們可以看出,從PC平臺(tái)到入門級(jí)服務(wù)器工作站平臺(tái),同樣采用了LGA1155接口,雙通道內(nèi)存,內(nèi)置GPU核心等,唯一的區(qū)別在于對(duì)PCI-E通道數(shù)量的支持。LGA1155不支持QPI互聯(lián)架構(gòu)。

而到了入門級(jí)兩路平臺(tái)LGA 1356 接口上Sandy Bridge-EN,提供了24條PCI-E通道,三通道內(nèi)存(DDR3-1600,支持UDIMM和RDIMM,低電壓內(nèi)存,最大38.4GB/S的內(nèi) 存帶寬),更大的L3緩存等,與現(xiàn)有5500/5600至強(qiáng)相同,會(huì)根據(jù)占用內(nèi)存通道數(shù)量不同,進(jìn)行1600、1333、1066的降頻。提供1個(gè)QPI 用來(lái)進(jìn)行擴(kuò)展。

在LGA 2011接口上Sandy Bridge-EP/EX上,提供了40條PCI-E通道,四通道內(nèi)存等,提供2個(gè)QPI用來(lái)進(jìn)行擴(kuò)展。

65納米到10納米的巨變服務(wù)器架構(gòu)梳理
Westmere-EX與Sandy Bridge-EX連接上的區(qū)別

從圖中可以看出,Sandy Bridge的只有兩條QPI與相鄰CPU進(jìn)行連接,而Nehalem/Westmere-EX則有4條QPI與其他CPU全部進(jìn)行直連。每?jī)深wCPU共 享一個(gè)南橋與PCI通道進(jìn)行通信。使得系統(tǒng)內(nèi)的CPU通信效勞更高,而Sandy Bridge如果要訪問(wèn)非相鄰的CPU數(shù)據(jù)則要多一個(gè)CPU通信環(huán)節(jié),一定程度上會(huì)降低效率。

Intel 22nm IvyBridge

雖然IvyBridge是SandyBridge的22nm工藝升級(jí)版,但I(xiàn)vyBridge并非僅僅是將工藝制程升級(jí)為22nm,同時(shí)它還帶來(lái)了諸多 新的特性,如原生支持USB3.0、支持ConfigurableTDP技術(shù)、同時(shí)還具有更強(qiáng)性能的顯示單元。配套主板方面,IvyBridge處理器將 搭配新一代PantherPoint7系列主板,但使用6系列主板可以通過(guò)更新BIOS的方式提供對(duì)IvyBridge的支持,為用戶升級(jí)提供了方便。

65納米到10納米的巨變服務(wù)器架構(gòu)梳理

IvyBridge

65納米到10納米的巨變服務(wù)器架構(gòu)梳理

IvyBridge除了將工藝制程升級(jí)為22nm為,其內(nèi)部還采用了先進(jìn)的Tri-Gate3D制造工藝,這也是自硅晶體管問(wèn)世50多年來(lái),3D結(jié)構(gòu)晶體管史無(wú)前例的被投入批量生產(chǎn)。

65納米到10納米的巨變服務(wù)器架構(gòu)梳理

與之前的32nm2D晶體管相比,22nm3D三柵極晶體管,可以在大量增加晶體管的同時(shí)有效得控制芯片的體積,同時(shí)在低電壓下可將性能提高37%。受 限于物理結(jié)構(gòu),傳統(tǒng)的2D型晶體管已經(jīng)嚴(yán)重的制約了摩爾定律的進(jìn)步與發(fā)展,而3D三柵極晶體管的出現(xiàn)無(wú)疑又為摩爾定律開(kāi)啟了一個(gè)新的時(shí)代。

新一代HDGraphics圖形核心

IvyBridge采用了Intel新一代的HDGraphics圖形核心,EU執(zhí)行單元的數(shù)量較SandyBridge翻一番,達(dá)到最多24個(gè),同時(shí)可支持DirectX11.0。

65納米到10納米的巨變服務(wù)器架構(gòu)梳理

同時(shí),IvyBridge還加入了FlexibleDisplayInterface技術(shù),此技術(shù)可以支持用兩屏或者三屏輸出顯示。

原生支持USB3.0

IvyBridge處理器將搭配新一代PantherPoint7系列芯片組主板,該芯片組將加入XHCIUSB3.0控制器,可提供最多4個(gè)USB3.0接口。至此主板廠商無(wú)需再用第三方芯片。

65納米到10納米的巨變服務(wù)器架構(gòu)梳理

同時(shí),7系列芯片組中還集成了兩個(gè)EHCIUSB2.0控制器,可提供總共14個(gè)USB2.0接口的支持。

ConfigurableTDP技術(shù)

IvyBridge處理器還支持一項(xiàng)名為“ConfigurableTDP”的技術(shù)。我們知道,IntelTurboBoost技術(shù)可以根據(jù)系統(tǒng)負(fù)載情況,對(duì)處理器進(jìn)行超頻,然而超頻的幅度始終不會(huì)超過(guò)TDP功耗的限制。

65納米到10納米的巨變服務(wù)器架構(gòu)梳理

而ConfigurableTDP技術(shù)可在高負(fù)載時(shí),更高幅度的超頻處理器,不會(huì)去考慮TDP功耗限制,但是如果溫度超過(guò)了界限,處理器又將降回安全的頻率。

Intel 22nm Haswell及未來(lái)

然后呢,22nm工藝上的新架構(gòu)叫做“Haswell”,2014年上半年進(jìn)入服務(wù)器領(lǐng)域(桌面2013年);次年制造工藝進(jìn)化為14nm,新產(chǎn)品家族代號(hào)“Rockwell”。

繼續(xù)往后是又一個(gè)新的架構(gòu)“Skylake”,還是14nm工藝,預(yù)計(jì)2016年下半年在服務(wù)器領(lǐng)域?qū)崿F(xiàn)(桌面應(yīng)該是2015年)。

等到了2017年底至2018年初,Intel將在服務(wù)器上為我們帶來(lái)10nm工藝,對(duì)應(yīng)產(chǎn)品代號(hào)“Skymont”,至于桌面上可能會(huì)在2017年上半年就迎來(lái)這個(gè)10nmSkymont。那時(shí)候PCI-E4.0總線、100Gb網(wǎng)絡(luò)之類的技術(shù)應(yīng)該也普及了。

如果繼續(xù)按照這樣的速度發(fā)展下去,Intel會(huì)在大約2019年把半導(dǎo)體工藝帶入到單位數(shù)字時(shí)代。

分享到

zhabin

相關(guān)推薦