這次采用Cascade Lake架構(gòu)的第二代可擴(kuò)展處理器采用的還是14nm制程,早在此前,AMD的 7nm就炒的沸沸揚(yáng)揚(yáng),2019年年初,英特爾表示數(shù)據(jù)中心事業(yè)部預(yù)計(jì)每 4-5 個(gè)季度推出一款全新英特爾至強(qiáng)產(chǎn)品,并計(jì)劃在 2020 年上半年出貨基于 10 納米技術(shù)的“Ice Lake”CPU(客戶端的10nm Ice Lake會(huì)在今年6月份出貨)。
此外,英特爾 7 納米制程也已列入日程,首款7納米產(chǎn)品將是基于英特爾 Xe 架構(gòu)的 GP-GPU,主要面向數(shù)據(jù)中心人工智能 (AI) 和高性能計(jì)算 (HPC)市場(chǎng),預(yù)計(jì)于 2021 年推出。
雖然,英特爾的14nm之后還有14nm+以及14nm++,但面對(duì)AMD的7nm,英特爾公布了制程roadmap,這是真的慌了嗎?
其實(shí),制程不是全部,規(guī)格再高也怕針對(duì)場(chǎng)景優(yōu)化后的方案,不要小看優(yōu)化的意義。這里主要談的是處理器,但也不妨拿游戲界的AMD顯卡和NVIDIA顯卡舉個(gè)例子,經(jīng)常性地,A卡哪怕各種參數(shù)都優(yōu)于N卡,但實(shí)際游戲體驗(yàn)還是N卡好,這就是規(guī)格配置以外的優(yōu)化帶來(lái)的差異。
對(duì)于英特爾來(lái)說(shuō),在10nm,以及7nm出來(lái)之前的這段時(shí)間,英特爾如何繞開(kāi)制程上的暫時(shí)不足,在制程以外的部分發(fā)揮自己的優(yōu)勢(shì)所長(zhǎng),針對(duì)場(chǎng)景做優(yōu)化呢?且看下文對(duì)于英特爾計(jì)算產(chǎn)品線的一點(diǎn)介紹。
產(chǎn)品線概覽,面向場(chǎng)景優(yōu)化的英特爾至強(qiáng)第二代可擴(kuò)展處理器
第二代至強(qiáng)可擴(kuò)展處理器,在型號(hào)命名上延續(xù)了第一代的命名規(guī)則,用四位數(shù)字來(lái)代表它的型號(hào),再加上字母后綴代表可選的型號(hào)。數(shù)字當(dāng)中“2”代表的是第二代處理器,比如8180是第一代,8280是第二代,而第一位數(shù)字代表了功能和性能的分級(jí),數(shù)字越大等級(jí)越高,命名上從低到高分別為銅、銀、金、鉑金,對(duì)應(yīng)5、6系列和8、9系列。
銅牌3200系列是入門級(jí)的產(chǎn)品,提供最基本的功能,當(dāng)然包括一些這一代特有的功能,比如安全的硬件防范特性以及加速功能,這些功能在銅牌級(jí)產(chǎn)品當(dāng)中都是有的,它提供最基本的性能,可以供入門級(jí)的應(yīng)用來(lái)使用。
銀牌4200系列除了具有3200系列的基本功能之外,還增加了睿頻以及超線程技術(shù),在核心數(shù)和能耗管理上也做了很多優(yōu)化,總之,4200可以提供非常好的性價(jià)比。
金牌5200系列相對(duì)4200又增加了更多新的功能,包括對(duì)英特爾傲騰數(shù)據(jù)中心級(jí)持久化內(nèi)存的支持,以及對(duì)4路服務(wù)器的支持。
6200也是金牌系列,6200相對(duì)5200更進(jìn)一步實(shí)現(xiàn)處理器之間的互連,提供比5200更高的帶寬和端口速度,也可以支持更加先進(jìn)的可靠性、可用性、可維護(hù)性。
8200開(kāi)始進(jìn)入鉑金系列,這一代進(jìn)一步實(shí)現(xiàn)4路以上的連接,直接用CPU就可以搭建一個(gè)多達(dá)8路的服務(wù)器平臺(tái)。
鉑金9200系列是旗艦王牌了,單顆芯片擁有高達(dá)到56個(gè)物理內(nèi)核,12條內(nèi)存通道,相當(dāng)于兩塊8200的處理器。在技術(shù)上就是把兩個(gè)CPU通過(guò)最新封裝技術(shù)封裝在一個(gè)芯片上,核數(shù)、內(nèi)存通道數(shù)x2。膠水核的說(shuō)法很多人都聽(tīng)說(shuō)過(guò),但是把8200系列這樣的核封裝在一起,對(duì)于封裝技術(shù)的要求還是挺高的,需要考慮空間需求、散熱需求、可靠性需求、制造需求等多方面。
9200的應(yīng)用場(chǎng)景包括高性能計(jì)算、數(shù)據(jù)分析和人工智能以及高密度的基礎(chǔ)設(shè)施,計(jì)算密度新高度。
第一代至強(qiáng)可擴(kuò)展處理器就優(yōu)化了人工智能深度學(xué)習(xí)的訓(xùn)練(training)和推理(Inference)能力。第二代至強(qiáng)可擴(kuò)展處理器里加入了深度學(xué)習(xí)加速技術(shù)(DeepLearning Boost),在英特爾AVX-512指令集中擴(kuò)展了新的VNNI矢量神經(jīng)網(wǎng)絡(luò)指令,強(qiáng)化了深度學(xué)習(xí)的推理能力,它的意義在于,比如過(guò)去卷積神經(jīng)需要三條指令,而現(xiàn)在的話就需要一條指令就可以了,加速技術(shù)在處理圖像識(shí)別,語(yǔ)音識(shí)別以及對(duì)象檢測(cè)等場(chǎng)景下會(huì)有明顯加速效果。
從技術(shù)角度來(lái)看,大多數(shù)情況下GPU更適合訓(xùn)練階段,英特爾強(qiáng)化的推理能力更適用于人工智能的應(yīng)用側(cè),CPU的推理能力能更多地出現(xiàn)在城市交通、安全管理、零售或者是金融業(yè)的應(yīng)用場(chǎng)景中。
硬件指令層的優(yōu)化以外,為了幫助用戶基于這一平臺(tái)做開(kāi)發(fā),英特爾與業(yè)界合作伙伴對(duì)這些功能所需要的計(jì)算框架、軟件都做了優(yōu)化,使得用戶可以很方便的使用這些工具包來(lái)開(kāi)發(fā)應(yīng)用。
很多人提到人工智能其實(shí)首先想到的都是GPU以及一些加速器,其實(shí)英特爾處理器在人工智能方面的優(yōu)化進(jìn)步也很明顯。
以常見(jiàn)的Caffe Resnet-50模型為例來(lái)看性能變化,如果把2017年7月份之前處理器性能表現(xiàn)看成基礎(chǔ)1,第一代至強(qiáng)可擴(kuò)展處理器8100系列相比前者提升了5.7倍,第二代至強(qiáng)可擴(kuò)展處理器8200系列已經(jīng)可以提高到14倍,如果要算上9200的話,則提升了30倍。英特爾在人工智能場(chǎng)景方面的優(yōu)化就是為了證明CPU也可以很好的支持人工智能。
產(chǎn)品家族中帶N字母的型號(hào)是針對(duì)NFV做優(yōu)化的。
2011年開(kāi)始出現(xiàn)NFV的概念,網(wǎng)絡(luò)功能可以通過(guò)虛擬化跑在CPU這樣的通用計(jì)算平臺(tái)上,這種想法很快過(guò)了概念驗(yàn)證階段并進(jìn)入商業(yè)落地階段,英特爾也捕捉到了這一轉(zhuǎn)型下的需求,在第二代至強(qiáng)可擴(kuò)展處理器產(chǎn)品家族中,專門推出了針對(duì)NFV業(yè)務(wù)特點(diǎn)的型號(hào),產(chǎn)品型號(hào)中帶字母N的就代表對(duì)NFV做了優(yōu)化,英特爾方面表示使用NFV優(yōu)化的處理器搭建平臺(tái)可以提供更高的VM/VNF容量和密度,也就意味著同樣的設(shè)備上處理更多的用戶容量和服務(wù)。
產(chǎn)品家族中,帶字母Y的型號(hào)都支持Speed Select技術(shù)。
Speed Select技術(shù)是一種對(duì)芯片內(nèi)部能耗進(jìn)行控制的技術(shù),該技術(shù)能對(duì)一個(gè)封裝里的不同內(nèi)核進(jìn)行優(yōu)化,一部分主頻更高一部分運(yùn)行的狀態(tài)較低,還可以關(guān)閉部分核心把一部分核運(yùn)行在高頻狀態(tài)下,該技術(shù)可以讓用戶靈活做配置。這樣的處理器其實(shí)可以算多合一的處理器,一個(gè)型號(hào)可以設(shè)多個(gè)不同頻率,當(dāng)業(yè)務(wù)需求變化時(shí)候,用戶可以不用更換CPU就可以調(diào)整配置。
帶字母V產(chǎn)品系列的處理器表示對(duì)虛擬化環(huán)境做了優(yōu)化,支持創(chuàng)建更多虛擬機(jī),提高單個(gè)物理機(jī)上虛擬機(jī)的密度值。
帶字母S的系列針對(duì)的場(chǎng)景更為細(xì)致,是對(duì)搜索算法和業(yè)務(wù)特點(diǎn)做了優(yōu)化,提供了搜索優(yōu)化,與普通型號(hào)相比,該型號(hào)有更高的主頻,使得搜索性能更高。
帶字母T的型號(hào)對(duì)于邊緣場(chǎng)景做了優(yōu)化,這種場(chǎng)景下的設(shè)備通常需要在惡劣的環(huán)境下運(yùn)行,比如說(shuō)要承受更高的溫度,比如需要更高的可靠性來(lái)運(yùn)行更長(zhǎng)時(shí)間。
除了至強(qiáng)可擴(kuò)展處理器之外,最新發(fā)布的還有最高八核的D-1600處理器,它是D-1500的后繼者,它不僅是處理器,也集成了芯片組、外設(shè)網(wǎng)絡(luò)、加速功能,與上代相比在計(jì)算能力,網(wǎng)絡(luò)包專發(fā)能力均有所增強(qiáng),是一款轉(zhuǎn)為網(wǎng)絡(luò)邊緣解決方案設(shè)計(jì)的高密度、高集成度的SoC。
與處理器家族一起發(fā)布的還有一款FPGA產(chǎn)品——Agilex FPGA,英特爾的這款FPGA跟此前的很多FPGA有許多不同,首先FPGA內(nèi)核是基于10納米制程,Agilex FPGA同時(shí)支持英特爾最新的黑科技——Compute Express link緩存一致性加速,當(dāng)FPGA加速器和CPU連接之后,能與CPU處于同一個(gè)內(nèi)存空間當(dāng)中,CPU可以訪問(wèn)FPGA的內(nèi)存,反之亦然,再也不用像以前一樣走PCIe了,這是一種新的異構(gòu)計(jì)算形式。
另外,Agilex FPGA還采用了英特爾最新的3D封裝,一個(gè)封裝里除了有FPGA內(nèi)核之外,還可以有收發(fā)器、內(nèi)存等,這些零部件可以在二維平面上布置,也可以在3D平面上堆疊,所有這些采用不同工藝的硅片可以根據(jù)需要靈活集成在一起。
英特爾還在Agilex FPGA中加入了eASIC,所謂eASIC是介于傳統(tǒng)的FPGA和ASIC之間的一種技術(shù),與FPGA相比,它的硅片面積和功耗可以大幅度減小,而開(kāi)發(fā)人員面對(duì)的那套東西還跟傳統(tǒng)的FPGA一樣,還是用英特爾的Quartus Prime的工具套件。
以上是2019年上半年,英特爾在計(jì)算領(lǐng)域的主要產(chǎn)品方案。
結(jié)語(yǔ)
雖說(shuō)規(guī)格配置很重要,但面對(duì)場(chǎng)景的優(yōu)化也非常重要,7nm確實(shí)有很大優(yōu)勢(shì),讓AMD有了很大的施展空間,但AMD確實(shí)還需要投入非常大的精力才能發(fā)揮這一優(yōu)勢(shì)。AMD的7nm數(shù)據(jù)中心處理器承擔(dān)著AMD重回?cái)?shù)據(jù)中心市場(chǎng)的重任,不過(guò),面對(duì)深耕數(shù)據(jù)中心市場(chǎng)多年,一手打造x86生態(tài),并拿出6大技術(shù)戰(zhàn)略支柱的英特爾,AMD要做的事情還是挺多的。