英特爾中國晶圓廠的與眾不同
?2019年11月下旬,DOIT記者有幸去到了傳說中的英特爾大連工廠。據(jù)了解,英特爾大連工廠有1.5萬平方米的潔凈空間,參觀區(qū)潔凈空間里的人并不多,遠遠看過去,只有三三兩兩全副武裝的工作人員在其中走動,遠處還擺放著一些機器(可能就有光刻機),頭頂上方一臺臺忙碌的小機器人拿著晶圓正在天花板上快速穿梭,這里消耗的晶圓大都變成了SSD NAND顆粒。
英特爾非易失性存儲方案事業(yè)部副總裁、英特爾大連存儲技術(shù)與制造基地總經(jīng)理梁志權(quán)曾在很多不同地區(qū)和晶圓廠工作過,從梁志權(quán)的介紹中,能感覺到中國的這個晶圓廠還是很了不起的,尤其在執(zhí)行力和辦事效率上最令人印象深刻。
英特爾大連工廠于2007年開始建設(shè),2010年開始生產(chǎn)晶圓,2012年就得到了英特爾內(nèi)部最高的團體獎項——英特爾質(zhì)量金獎,表彰其在質(zhì)量控制上的表現(xiàn),這點與英特爾大連工廠在紀律性上的卓越表現(xiàn)有很大關(guān)系。
此前,當(dāng)大連工廠開始投產(chǎn)的時候,英特爾派了很多人去美國亞利桑那州的工廠學(xué)習(xí),學(xué)成歸來后,生產(chǎn)同樣產(chǎn)品的大連工廠各種質(zhì)量參數(shù)都比美國亞利桑那州的工廠還要好。為了搞清楚為什么“徒弟”比“師傅”做的還好,美國亞利桑那州工廠又反過來派人到大連工廠學(xué)習(xí)。
類似的事情不止于此,美國亞利桑那州工廠的人發(fā)現(xiàn),英特爾大連工廠的員工會更重視按照要求來操作生產(chǎn)流程,紀律性非常高。
不僅質(zhì)量管理水平高,英特爾大連工廠建廠的速度,擴大產(chǎn)能的操作也很快。在2015年開始生產(chǎn)3D NAND顆粒,2017年市場上3D NAND出現(xiàn)供不應(yīng)求的局面后,工廠很快就新建了Fab68A晶圓廠。
作為一個現(xiàn)代化的晶圓廠,大連工廠內(nèi)部自動化生產(chǎn)程度非常高。此前,英特爾與美光合作緊密,工廠里用的是美光研發(fā)的自動化生產(chǎn)管理軟件,硬件部分是英特爾的,聯(lián)合開發(fā)的3D Xpoint推出后不久,兩家宣布分手。
然而使用由美光研發(fā)的軟件便意味著英特爾的生產(chǎn)線隨時可以被控制,基于此,在英特爾員工的合力研發(fā)下,原本可能需要兩三年時間來切換的系統(tǒng),英特爾大連工廠最終只用了兩三個月。當(dāng)所有人以為生產(chǎn)線要停滯兩三周時,英特爾大連工廠最終做到了零關(guān)閉。
對于資金投入巨大的晶圓廠產(chǎn)線來說,質(zhì)量水平和生產(chǎn)時間都異常重要,每強化一點帶來的收益是非常巨大的,而英特爾大連工廠在執(zhí)行力和紀律性上非常有優(yōu)勢,這也是英特爾大連工廠的獨特之處。
英特爾存儲發(fā)展戰(zhàn)略與落地布局
英特爾大連工廠的發(fā)展節(jié)奏始終與英特爾存儲的發(fā)展步伐保持一致,英特爾中國區(qū)非易失性存儲事業(yè)部總經(jīng)理劉鋼七年來一直從事相關(guān)工作,從劉鋼的介紹中了解到,自2012年到2019年,英特爾非易失性存儲業(yè)務(wù)營收增長了10倍。不過,英特爾存儲產(chǎn)品中除了NAND SSD方案,還有傲騰(Optane)。
從劉鋼的介紹中了解到,英特爾之所以在SSD領(lǐng)域投入大量人力、物力,主要是由于磁盤響應(yīng)CPU的速度過慢,因而需要SSD在部分場景中取代磁盤。然而,由于市場上的DRAM內(nèi)存都是2D平面架構(gòu)(業(yè)內(nèi)其實有對于3D DRAM探索),不支持堆疊,提升系統(tǒng)性能所需的內(nèi)存容量增長速度也較慢,容量提升速度遠不如NAND。
雖然NAND技術(shù)由來已久,但直到近年來才開始加速發(fā)展。一方面,從SLC、MLC、TLC到QLC的發(fā)展提升了NAND芯片的容量。另一方面,3D NAND的堆疊技術(shù)也在提升容量。在NAND技術(shù)演進的道路上,英特爾走在了行業(yè)的前列,2018年就率先發(fā)布了QLC SSD,最近又發(fā)布了采用96層QLC NAND的SSD——665p。
從劉鋼的介紹中了解到,3D NAND的堆疊技術(shù)方案有兩大派系,一種是浮柵技術(shù)(Floating gate),另外一種是電荷擷取(Charge Trap)技術(shù)。
如上圖所見,浮柵技術(shù)的上下單元之間是分離的,而電荷擷取技術(shù)上下層之間是連通的,當(dāng)兩者都是幾十層水平時,差異不大,當(dāng)變?yōu)閹装賹又?,采用電荷擷取技術(shù)的NAND上下電荷之間會發(fā)生串?dāng)_,隨著時間的推移,電子會流失,會造成數(shù)據(jù)不可靠。而浮柵技術(shù)雖然工藝更復(fù)雜一些,但是在數(shù)據(jù)保留方面更可靠一點。
浮柵技術(shù)方案在數(shù)據(jù)可靠性方面的優(yōu)勢
因此,在NAND層數(shù)越來越高的時候,浮柵技術(shù)更有優(yōu)勢,英特爾采取的是浮柵技術(shù)方案,也就是說可以把3D NAND做到更高層,實現(xiàn)更高的存儲密度。
同樣支持堆疊技術(shù)的還有3D Xpoint(傲騰的介質(zhì))。劉鋼透露道,下一代3D Xpoint就有堆疊技術(shù)上的創(chuàng)新,第一代的3D Xpoint是2個Deck,而下一代的3D Xpoint會變成4個Deck,簡單看就是容量翻倍。如果把3D Xpoint做成傲騰持久內(nèi)存的話,理論上說,單臺服務(wù)器的內(nèi)存極限將進一步提升。
從SLC到QLC,延遲不斷加劇
從SLC到QLC,吞吐帶寬不斷下降
然而,英特爾意識到只靠NAND增長容量是無法滿足需求的,從SLC到QLC使用壽命越來越不理想,而且?guī)捲絹碓降?,訪問延遲越來越高,跟DRAM的差距越拉越大,于是英特爾選擇用NAND和傲騰兩種方案并行的方式,一邊持續(xù)演進NAND,一邊用傲騰填補內(nèi)存和NAND SSD在性能和容量上的鴻溝。
劉鋼還分享了數(shù)據(jù)緩存分層的90/10原則,即在一個存儲層中,90%的時間都在訪問其中10%的數(shù)據(jù),然而實際應(yīng)用中,需要將常用的10%的數(shù)據(jù)放在性能更高的介質(zhì)上,這就是存儲分層之間的大致關(guān)系。3D Xpoint(傲騰的介質(zhì))的出現(xiàn)填補了DRAM和NAND之間的鴻溝,讓數(shù)據(jù)從計算層到存儲層的流動更為順暢。
多種多樣的傲騰落地方案
傲騰能夠在多樣化應(yīng)用場景中使用。在實踐中,傲騰的應(yīng)用類型可以分為兩類,一種是當(dāng)作內(nèi)存用,雖然性能略遜于DRAM,但價格比DRAM便宜,可部分替代內(nèi)存;一種是用作SSD,延遲比NAND SSD低,但耐久性比NAND SSD要高很多。
在實際應(yīng)用中,傲騰技術(shù)首先在互聯(lián)網(wǎng)公司落地,其中:
百度把英特爾傲騰固態(tài)盤+英特爾QLC SSD的方案用在了其智能云平臺上,打造了高性能的全閃解決方案,不僅IOPS更高、更穩(wěn)定,為AI、高性能計算提供統(tǒng)一接口的對象存儲服務(wù),而且TCO還降低了60%。
騰訊云用了傲騰數(shù)據(jù)中心持久內(nèi)存來打造Redis內(nèi)存資源池,提升了單臺設(shè)備的內(nèi)存容量,讓騰訊云在同等成本下獲得了更高的Redis數(shù)據(jù)庫服務(wù)能力。
阿里則把Polar DB的Journal放在傲騰SSD上,將Polar DB數(shù)據(jù)庫性能表現(xiàn)提升了幾倍,延遲更低,吞吐帶寬更高,整體高QoS表現(xiàn)令人眼前一亮。
快手使用傲騰持久內(nèi)存來支撐其推薦系統(tǒng)和Redis內(nèi)存數(shù)據(jù)庫方案,在對應(yīng)用進行優(yōu)化調(diào)整后,整體方案的性能與原有純DRAM方案相差無幾,但TCO降低了大約30%。
隨著應(yīng)用的深入,一些應(yīng)用還挖掘到了傲騰持久內(nèi)存的非易失性,使得一些大型應(yīng)用的故障恢復(fù)時間從原來幾個小時變成幾分鐘。這一特性在快手等用戶的大型系統(tǒng)方案中均有體現(xiàn)。
在一些大型公有云數(shù)據(jù)中心里,傲騰持久內(nèi)存被用作云主機(虛擬機)的內(nèi)存,將DRAM用作傲騰持久內(nèi)存的緩存層,云主機服務(wù)的成本進一步降低,這已成為部分云廠商在競爭中碾壓對手的一個有力手段。
除了互聯(lián)網(wǎng)數(shù)據(jù)中心外,傲騰在越來越多的行業(yè)得到了應(yīng)用。
諸如,中國電信四川ABM系統(tǒng)中使用傲騰固態(tài)盤來滿足REDO系統(tǒng)所需要的高并發(fā)、大數(shù)據(jù)量、響應(yīng)速度等較高要求。
在海鑫科金掌紋識別系統(tǒng)中,傲騰持久內(nèi)存部分替代了內(nèi)存存儲池存儲比對樣本,用更有成本優(yōu)勢的傲騰持久內(nèi)存方案,打造了性能不遜于原有DRAM方案的內(nèi)存池。
英特爾雙端口NVMe SSD——DC 4800X有雙控高可用設(shè)計,被視為打造高可用企業(yè)存儲方案的有力武器,不僅在全球范圍內(nèi)有諸如戴爾易安信PowerMax的使用,在中國,浪潮也于近期攜手英特爾在其中端存儲AS5000G5中進行應(yīng)用。雙端口固態(tài)盤的推出將會讓傲騰在企業(yè)級存儲市場發(fā)揮更大價值。
傲騰的應(yīng)用案例還有很多,目前用戶對傲騰的應(yīng)用水平大致分為兩個階段,初級階段是單純的替換硬件,比如傲騰持久內(nèi)存的Memory Mode就是單純的將傲騰持久內(nèi)存當(dāng)內(nèi)存來用,高級階段的應(yīng)用比如傲騰持久內(nèi)存的App Direct Mode則需要對應(yīng)用做一些修改。
比如青云在NeonSAN分布式存儲方案中使用了傲騰SSD,其中的iCAS緩存加速軟件,能夠自動識別冷熱數(shù)據(jù)后進行分層,而這個軟件就是英特爾免費提供的。同時,英特爾還開放了Open CAS架構(gòu),用戶可以基于Open CAS架構(gòu)做優(yōu)化。
對普通用戶來說,英特爾傲騰方案相對依然有一定的技術(shù)門檻,如果想要充分發(fā)揮傲騰的優(yōu)勢,還需要在硬件和軟件上做許多優(yōu)化,而對于想輕松應(yīng)用傲騰方案的用戶來說,最直接的辦法就是選擇軟硬一體的OEM解決方案。
目前來看,浪潮便可以提供傲騰OEM解決方案,比較典型就有軟硬一體的Ceph分布式存儲方案,從浪潮公布的數(shù)據(jù)可見,浪潮提供的傲騰固態(tài)盤優(yōu)化Ceph方案在同等TCO的情況下,Ceph集群容量,性能有大幅提升。
結(jié)語
在2019年,英特爾傲騰在更多場景下普及和落地,為大型互聯(lián)網(wǎng)數(shù)據(jù)中心、企業(yè)用戶等帶來較高的業(yè)務(wù)價值,也讓越來越多的用戶也了解到傲騰的應(yīng)用價值。
英特爾以傲騰和3D NAND為主的存儲架構(gòu)革新非常具有創(chuàng)新性,其中,傲騰還非常具有顛覆性。目前來看,在2019年市場上與傲騰定位類似的方案出現(xiàn)了好幾個,這也從一個側(cè)面證實了傲騰的遠見性。
從諸多應(yīng)用案例中能看到,傲騰的許多經(jīng)典案例應(yīng)用場景都出現(xiàn)在中國,這也意味著中國企業(yè)的創(chuàng)新熱情給傲騰留下了廣闊的發(fā)展空間。而創(chuàng)新與顛覆并非一朝一夕的事情,英特爾正在為下一代傲騰做準備。2020年,英特爾會發(fā)布下一代傲騰,隨著其普及步伐的進一步加速,我們有理由相信傲騰的差異化的價值將進一步發(fā)揚光大。