講Flash制造工藝的時候不得不提制程,就是兩個最小的功能單元之間的距離。
從十年前,大概是50納米的水平進入到去年最新的工藝,也是目前主流的工藝15納米。其實它的驅(qū)動力就是成本,成本下降才有可能帶來大規(guī)模的應用。閃存的介質(zhì)在90年代初就有,利用我們現(xiàn)在的話來說,這是屬于在軍方的黑科技。到零幾年的時候,當我們知道閃存可以制作固態(tài)硬盤的時候也沒有多少人可以用得起。20年中,閃存的成本其實是下降5萬倍之多,相對GDP增長來說,它的倍數(shù)依然很高,結果就是閃存的應用成本下降非???,很快就黑科技轉(zhuǎn)變?yōu)橛锌赡苁褂玫臇|西,以及到現(xiàn)在大規(guī)模的進入數(shù)據(jù)中心使用。flash制作工藝上目前是使用2D Nand,Nand使用的工藝最新,第一條線是CPU制作工藝,達到了30納米的水平,第二條是DRAM,目前的工藝處在20納米的水平。商用沒有那么長時間,Nand現(xiàn)在接近10納米的支撐,已經(jīng)接近物理極限。再往下做的話,它的可靠性非??皯n,目前沒有能夠突破。相對制造成本來講,從工藝的升級帶來成本下降,開始會很快。但是在到達20納米的時候,我們稱之為EX納米級別的時候,成本下降變的非常頻繁。
我們常說閃存的基本介質(zhì),SLC、MLC,在容器內(nèi)如何識別定位?如果有和沒有是兩種,我們可以定義為0和1,這樣區(qū)別是比較粗糙的,但是也是比較容易實現(xiàn)的。后來發(fā)現(xiàn)可以更加精準地區(qū)分定位的時候,我們可以把它分成四份,這樣就是MLC,目的是什么?目的是在同樣的介質(zhì)里面,我們能夠存儲更多的數(shù)據(jù),相對SLC來講,MLC能夠存儲的比特就會直接的翻倍。當然它的驅(qū)動力還是成本,目前2D Nand接近10納米遭遇的嚴重挑戰(zhàn),中學有概念是萬有引力,兩個物體有重量距離不近我們認為沒有關系。距離近的時候會產(chǎn)生干涉,我們用于電子的容器,當它們的距離達到10納米的級別,一個容器里面電子的活動就會對另外一個臨界的容器里面的電子產(chǎn)生影響。我對一個單元進行擦洗,不可能不會影響旁邊的數(shù)據(jù),我們稱之為干涉。到這個級別的時候,目前的工藝還沒有辦法能夠很好地突破干涉。
我們想了辦法,我們從原來平面的結構把它豎起來,在晶圓上可以放下更多的疊層。這涉及到成本的問題,因為在3D的Nand上做疊層,3D Nand的情況下使用的晶圓是可以少一些的。如果說純粹地對2D Nand,它的成本不會下降。
目前3D Nand使用的制程是40納米,如果從剛才的圖來看這是屬于10年前的制程技術,盡管在低的制程工藝情況下,它仍然可以做到等效于10納米以下2D Nand的成本。3D Nand出現(xiàn)以后,我們從成本下降平緩的點,又迎來了另外一個拐點,有了3D Nand以后,我們可以讓成本下降的曲線斜率再次增大。2D Nand的容量最大是128G,3D Nand出現(xiàn)了以后我們很快非常輕松地可以達到256G,一年之內(nèi)有預期的應該是可以達到單個芯片512G的容量,就是兩個指甲蓋的面積可以做這么大的容量。
3D Nand是堆疊層,堆的層數(shù)越多,成本可以分攤的厲害,如果說堆十層成本會變成1/10。但是大家都知道,我不可能通過簡單地堆疊就可以獲得成本的線性降低,或者說指數(shù)級的降低。因為最終如果說您的層數(shù)足夠多的話,一定會又遇到工藝的問題。疊層到達一定的程度,這個成本會到達一定的拐點。目前3D Nand我們的樣品在48的疊層,疊層到達100層左右的時候才會出現(xiàn)成本的拐點。因此,目前3D Nand在到達拐點之前還會有非常多的進步空間,有足夠的時間讓我們達到這個平衡點,并且突破這個平衡點。
單位面積上,3D Nand相對2D Nand,可以做到2倍以上的容量增加,這是我們供應商給我們的數(shù)據(jù)。3D Nand大家肯定會想工藝改變了,密度增大了,可靠性如何審視?可靠性有增強的地方。我們使用的工藝制程技術是10年前的40納米的技術,有這樣的距離存在單元與單元之間的干涉就可能不是問題,因為我們現(xiàn)在已經(jīng)能夠處理15納米級別的干涉問題,40納米就不是問題。所以它們之間從這點來講,因為間距的增大,3D Nand的可靠性會有增強。
另外,原來我們鎖住電子或者操作,現(xiàn)在我們使用了Charge Trapping。我們實際得到的結果是橫線的部分,在2D時代是虛線的部分。使用新的機理以后可以更加容易區(qū)分電位的區(qū)別,相鄰的電位之間重疊的部分更小,我們可以更好地區(qū)分。這樣在KLC或者說以后的QLC,區(qū)分8個和16個暗電位,它們的細節(jié)是非常細微的。
3D Nand會遭遇挑戰(zhàn),提到閃存的時候有一個概念數(shù)據(jù)可保持性。充進去多少電子形成電位,電位在我一段時間以后再過來讀,它有沒有變化,是不是還是原來的數(shù)據(jù),這是有可能有變化的。電子在3D Nand上多了一個維度的泄漏方式,在數(shù)據(jù)的可保持性上有一點挑戰(zhàn)。但是控制器會解決這個問題。失效的可能性多了一部分,原來在平面上我們只有一個維度的失效的可能,但是在3D的維度上我們有平面和豎直方向兩個失效的可能。因此,使用3D Nand對控制器的要求更高,但是現(xiàn)在控制器的生產(chǎn)水平其實已經(jīng)考慮到了這一點。比如說我們有更強的ECC的能力,我們可以使用更先進的解碼技術。
除此之外,我們在SSD的制造商,我們在各個芯片之間可以使用RAID,更好地RAID,可靠性更高的RAID解決數(shù)據(jù)一致性的問題,解決部分的產(chǎn)品和部分的元件失效的問題。寫入方式上,我們嘗試不同的編程方式,能夠?qū)@樣大的載體實現(xiàn)更高速度的解讀。
目前數(shù)據(jù)中心跟閃存的關系,數(shù)據(jù)中心偏向于云化,云化最后會產(chǎn)生兩類主流的應用。一類是數(shù)據(jù)庫,一類是虛擬化。這兩種業(yè)務都有著非常強的隨機化的特性,對虛擬化來講我的存儲承載的是所有的虛擬機,每一個虛擬機的業(yè)務不一樣,它的IO模型也是不一樣的。我收到所有虛擬機發(fā)過來的IO請求,這會非常的復雜。底層來看這是完全隨機的IO形式,在機械硬盤時代,其實機械硬盤應該是通過轉(zhuǎn)盤片搖磁臂讀取數(shù)據(jù)的,在應對隨機讀寫的請求下會非常吃力。在閃存的時代不存在這個問題,基本上在閃存時代的話順序和隨機是一樣的效率。閃存可以提供系統(tǒng)在存儲路徑更低的延遲,延遲在目前可能是我們在系統(tǒng)優(yōu)化中最重要的一點。
沒有考慮延遲之前,系統(tǒng)優(yōu)化基本上只有一個方法,通過并行來優(yōu)化。但是并行的優(yōu)化可以找到極限的,這是阿姆達定律。如果解決一個性能,我們使它的性能翻倍,我們想追求等式左邊的S足夠大,我們可以估算出我們做并行優(yōu)化可以達到什么樣的提升。右邊的曲線是幾個取值,右邊的參數(shù)P代表可被優(yōu)化的負載在總負載的百分比,S就是并行的數(shù)量。我們可以看到如果一個系統(tǒng)它可以被優(yōu)化的負載占50%,其實在這個系統(tǒng)的可被優(yōu)化的空間已經(jīng)非常大。如果有50%的負載可以被并行優(yōu)化,哪怕是上到幾千的并行,它優(yōu)化的極限只有2倍,就是最下面的曲線。除非可以被優(yōu)化的負載可以達到95%,可以通過特別高的并發(fā)在最后達到極限20倍的提升。在并行優(yōu)化黔驢技窮的情況下,如何縮短路徑的時間,延遲是系統(tǒng)優(yōu)化的方向,閃存在這方面有得天獨厚的優(yōu)勢。
3D Nand在企業(yè)級的應用中會成為未來的趨勢,我們目前使用48層的疊層,大家可以認為48層是一個拐點,可以和2D的Nand進行PK,疊層高于48層,它的成本一定比2D的低。目前達到成本的拐點,這是在100疊層左右,3D Nand成本優(yōu)化空間非常巨大。3D Nand可以做TLC,可以做出更多的容量?;?D Nand企業(yè)級的SSD,包括寶存在內(nèi)的廠商都在嘗試,明年3D Nand是閃存廠商使用的主要介質(zhì)。TLC和MLC,市場剛剛出現(xiàn)SSD的時候,可能我們所說的單元都是SLC,但是現(xiàn)在沒有人提SLC,因為成本和容量都不能上去。SLC當時大家都認為這是消費級的應用,不可能應用到企業(yè)級的市場,隨著控制器的水平和SSD廠商組織部件的能力,我們已經(jīng)可以把當時認為不靠譜的MLC做成現(xiàn)在的主流企業(yè)級的應用介質(zhì)。TLC相對MLC目前就是處于之前一個類似的情況,比如說去年蘋果6開賣的時候,很多人會心里不高興,說查了一下我的這個上面買的Nand閃存是TLC,我認為這是不靠譜的。但是沒有聽說因為誰拿到了一個TLC的蘋果,它的數(shù)據(jù)存儲出現(xiàn)了問題,因為存儲的比特多了,看起來可靠性降低,但是實際上起企業(yè)級的應用有辦法把這樣的介質(zhì)組織成企業(yè)級的產(chǎn)品。TLC會成為企業(yè)級的應用,而存儲16個比特的QLC會走入消費級的市場。到時候可能買一個1PB容量的手機,這有可能會變成市場的主流選擇。
作為制造廠商,基于3D Nand我們會更新我們的產(chǎn)品線,對我們的旗艦產(chǎn)品6.4T,一個季度以后我們可以輕松做到12.8T,在明年我們可以做出單卡容量25T以上的產(chǎn)品??偨Y一下今天跟大家分享的內(nèi)容,2D的MLC是主流的解決方案,但是它的工藝和成本已經(jīng)到達極限,目前的工藝沒有辦法優(yōu)化。所以3D Nand的出現(xiàn)解決了這一尷尬的問題,可以提供等效于小于10納米的制程技術,提高更大的容量,然后有更高的容量,更高的密度,為未來的大容量存儲提供可能性。數(shù)據(jù)庫和虛擬化的利用,它的IO模型特別適合閃存的應用,閃存將會成為數(shù)據(jù)中心以后解決IO問題的主流方法。2016年起,3D Nand會逐漸進入數(shù)據(jù)中心,在2017年將會成為主流的解決方案。作為消費者來講,作為企業(yè)來講,將會獲得更高性能的,更大容量的企業(yè)級產(chǎn)品,最終降低自己的運維成本,降低自己在硬件上的投入。
謝謝大家。
(作者徐偉系寶存科技技術總監(jiān),根據(jù)錄音整理,未經(jīng)本人審定)