今天我主要介紹一下我們做的針對一組NVM(Non-volatile memories,非易失存儲器)的進展。

目前我們的項目側(cè)重在解決怎么存,怎么存得快,存得準,還有存得可靠,也就是高效、低能耗解決問題。

對于一些響應(yīng)延遲要求比較高的應(yīng)用,比如說淘寶、12306,希望一點擊就出來的應(yīng)用,或者說,要求數(shù)據(jù)在內(nèi)存里面存放和運算。內(nèi)存的需求和供給存在很大的差距,大數(shù)據(jù)的計算需要的內(nèi)存容量是普通的1000倍,現(xiàn)在的通過體系結(jié)構(gòu)是RRAM、DSRM、SSD等等。為了滿足大規(guī)模內(nèi)存的需要,Cache放在一個DRAM里會有這樣的問題,因為是用電荷來存的,所以就存在如何保證電荷檢測、電荷泄露等等的,而DRAM是電容來保存信息的,所以有一個充電放電的過程,能耗也比較高,據(jù)統(tǒng)計40%到50%的能耗來自Memory,DRAM的能耗有40%來自于刷新,這也是DRAM為什么受到關(guān)注的原因。

再來說說制程。制程達到幾個納米之后就會停止,現(xiàn)在NVM比較受關(guān)注,最受關(guān)注的有三個,另外兩個是STTMaRM和DARM。不過,STTMARM容量上不去,而RRAM容量可以做得非常大,這也是這幾年RRAM關(guān)注度比較高的原因。

NVM的憶阻器一是可以做存儲,第二個是可以做計算;2008年做存儲,2010年就可以做邏輯運算,到2015年實現(xiàn)矩陣向量乘法,做存算結(jié)合。它的主要原理,應(yīng)該說行上面有一個電阻,加一個電壓上面就會出現(xiàn)電流,比如說每一個行上加不同的電壓,就產(chǎn)生了電流。

來看一下,怎么樣能夠存得好?因為要能計算,首先是要能存下來,存下來就是剛才說的矩陣,也就是一個模擬量,類似一個非信息的點,希望能夠盡量存得準,同時也能夠?qū)崿F(xiàn)高效低能耗。大家對此研究比較熱的原因,就是非理想因素的影響。

一個低組態(tài)RRAM的單元,要進行一個高組態(tài),面臨reset的延遲,要變化高阻態(tài),就是帶正離子和帶負離子正位。相反的就是,再加上一個反向的電壓,金屬氧化物的阻值狀態(tài)的變化實現(xiàn)數(shù)據(jù)的存儲,當它做RESET,從1變成0的時候,加一個電壓會變大,加一個RESET的時候就會有延遲,就會變慢。理想狀態(tài)是一個單元就有一個控制器,但這是不可能的,會浪費很多芯片的面積。這里面就會有很多IR? drop的問題。

比如說要在某個單元上面加一個單元,上面列的單元都有一個電壓,也就會有一個電流,目前的方法就是要把列上面加一個半偏置,加上一個1/2的V,相當于上面的數(shù)也會有問題。

首先就是線路上,每一個線路都要考慮,每一個面和行都有電流的線路,上面都有一個電壓,也有一個電阻,而且能耗比較高,如果這些都是一些高阻態(tài)存著,就會存在一些問題。只有克服電壓和電阻這些問題才能存得準。

傳統(tǒng)的方式是在面和行上加電壓,然后測試、改變它的阻值,觀察數(shù)據(jù)的變化,RESET的數(shù)字從144ns變成了240ns,受到這個啟發(fā),我們做了相應(yīng)的工作。

首先是“雙端寫驅(qū)動”,如果是使用了雙端控制之后,電壓就會升上去,就會緩解延遲,在這個電壓上存在這樣的分布,慢慢會下降為對角線的分布。如何應(yīng)用對角線的分布?可以做一個優(yōu)化,比如說crossbar的陣列上下都有驅(qū)動,兩邊都可以加。如果從右邊和下邊兩驅(qū)動,這個線就是這么長,這個延遲就是這么長,相應(yīng)的延遲也會比較短,所以我們就這樣開始分區(qū):把左下角放大,可以看到這一塊的延遲是最低的,慢慢從對角線的方式延遲是最大的,是這樣的一個控制方式。

這樣有一個什么好處?如果不做對角線劃分,寫這塊區(qū)域的時候,就要保證最壞的一個要在限定的長時間寫完,建了一個分區(qū)之后,得到的一個好處“告訴上層,可以不同的延遲”。上層就可以通過內(nèi)存分配和邊緣優(yōu)化進行低延遲使用,比如說冷熱數(shù)據(jù)調(diào)度,熱數(shù)據(jù)也做一些地址的轉(zhuǎn)化等等。

第二,提高性能。在正crossbar上面做一個并行,在reset做一個延遲操作,可以進行并行來操作,這個SET的操作和RESET的操作都可以做,測試效果顯示,延遲降低了22%。

第三,降低能耗,要克服傾斜電流,就需要高阻態(tài),怎么樣達到這個目的?互補組變單元。但它的缺點是影響壽命,同樣也影響性能。最直觀的方法就是用MEM模式,把經(jīng)常訪問的數(shù)據(jù)做成MEM模式,冷數(shù)據(jù)用CRS模式,如何區(qū)別冷熱?記錄頻率的表開銷。一般為了降低能耗,采取的是全浮空的狀態(tài),如果低阻態(tài)多了以后,數(shù)據(jù)就會消失。為了克服這個缺點,需要減少低阻態(tài)的數(shù)據(jù),用MEM來存熱數(shù)據(jù),這個方式提高了可靠性和降低能耗,這種混合的方式,平均能耗能夠節(jié)省7.3倍。

我們在最新的一篇論文中對此做了報道,其他還有一些相關(guān)的研究,就不再一一介紹。

我們的研究已經(jīng)到了非常的底層,怎么樣來做出存儲器,具體就跟介紹這么多。在存得準,存得可靠的基礎(chǔ)方面,進一步再來做計算,就可以解決計算的很多問題,如果是多個陣列集成,會有一個傳遞的集成,會有越來越大的誤差,我們希望先解決第一步,在這方面做些工作。

今天我就講這么多,謝謝大家?。ū疚奈唇?jīng)過本人審閱)

分享到

xiesc

相關(guān)推薦