黃亮 發(fā)表于:14年11月26日 11:51 [原創(chuàng)] DOIT.com.cn
在本月16日舉行的《存儲(chǔ)技術(shù)之巔》第一次線下交流活動(dòng)中,精通Oracle的女神Lunar和Greenliant綠芯科技VP李炫輝先生,分別帶來(lái)了“Oracle在非傳統(tǒng)存儲(chǔ)上的應(yīng)用交流”和“閃存技術(shù)及市場(chǎng)發(fā)展趨勢(shì)”這2個(gè)分享主題。
數(shù)據(jù)庫(kù)方面我不專(zhuān)業(yè),因此就班門(mén)弄斧分享點(diǎn)閃存方面的收獲和心得。本文是第一篇,后面計(jì)劃還有2個(gè)小的話題。
在原本我為大家準(zhǔn)備的內(nèi)容之前,先插入一段業(yè)內(nèi)高人的討論——這兩天在網(wǎng)上的新發(fā)現(xiàn):)在未經(jīng)確認(rèn)的情況下,暫時(shí)隱去了他們的名字/昵稱(chēng)。
FPGA搞不定LDPC?在SSD上的生命力能否延續(xù)
F君:“FPGA最大的問(wèn)題是搞不定ECC,繞不過(guò)去的問(wèn)題,以后必然是ASIC。
至少ECC是在ASIC里,主控另說(shuō)。”
L君:“FPGA高ECC主要是邏輯資源不夠,Flash通道多后,一個(gè)FPGA帶寬就上不去了,每個(gè)通道都需要獨(dú)立計(jì)算ECC。”
F君:“ECC組合邏輯比較大,比如BCH32,在FPGA上能跑100M的頻率就不錯(cuò)了,提供的帶寬不夠以后性能的增長(zhǎng)。而且以后的Flash的BER(bit error rate,誤碼率)越來(lái)越大,肯定需要更強(qiáng)ECC,需要資源更大。”
L君:“所以LDPC硬Core成為一個(gè)關(guān)鍵競(jìng)爭(zhēng)力。
應(yīng)該說(shuō)LDPC Core硬化,做到芯片里,FPGA目前基本沒(méi)有合適的能承載LDPC的商用方案。”
在《破解PCIe SSD進(jìn)化:從踩坑到解決方案》一文中,我曾經(jīng)提到“FPGA(現(xiàn)場(chǎng)可編程門(mén)陣列)的特點(diǎn)是設(shè)計(jì)靈活性強(qiáng),缺點(diǎn)是封裝尺寸和發(fā)熱量比ASIC較大,數(shù)量達(dá)到一定規(guī)模后成本不如ASIC。”
上面這段聊天中,我沒(méi)看到來(lái)自Fusion-io或者寶存科技的人發(fā)表意見(jiàn)。很早就聽(tīng)說(shuō)Fusion-io考慮過(guò)自己做ASIC控制器;而國(guó)內(nèi)Memblaze最新的PBlaze4在NVMe時(shí)代也開(kāi)始轉(zhuǎn)向使用PMC的ASIC。
關(guān)于BCH糾錯(cuò),我首先想起了當(dāng)年看到的SandForce SSD控制器結(jié)構(gòu)圖,應(yīng)該是每512byte 55b的ECC引擎。
隨著NAND閃存制程的不斷縮小以及TLC應(yīng)用的推進(jìn),誤碼率確實(shí)在提高,因此更好的糾錯(cuò)算法顯得越發(fā)重要。
上圖來(lái)自Altera在Flash Memory Summit2014上的演講資料,可以看到LDPC和BCH的對(duì)比優(yōu)勢(shì)。
在我印象中,另一位閃存行業(yè)的資深人士曾經(jīng)表示:“在LDPC上面,除了Marvell和LSI都是小學(xué)生。”
為什么這樣說(shuō)呢,因?yàn)?/span>LDPC技術(shù)在硬盤(pán)控制器上也發(fā)展了一些年頭。我們知道硬盤(pán)的磁記錄密度已經(jīng)非常大了,對(duì)模擬信號(hào)轉(zhuǎn)換之后的糾錯(cuò)也是必不可少的。而今天的硬盤(pán)控制器(含前置放大)主要就是Marvell和LSI(與希捷合作)兩家提供。當(dāng)然硬盤(pán)和SSD的速度不可同日而語(yǔ),那么當(dāng)初LSI收購(gòu)SandForce以及最終賣(mài)給希捷也有一定技術(shù)互補(bǔ)的成分吧。
好奇心使我繼續(xù)翻看上面那個(gè)文檔,如上圖中紅圈的部分,FPGA應(yīng)該也能實(shí)現(xiàn)LDPC。
繼續(xù)看上圖,Altera認(rèn)為并行化的Parity矩陣允許更快的(LDPC)算法執(zhí)行。
李炫輝:“BCH算法需要更強(qiáng)的計(jì)算資源,而FPGA資源有限,LDPC則可以在同樣數(shù)量校驗(yàn)碼的情況下,實(shí)現(xiàn)更多位的糾錯(cuò),但是只有在錯(cuò)碼率較高的情況下,LDPC的效率才會(huì)高。
因此我推測(cè),轉(zhuǎn)向LDPC后,利用3D或多層制程技術(shù)的高容量NAND顆粒,可以大幅度提升單卡容量,但是性能提升會(huì)相對(duì)有限。
因此,如何平衡大容量以及性能會(huì)是架構(gòu)設(shè)計(jì)面臨的問(wèn)題。”
我的另一位朋友,《存儲(chǔ)技術(shù)之巔》Super管理員,擁有FPGA開(kāi)發(fā)經(jīng)驗(yàn)的Carol_cao表示:“需要多少資源?高端FPGA那么多資源,不夠?
不過(guò)這么貴的產(chǎn)品,做ASIC一定是看到了市場(chǎng),或者說(shuō)已經(jīng)做出了部分市場(chǎng),要不然得玩死;
不走高制程,ASIC價(jià)格也下不來(lái),制程高了,很多問(wèn)題來(lái)了;
沒(méi)有底蘊(yùn)沒(méi)有實(shí)力的不敢這么做呀。”
點(diǎn)評(píng):至于FPGA到底能否實(shí)現(xiàn)承載LDPC的商用方案?在效率上有沒(méi)有價(jià)值?筆者不是SSD設(shè)計(jì)方面的專(zhuān)家,在這里不敢下什么結(jié)論,只是希望為大家進(jìn)一步的討論拋磚引玉。
文章開(kāi)頭引用的話中有一句“每個(gè)通道都需要獨(dú)立計(jì)算ECC”,而ONFi和ToggleDDR閃存接口速率也越來(lái)越高,這對(duì)單芯片ASIC的處理能力會(huì)不會(huì)也有挑戰(zhàn)呢?(注:PCIe SSD上32個(gè)通道是比較普遍的現(xiàn)象)
分布式ECC:NAND封裝閃存控制器
如上圖,未來(lái)我們會(huì)看到一種將NAND Flash和閃存控制器(包含ECC和FTL)集成于一顆芯片的方案。
Greenliant這家公司是做IC出身,現(xiàn)在也做PCIe SSD,這意味著右邊的芯片要把來(lái)自閃存工廠的半導(dǎo)體也封裝進(jìn)去。那么,我認(rèn)為已經(jīng)擁有控制器技術(shù)的三星、美光等也可能這么干吧。
我還注意到左邊的邏輯單元中沒(méi)看到PCIe或者SATA等主機(jī)接口,那么這種“NANDrive”應(yīng)該還需要轉(zhuǎn)接一下。
上圖中的G-card Controller就是剛才所說(shuō)的“樞紐芯片”,其內(nèi)部除了PCIe 2.0 x4接口之外,System Controller管理者控制緩存和數(shù)據(jù)緩存,此外還有8個(gè)NANDrive ArrayController模塊,各自控制5顆NANDrive組成多個(gè)RAID組。
也許就是因?yàn)閷?/span>ECC和FTL這部分閃存控制功能甩了出去(聽(tīng)李總說(shuō)還可以做全局FTL),G-card Controller芯片能夠加強(qiáng)其它部分,因此被稱(chēng)為“板載硬件RAID的控制器架構(gòu)”。
深夜我忽然想起:上圖中的G-card Controller有沒(méi)有可能換成FPGA呢?來(lái)看看下面這個(gè)圖。
在Violin Memory全閃存陣列中,FPGA的應(yīng)用就分成了2部分——RAID控制和閃存控制,IBM FlashSystem(TMS)的情況也是類(lèi)似。這里的Flash Control和閃存尚未封裝在一起,整個(gè)存儲(chǔ)系統(tǒng)的規(guī)模也比單卡要大。
李炫輝:“Greenliant下一代產(chǎn)品除了對(duì)外的接口會(huì)采用標(biāo)準(zhǔn)協(xié)議外,內(nèi)部ASIC與分布式控制器之間,以及控制器與顆粒之間均會(huì)采用私有協(xié)議(也就是說(shuō)FPGA沒(méi)法加進(jìn)來(lái)玩了)。同時(shí)在算法上也會(huì)根據(jù)不同的顆粒特性做調(diào)整。
因此Greenliant的下一代產(chǎn)品也是基于自己的ASIC芯片,現(xiàn)在第一代產(chǎn)品(PCIe SSD,據(jù)說(shuō)已經(jīng)支持NVMe)用了FPGA。”
未來(lái)的幾天中,我還想跟大家分享Host-Based和Device-Based的融合,以及SSD掉電保護(hù)的相關(guān)內(nèi)容,感謝關(guān)注。
本文出自黃亮的微信公眾號(hào),企業(yè)存儲(chǔ)技術(shù)(微信號(hào):huangliang_storage),歡迎大家關(guān)注!
公司簡(jiǎn)介 | 媒體優(yōu)勢(shì) | 廣告服務(wù) | 客戶(hù)寄語(yǔ) | DOIT歷程 | 誠(chéng)聘英才 | 聯(lián)系我們 | 會(huì)員注冊(cè) | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.