以下內(nèi)容整理于演講實(shí)錄,未經(jīng)演講人最終確認(rèn):

為什么做FPGA,可以看到一些趨勢(shì),第一個(gè)是數(shù)據(jù)爆炸,第二是人工智能的興起,第三個(gè)就是后摩爾定律時(shí)代,不可避免要走向異構(gòu)計(jì)算。說(shuō)到NVMe Over Fabric,主要解決Storage Disaggreation,把原來(lái)插在服務(wù)器背板的NVMe拿出來(lái),可以推到遠(yuǎn)端,和從傳統(tǒng)的DAS走向SAN這個(gè)概念是一樣,把高性能資源重復(fù)利用,同時(shí)又能夠集中管理。某種意義上講,F(xiàn)PGA是一種芯片可編程的芯片,不需要做很多的工作,這里有一個(gè)關(guān)鍵點(diǎn),賽靈思發(fā)展FPGA分三個(gè)階段,第一個(gè)階段我們?yōu)樾酒鲵?yàn)證,做原型系統(tǒng),移動(dòng)通訊爆發(fā)的年代,外面的各個(gè)基站,我們做這種天線矩陣、信號(hào)處理,包括任何雷達(dá)里面都會(huì)有FPGA的芯片,為什么要講到數(shù)據(jù)中心,就是因?yàn)槲覀冊(cè)谌蛴幸粋€(gè)比較大的云,Microsoft Azure大量部署FPGA做異構(gòu)計(jì)算,很多教授都講過(guò),為什么FPGA介入數(shù)據(jù)中心,就是為了做異構(gòu)計(jì)算。做異構(gòu)計(jì)算我們講很關(guān)鍵一點(diǎn),ARM在移動(dòng)系統(tǒng)慢慢往數(shù)據(jù)中心走,大家都知道,做NVMe,我們就要關(guān)心PCIe,從某種角度,對(duì)ARM來(lái)講是一個(gè)非常大的弱點(diǎn),很少有手機(jī)的GPS能夠支持PCIe,而賽靈思FPGA方案可以提升基于ARM的控制系統(tǒng)性能的可靠性。

對(duì)于DISAGGREGATION和FPGA的芯片來(lái)講,我們天生可以支持5個(gè)PCIe盤,可以掛100G的系統(tǒng),某種意義上講,既可以支持PCIe也可以支持100G,底層都是串行服務(wù)。所以說(shuō),我們還不僅做這個(gè),還可以加入一些定制的加速功能,就是我們講的可以做coding、RAID、哈希、壓縮等等,還有做客戶的定制內(nèi)容。整體的架構(gòu)來(lái)講的話,可以做到一個(gè)標(biāo)準(zhǔn)的24盤位JBOF,提供對(duì)外輸出100G性能,把100G的帶寬跑滿4K性能。

測(cè)試環(huán)境,上面測(cè)延時(shí),下面測(cè)IOPS。在下面使用四個(gè)盤連在板子上,直接連接過(guò)來(lái),測(cè)試性能,我們可以看到,在4K的情況下,隨機(jī)讀都是在2.32Millon,寫(xiě)的話基本上在1.1Millon左右,盤的寫(xiě)和讀的概念比較大,延時(shí)差別,不管是順序讀的還是無(wú)序讀,是在2-8M之間,寫(xiě)增加的延遲是在5-10M之間,為什么延時(shí)增加不一樣,大家如果做PCIe協(xié)議,就知道讀寫(xiě)是不一樣的,寫(xiě)的時(shí)候不需要返回,讀的話需要一個(gè)返回,所以不涉及介質(zhì)的話,寫(xiě)是比讀要好。在后續(xù)寫(xiě)的時(shí)候,其實(shí)是數(shù)據(jù)準(zhǔn)備好了以后,發(fā)包,RAID讀數(shù)據(jù),然后寫(xiě)在后面的盤上,這就造成讀寫(xiě)增加延時(shí),對(duì)于小包沒(méi)有苛刻要求的話,在寫(xiě)的時(shí)候把包里面數(shù)據(jù)放進(jìn)去,這樣就可以做到讀和寫(xiě)延時(shí)差不多的時(shí)間。

關(guān)于存儲(chǔ)產(chǎn)品路線,我們看標(biāo)準(zhǔn)的盤,或者具有標(biāo)準(zhǔn)的NVMe標(biāo)準(zhǔn)接口,都可以通過(guò)FPGA連接上去,會(huì)有一定的DDR控制器,在FPGA里有一個(gè)NVMe IP設(shè)置,在NVMe里通過(guò)一個(gè)地址轉(zhuǎn)換成可以發(fā)送到后端的NVMe標(biāo)準(zhǔn)命令。

我們現(xiàn)在做的東西就是想做一個(gè)NVMe HBA,比如說(shuō)客戶要一個(gè)盤要128T,那我可以找三星英特爾,他說(shuō)不好意思我可能要等到兩年以后,那怎么辦?

我甚至可以支持虛擬化,可以做很多的基于NVMe的事,基于此,中段可以從16個(gè)盤變成一個(gè)盤,大大降低對(duì)主機(jī)CPU的占用,這些我都會(huì)放在FPGA里,減少CPU的使用?,F(xiàn)在大家都面臨一個(gè)問(wèn)題,CPU拿來(lái)賣而不是拿來(lái)跑盤。舉個(gè)例子,對(duì)100G的包做一個(gè)分流,所有的I/O的包全部通過(guò)硬件輸出,因此任何一個(gè)小小的ARM都可以來(lái)做存儲(chǔ)控制器,所以要做I/O和數(shù)據(jù)分流。我們的計(jì)劃就是,把NVMe加進(jìn)去,大家可以想像,假如我是一張網(wǎng)卡,對(duì)于主機(jī)來(lái)看我是一個(gè)NVMe盤,我這個(gè)盤子上面可以切成很多的小盤子,對(duì)于用戶來(lái)講,我們所做的事情就是希望把和CPU打交道的接口,能夠通過(guò)FPGA做硬件的實(shí)現(xiàn),降低I/O等等對(duì)CPU的占用。一個(gè)IP打包,然后集成到一個(gè)芯片,或者一個(gè)系統(tǒng)里面。

賽靈思成立于1984年,已經(jīng)35年了,總部在硅谷,中國(guó)北京有一個(gè)研發(fā)中心,我們現(xiàn)在所有的員工有4000人,我們客戶差不多有2萬(wàn)多個(gè)客戶。看一下,我們?nèi)虼蟾庞?300多個(gè)合作伙伴,我們出品全球第一款FPGA,第一個(gè)掛ARM存儲(chǔ)系統(tǒng),隨著數(shù)據(jù)爆炸和AI的興起,以及后網(wǎng)絡(luò)時(shí)代的到來(lái),不可定義的就要FPGA。把原來(lái)差的服務(wù)器拿出來(lái),可以推到遠(yuǎn)端,從傳統(tǒng)的原來(lái)的DAS走向SAS這個(gè)概念是一樣,把我們高性能的資源重復(fù)利用,同時(shí)又能夠集中管理,好處頗多。

賽靈思的創(chuàng)新在于基于FPGA方案,實(shí)現(xiàn)了數(shù)控分離,在ARM系統(tǒng)上實(shí)現(xiàn)I/O控制,形成完整的數(shù)據(jù)通路。

分享到

zhangnn

相關(guān)推薦