現(xiàn)在進(jìn)入萬(wàn)物互聯(lián)的時(shí)代,產(chǎn)生很多的設(shè)備,像電子商務(wù)、智能終端、智能駕駛、社交網(wǎng)絡(luò)等,這些智能應(yīng)用的數(shù)據(jù)處理帶來(lái)極大挑戰(zhàn)——I/O訪(fǎng)存不規(guī)則,數(shù)據(jù)規(guī)模越來(lái)越大,智能應(yīng)用的模型規(guī)模龐大,高吞吐率實(shí)時(shí)更新,還有計(jì)算量要求很大,能耗比較低等。
我們面臨的是一場(chǎng)云邊挑戰(zhàn)。所謂的邊是所有產(chǎn)生數(shù)據(jù)的地方,大部分指產(chǎn)生和匯集數(shù)據(jù)的終端。邊緣云、中心云等都可以稱(chēng)之為云。尤其是邊端存在計(jì)算受限,存儲(chǔ)受限,功耗受限,存儲(chǔ)受限,通信受限。對(duì)云的要求是實(shí)時(shí)性、數(shù)據(jù)安全性及可靠性等。
而傳統(tǒng)計(jì)算架構(gòu)無(wú)法適應(yīng)智能應(yīng)用,會(huì)出現(xiàn)通信回路、可擴(kuò)展性、計(jì)算效率等問(wèn)題。
解決問(wèn)題一般有兩個(gè)思路:一個(gè)是怎么讓云離邊更近。在邊上做多個(gè)邊緣云,相對(duì)來(lái)說(shuō)邊緣的計(jì)算和存儲(chǔ)能力就變得更快更強(qiáng)大,距離上也不一定傳輸?shù)街行脑苹虮镜卦?,但由于功耗的要求,很難滿(mǎn)足這種模式;
第二種思路是讓邊變得更強(qiáng),讓邊緣的計(jì)算能力更強(qiáng)、通信更短、存儲(chǔ)更快更大、功耗更低,我們經(jīng)過(guò)嘗試是可行的。
這里主要用了兩種技術(shù):1.近數(shù)據(jù)計(jì)算,2.感存算融合。
近數(shù)據(jù)計(jì)算不是一個(gè)很新的概念,特別是傳統(tǒng)計(jì)算和存儲(chǔ)分離的模式,越來(lái)越對(duì)運(yùn)行現(xiàn)有應(yīng)用感到吃力。
一些新器件(如RRAM)的誕生雖然能真正做到存儲(chǔ)和計(jì)算的融合。但這種器件的形成還在發(fā)展中,要真正落地可能還要相當(dāng)長(zhǎng)的時(shí)間。
現(xiàn)在還有一種近存計(jì)算思路——把存儲(chǔ)和計(jì)算距離拉近,傳輸路徑變短,計(jì)算性能也就有所提升。
近數(shù)據(jù)智能存算融合系統(tǒng)
近數(shù)據(jù)智能存算融合系統(tǒng)現(xiàn)在也有近似的架構(gòu),像三星的SmartSSD,還有阿里的可計(jì)算存儲(chǔ)系統(tǒng),這種計(jì)算僅僅是對(duì)計(jì)算做加速,也就是現(xiàn)在各種GPU、XPU、TPU等。
但整個(gè)回路的I/O路徑搬移沒(méi)有太大變化,所以它只能支持存儲(chǔ)軟件的計(jì)算,如加密、視頻,處理器等應(yīng)用,不能支持通用智能應(yīng)用,應(yīng)用范圍受限。
清華大學(xué)研發(fā)的近數(shù)據(jù)智能存算融合系統(tǒng)TH-iSSD,在性能參數(shù)方面,容量達(dá)到1TP,帶寬從2GB可擴(kuò)展至10GB,待機(jī)功耗低于5w,平均功耗低于50w,(約48w)能效比相對(duì)PowerPC提升了20倍以上,支持任意智能應(yīng)用部署。
簡(jiǎn)要介紹一下清華TH-iSSD的思路原理。
感存算的過(guò)程——感知數(shù)據(jù),然后存儲(chǔ)數(shù)據(jù)之后提取進(jìn)行計(jì)算。整個(gè)過(guò)程的I/O路徑很長(zhǎng),延遲很高。
我們的思路是把它的感知接口和智能計(jì)算、存儲(chǔ)控制器做在一個(gè)FPGA上,真正做到存算融合。這存在很多挑戰(zhàn),我們下一步是做一個(gè)ASIC芯片的定制,主要借助SoC的架構(gòu),利用RISC-V來(lái)提供輕量的CPU內(nèi)核,之后用RoCC的可擴(kuò)展接口,對(duì)計(jì)算和存儲(chǔ)做融合,采用55nm制程達(dá)到帶寬20GB的指標(biāo),能支持?jǐn)U展性應(yīng)用,性能達(dá)到10Tflops。
云邊協(xié)同的智能感存算融合案例
以航天衛(wèi)星,航空系統(tǒng),氣象預(yù)測(cè)為例:
1.衛(wèi)星系統(tǒng)。面向航天衛(wèi)星,基于高分辨率光學(xué)衛(wèi)星圖像的智能計(jì)算系統(tǒng)需要進(jìn)行遠(yuǎn)程的數(shù)據(jù)傳輸,對(duì)計(jì)算峰值有要求;需要高帶寬進(jìn)行實(shí)時(shí)存儲(chǔ)和傳輸,實(shí)時(shí)處理的高算力;數(shù)據(jù)流與計(jì)算流復(fù)雜,性能和可靠性低;SSD出現(xiàn)性能抖動(dòng),帶寬和延遲不穩(wěn)定。
對(duì)此我們重寫(xiě)了控制器。延遲不可控,那就重寫(xiě)控制器,和計(jì)算結(jié)合在一起,讓延遲變得可控。去除存儲(chǔ)硬件模塊冗余,如存儲(chǔ)管理處理器冗余,SSD控制器冗余以及計(jì)算存儲(chǔ)模式(先存儲(chǔ)再計(jì)算)帶來(lái)的數(shù)據(jù)流冗余,真正做到感存算一體。
2.航空系統(tǒng)。廈門(mén)大學(xué)航空院研發(fā)的“海騎兵”無(wú)人機(jī),主要做海上搜救、殘骸搜索和巡檢。最初海騎兵不能使用高清相機(jī),飛行速度不能過(guò)快,以免數(shù)據(jù)來(lái)不及存儲(chǔ)。
我們的解決方法是利用感存算融合縮短數(shù)據(jù)流程,從算法的角度來(lái)說(shuō)去除冗余數(shù)據(jù)存儲(chǔ),使存儲(chǔ)容量提升100倍,帶寬提高40倍,延遲降低10倍,原來(lái)1秒鐘僅能處理1/4張照片,現(xiàn)在1秒鐘能處理25張照片,提高100倍。
3. 天氣預(yù)報(bào)。 因?yàn)樵七叾藬?shù)據(jù)在不停變化,是一個(gè)增量,我們?cè)谠七叾诵酒锩婕闪嗽诰€(xiàn)增量學(xué)習(xí)的算法,做更好的預(yù)測(cè),使得天氣預(yù)報(bào)從小時(shí)級(jí)變到分鐘級(jí)。
為此我們做了兩款設(shè)備:近數(shù)據(jù)存儲(chǔ)融合系統(tǒng)TH-SmallEdge,存儲(chǔ)容量256GB,存儲(chǔ)帶寬200MB/s,2枚5號(hào)電池可以持續(xù)工作一個(gè)月。如果借助一些可再生能源,可以支持將近一年。
后來(lái)我們做了更小的TH-TinyEdge,容量為64GB,但2枚5號(hào)電池能持續(xù)工作一年,但沒(méi)有推測(cè)和預(yù)測(cè)的功能。 目前系統(tǒng)已部署在海南省三沙市及附屬島礁氣象預(yù)報(bào)。
研發(fā)這三款設(shè)備,我們最大的思想是用三個(gè)關(guān)鍵詞:近數(shù)據(jù)、智能、感存算融合,這里的融合是真正把存儲(chǔ)控制器和計(jì)算控制放到一起。
(以上基于2021年全球閃存峰會(huì)演講整理,未經(jīng)過(guò)本人審閱)