“AI的發(fā)展,以及AI的無處不在,為高度受限的系統(tǒng)帶來更高要求的工作負載?!?Manuel說。
人工智能驅(qū)動的嵌入式系統(tǒng):不同階段與對策
人工智能驅(qū)動的嵌入式系統(tǒng),有著三個階段的處理任務(wù),預(yù)處理階段負責(zé)傳感器處理與融合數(shù)據(jù)調(diào)節(jié),對于系統(tǒng)而言這是非常關(guān)鍵的一環(huán);在推理階段,實時嵌入式系統(tǒng)解決感知、分析、情境感知問題,后處理階段實現(xiàn)決策、控制、反饋。
這三類處理都必須能夠加速,才能夠真正實現(xiàn)全系統(tǒng)的實時。但由于沒有任何一類處理器能夠針對三個階段進行優(yōu)化,因此,用戶構(gòu)建的系統(tǒng)大都是采用這樣的對策:在預(yù)處理階段采用非自適應(yīng)的SoC或I/O接口及硬ISP方式,但這種方式缺少靈活性,必須通過外部的內(nèi)存來做一些存儲和緩存,由于處理器并沒有經(jīng)過優(yōu)化,所以不僅影響其效率,而且時延也有所加強;推理階段采用非自適應(yīng)的矢量處理器;在后處理階段,通常使用的都是高性能的嵌入式CPU。
對用戶而言,采用AMD第一代Versal AI Edge系列的可編程邏輯來做預(yù)處理,然后用矢量處理或者人工智能引擎來做推理,也不失為一個選項。但這種做法的不足之處是,后處理階段需要配置外部的處理器。
無論采用哪種方法,都離不開多芯片的解決方式,導(dǎo)致一系列新的問題,比如更高的功率需求,供電的復(fù)雜性,更高的占板面積與終端的系統(tǒng)尺寸,更高的外部內(nèi)存需求,以及芯片間凸性帶來的時延增加;而板卡上更多的組件,也意味著更多的安全漏洞、可能的故障點以及更大的報廢挑戰(zhàn),板卡設(shè)計時間與工作量也成為拉低生產(chǎn)率的因素。
4月9日,AMD發(fā)布了為嵌入式系統(tǒng)帶來單芯片智能性的第二代Versal 自適應(yīng)SoC,順利化解上述挑戰(zhàn)。
二代Versal?自適應(yīng)SoC發(fā)布:兩款新品系列
兩款產(chǎn)品分別是面向AI驅(qū)動型嵌入式系統(tǒng)的第二代Versal AI Edge系列,以及面向經(jīng)典嵌入式系統(tǒng)的第二代Versal Prime系列。兩款新品除了具備同樣的AI引擎,還能夠?qū)崿F(xiàn)高達3倍的TOPS每瓦,以及高達10倍的標量計算,采用全新高性能集成CPU;通過AMD可編程邏輯,實現(xiàn)世界領(lǐng)先的自適應(yīng)計算。
顧名思義,單芯片智能意味著在單個器件中提供端到端的加速,也就是實現(xiàn)全部三個階段的加速。
在預(yù)處理環(huán)節(jié),AMD可編程邏輯支持傳感器的融合和數(shù)據(jù)調(diào)節(jié);可編程邏輯可以非常靈活地適應(yīng)各類型的接口,確保真正的實時,還可以在現(xiàn)場部署之后進行升級,實現(xiàn)定制的可編程邏輯差異化,且無需外部的內(nèi)存以及緩存的需求和設(shè)置,支持廣泛的速率、電壓和工作模式,減輕了處理工作的壓力,節(jié)省了運行時間。
針對AI推理環(huán)節(jié),AMD第二代Versal AI Edge系列器件中提供了名為AIE-ML v2的AI引擎,通過擴展的數(shù)據(jù)類型支持,實現(xiàn)了高達2倍的每瓦TOPS。其特點是控制處理器包含在AI引擎陣列中,并且做了硬化,無需使用可編程邏輯進行控制,將可編程邏輯用于傳感器和硬圖像和視頻等數(shù)據(jù)處理的應(yīng)用,由此也支持更多的數(shù)據(jù)類型,在提高吞吐量的前提下實現(xiàn)更高的精準度。
這也是和上一代的顯著差別。
AI引擎功能強大,但離不開強大好用的軟件包。AMD提供了一個Vitis AI軟件,方便開發(fā)者將原本非常熟悉的開源工具,比如PyTorch、TensorFlow等在Vitis中進行優(yōu)化,然后更好地部署和推理。
AMD第二代Versal自適應(yīng)的SoC還大大提升了CPU的能力,實現(xiàn)高達8倍的Arm Cortex-A78AE核心,每核心最高頻率高達2.2GHz,并且有高達200.3K的DMIPS算力,為復(fù)雜的后處理提供高達10倍的標量算力。
針對控制功能的實時處理單元,RPU提供高達10倍的Arm Cortex-R52核心,每核心最高頻率高達1.05 GHz,高達28.5K的DMIPS算力。
邊緣對于信息安全和功能安全都有非常嚴格的要求,新產(chǎn)品也提供了通過車規(guī)級認證和安全認證的ASIL D以及SIL 3,分別用于自動駕駛的汽車以及工業(yè)機器人——這些應(yīng)用場景從產(chǎn)品的設(shè)計開始就必須加入的。
超越前一代:以功能的完善與中央計算的能力
AMD的第一代CPU加速解決方案已經(jīng)應(yīng)用于廣泛的市場,而面向 AI 驅(qū)動型及經(jīng)典嵌入式系統(tǒng)的第二代Versal AI Edge系列能夠形成系統(tǒng)的中央計算,拓展了其在汽車、機器人、工業(yè)物聯(lián)網(wǎng)、醫(yī)療、機器視覺、專業(yè)音視頻與廣播等眾多領(lǐng)域的更深層次的應(yīng)用,這也是AMD數(shù)十年來為具有挑戰(zhàn)性的嵌入式應(yīng)用提供解決方案積累的豐富經(jīng)驗為支撐。
以一個高級自動駕駛輔助系統(tǒng)L2和L3為例,第二代Versal AI Edge系列比第一代提升了4倍圖像處理的能力,消耗的功率卻非常接近;而在充斥攝像頭與海量視頻的智慧城市領(lǐng)域,采用第二代Versal AI Edge系列的邊緣AI設(shè)備不僅縮小30%的占板面積,而且支持2倍的視頻流,每路視頻流占板面積縮小65%;在專業(yè)的音視頻和廣播領(lǐng)域,第二代Versal Prime系列提供每秒約60幀的高精度流量,比Zyng MPSoC高出一倍的視頻處理面積,每路視頻流占板面積縮小35%。
總體而言,一代產(chǎn)品更多的是邊緣的傳感或者計算的卸載,而二代產(chǎn)品不僅一代產(chǎn)品功能的補充,更能以中央計算的能力應(yīng)對不同的場景。
以斯巴魯為代表,試用計劃已經(jīng)展開
斯巴魯(Subaru)是一家知名的汽車整車供應(yīng)商,在其視覺系統(tǒng)EyeSight 中采用第二代Versal AI Edge系列,實現(xiàn)了碰撞前制動、車道偏離預(yù)警、自適應(yīng)巡航控制和車道保持輔助等功能。之所以選擇AMD第二代Versal AI Edge系列,就是看中了它在確保安全可靠前提下的低時延、先進的數(shù)據(jù)類型支持、高吞吐量以及高精度的特點,借以鞏固其在下一代視覺系統(tǒng)在AI方面的領(lǐng)先地位。
第二代Versal AI Edge系列可編程邏輯的靈活性,對斯巴魯來也頗具價值——利用在可編程邏輯中實現(xiàn)的反饋IP,斯巴魯下一代EyeSight系統(tǒng)可以實時修改攝像頭的傳感器參數(shù),同時維持其全年消除致命性道路事故的安全目標。
早期的試用計劃已經(jīng)展開,目前AMD正與包括斯巴魯在內(nèi)的主要客戶進行接洽,采用第一代評估板和設(shè)計工具展開設(shè)計與推廣應(yīng)用。
產(chǎn)品路線圖公布:關(guān)注2025
第二代的Versal AI Edge系列和第二代的Versal Prime系列產(chǎn)品芯片的樣片將于2025年上半年發(fā)布,評估套件和系統(tǒng)模塊將于2025年年中推出,量產(chǎn)芯片將于2025年末面世。
“AMD此次推出的單芯片的智能用于支持嵌入式系統(tǒng),應(yīng)對無處不在的人工智能?!盡anuel總結(jié)說,“很難預(yù)測5年之后人工智能將會發(fā)展到什么樣的程度,但AMD將始終深度參與相關(guān)的創(chuàng)新和發(fā)展,以領(lǐng)先的產(chǎn)品和解決方案不斷改變我們的生活方式。”