(題圖 via AnandTech

過去幾年,機(jī)器學(xué)習(xí)技術(shù)的應(yīng)用已變得相當(dāng)普及,可見其在廣泛的行業(yè)和各種系統(tǒng)中。ARM 認(rèn)為終端 AI 市場會在未來幾年中迎來爆炸性增長,新 IP 就是為此做準(zhǔn)備。

首先介紹下 Cortex-M55,它是與 M33 聯(lián)系更加緊密的新一代 IP,引入了體系架構(gòu)上的新改進(jìn),能夠在機(jī)器學(xué)習(xí)和矢量指令方面實現(xiàn)較大的性能和靈活性改進(jìn)。

2.png

Ethos-U55 是專用的 microNPU 推理加速器,可與 Cortex-M 系列 CPU 結(jié)合使用,帶來專門面向于 NPU 的性能與能效提升。

與 Cortex-M 系列內(nèi)核一樣,Ethos-U55 的空間占用也比較少。至于 Cortex-M55,則是首款具有 Helium / 定制指令能力的 CPU 內(nèi)核。

3.png

Helium 特指 M-Profile Vector Extension(簡稱 MVE),屬于 M 系列 CPU 中的新矢量擴(kuò)展和專用矢量執(zhí)行單元,使之成為該范圍內(nèi)首款具有單指令多數(shù)據(jù)流(SIMD)功能的產(chǎn)品。

新增功能使得新內(nèi)核的 DSP 性能提升了 5 倍,結(jié)合針對機(jī)器學(xué)習(xí)工作負(fù)載的優(yōu)化指令和 MVE,整體表現(xiàn)可提高至 15 倍。

4.png

整體微架構(gòu)方面,新 IP 算是繼承了 M33 和 μarch 。在頻率提升的加持下,它將標(biāo)量工作負(fù)載的性能提升了大約 20%,具體取決于供應(yīng)商的配置。

新內(nèi)核的設(shè)計重點,同樣體現(xiàn)在帶寬上。其啟用了需要帶寬的新 MVE 和機(jī)器學(xué)習(xí)工作負(fù)載,因此對內(nèi)存子系統(tǒng)進(jìn)行了改進(jìn),比如 4×32-bit 接口與緊密耦合內(nèi)存(TCM)。

5.png

盡管 ARM 進(jìn)入 NPU 領(lǐng)域的時間相對較晚,但新推出的 Ethos-U55 microNPU,還是較嵌入式市場有著獨特的意義。與移動 SoC 上更大的 Ethos-N 系列相比,它的面積和功耗要低得多。

Ethos-U55 是一種小型 NPU,可從 32 路擴(kuò)展到 256 MAC、且需要與 Cortex-M 系列 NPU 耦合。

6.png

ARM 未提及微體系架構(gòu)的主要細(xì)節(jié),但可知它是一種非常精簡的設(shè)計,注重的是面積和能源效率、具有較小的內(nèi)存占用量,其中包含我們在 N 系列產(chǎn)品中見到的一些特性,如 Weight Decompression 。

即便如此,它與 N 系列在功能上并沒有太大區(qū)別,因為該 IP 已包含 M 系列 CPU 。據(jù)說其架構(gòu)與 NPU 有所不同(與更大的兄弟無關(guān)),且是專門為低功耗用例而設(shè)計。

7.png

就面積大小而言,U55 最小的 32 MAC 實現(xiàn),約為 M55 的 2 倍。這里沒有絕對的數(shù)字提供,實際上討論的是平方毫米的分?jǐn)?shù)。

與上一代解決方案相比,使用 M55 和 U55 的此類系統(tǒng),其性能改進(jìn)意味著相當(dāng)重要的步進(jìn)功能提升。與基于 Cortex-M7 的系統(tǒng)相比,ARM 帶來了包含 50 倍的性能提升、以及 25X 的能效改進(jìn)。

至于新 IP 的可用領(lǐng)域,ARM 展望了各式各樣的嵌入式系統(tǒng)(主要是現(xiàn)有的芯片子系統(tǒng))。比如在移動設(shè)備上,廠商可在手機(jī)的指紋傳感器、語音助理(實時監(jiān)聽指令)、甚至在 RF 系統(tǒng)中(如天線調(diào)諧)使用它來優(yōu)化工作負(fù)載。

當(dāng)今的移動設(shè)備中,有數(shù)百種 M 系列 CPU 可從機(jī)器學(xué)習(xí)功能中獲益,且其中大多數(shù)功能對用戶來說是完全透明的。

目前 ARM 已向主要合作伙伴開放 M55 和 U55 的授權(quán),并將在未來幾個月內(nèi)向更廣泛的客戶群開放,預(yù)計最終產(chǎn)品可在廠商二次開發(fā)的兩年后走向市場。

分享到

zhupb

相關(guān)推薦