Arm終端事業(yè)部產(chǎn)品管理總監(jiān)Ronan Naughton

根據(jù)Arm公布的數(shù)據(jù),在同等條件下,啟用SME2的C1 CPU集群可帶來高達(dá)5倍的AI性能提速和3倍的能效優(yōu)化。這意味著用戶可以在手機上體驗更流暢、響應(yīng)更迅速的AI交互,同時享受更長的電池續(xù)航。具體到應(yīng)用層面,SME2的加持使得語音工作負(fù)載延遲降低4.7倍,在Google Gemma 3模型上進(jìn)行聊天交互的AI性能增長4.7倍。

3

Mali G1-Ultra GPU

移動端的光追與AI新高峰

在圖形處理和并行計算方面,全新的Arm Mali G1-Ultra GPU同樣實現(xiàn)了巨大突破。作為Arm迄今性能最強的移動GPU,Mali G1-Ultra專為新一代手游和AI體驗而生。其最引人注目的升級是搭載了第二代光線追蹤單元(RTUv2)

與上一代相比,RTUv2帶來了高達(dá)2倍的光線追蹤性能提升,使移動設(shè)備能夠渲染出桌面級的光照、陰影和反射效果,極大地增強了游戲的沉浸感。在《暗區(qū)突圍》、《原神》等主流游戲中,Mali G1-Ultra也實現(xiàn)了全面的性能增強,圖形性能平均提升20%。

除了游戲,GPU在AI計算中也扮演著重要角色。Mali G1-Ultra引入了新的FP16矩陣計算路徑,使其在AI與機器學(xué)習(xí)網(wǎng)絡(luò)上的推理速度比上一代Immortalis-G925快上20%,可有效加速語義分割、圖像增強等AI工作負(fù)載。

4

生態(tài)系統(tǒng)與開發(fā)者賦能

加速AI應(yīng)用落地

強大的硬件需要完善的軟件生態(tài)來釋放其全部潛力。Arm深諳此道,在推出Lumex CSS平臺的同時,也為開發(fā)者提供了無縫的開發(fā)體驗。核心在于Arm KleidiAI軟件庫。

KleidiAI是一個面向AI框架開發(fā)者的計算內(nèi)核庫,它封裝了對底層硬件(如SME2)的優(yōu)化。這意味著開發(fā)者無需深入了解復(fù)雜的硬件指令,甚至無需修改任何代碼,只要他們使用的AI框架(如Google LiteRT、阿里巴巴MNN、微軟ONNX Runtime)集成了KleidiAI,其應(yīng)用就能自動獲得SME2帶來的硬件加速能力。

“得益于SME2技術(shù)增強的硬件,像Gemma 3這樣更先進(jìn)的AI模型能夠直接在各類設(shè)備上運行。隨著SME2的持續(xù)擴(kuò)展,移動開發(fā)者將能在整個生態(tài)系統(tǒng)中無縫部署新一代AI功能?!薄?Iliyan Malchev, Google安卓平臺杰出軟件工程師

目前,KleidiAI已集成至所有主流移動操作系統(tǒng)和AI框架中。包括三星、阿里巴巴、騰訊、vivo在內(nèi)的眾多行業(yè)領(lǐng)導(dǎo)者已與Arm展開合作,共同推動端側(cè)AI技術(shù)的創(chuàng)新和落地。

結(jié)語:

Arm Lumex CSS平臺的發(fā)布,正值移動AI市場全蓬勃發(fā)展之際。市場研究機構(gòu)預(yù)測,未來幾年端側(cè)AI芯片市場將以超過20%的年復(fù)合增長率高速擴(kuò)張。Lumex平臺的推出,不僅鞏固了Arm在移動計算領(lǐng)域的領(lǐng)導(dǎo)地位,更通過平臺化的方式,降低了AI硬件的開發(fā)門檻,有望加速“AI手機”、“AI PC”等新物種的普及。

通過將強大的AI計算能力置于用戶設(shè)備端,Lumex平臺解決了云端AI在延遲、隱私和網(wǎng)絡(luò)連接方面的固有挑戰(zhàn),使得更復(fù)雜、更個性化的實時智能體驗成為可能。從無需聯(lián)網(wǎng)的實時語音翻譯,到能即時提供姿勢反饋的AI健身教練,再到捕捉驚艷夜景的計算攝影,一個“更智能、更高效、更個性化”的消費電子設(shè)備新時代正拉開序幕。

Arm預(yù)計,到2030年,SME與SME2技術(shù)將為超過30億臺設(shè)備新增超100億TOPS的計算能力。Arm Lumex CSS平臺作為這一宏偉藍(lán)圖的起點,無疑將成為未來移動創(chuàng)新的核心驅(qū)動力,引領(lǐng)行業(yè)邁向一個真正的“無處不AI”的未來。

分享到

lixiangjing

算力豹主編

相關(guān)推薦