![]()
在AI phone成為智能手機行業(yè)的下一個主流方向后,端側(cè)AI成為了從“通信工具”向“智能體”迭代的關(guān)鍵底座。
簡單來說,端側(cè)AI就是指將AI模型與算力集成到智能手機本地(如NPU、CPU+GPU異構(gòu)計算單元),實現(xiàn)數(shù)據(jù)的本地采集、處理與決策,而非依賴云端服務器。
其核心特征可概括為四點:??低延遲??(本地處理無需網(wǎng)絡傳輸,響應速度達毫秒級)、??高隱私??(數(shù)據(jù)存儲與計算均在設(shè)備端,杜絕泄露風險)、??離線可用??(無網(wǎng)絡環(huán)境下仍能執(zhí)行智能任務)、??個性化??(通過本地學習適應用戶習慣,提供定制化服務)。
而作為整個智能手機芯片的最上游供應商——Arm,也開始將Arm架構(gòu)的升級方向聚焦到端側(cè)AI。目前全球99%的智能手機都采用Arm架構(gòu),基于Arm架構(gòu)的芯片出貨量迄今已累計超過3100億顆。
Arm Unlocked AI技術(shù)峰會上海站期間,Arm推出了全新的Arm Lumex計算子系統(tǒng)(Compute Subsystem,CSS)平臺。Arm方面稱,這是一套專為旗艦級智能手機及下一代個人電腦加速其人工智能(AI)體驗的計算平臺。
搭載SME2技術(shù)的CPU,AI性能提升五倍
新的CPU架構(gòu)中,Arm發(fā)布了搭載SME2(第二代可伸縮矩陣擴展技術(shù))的Arm C1 CPU集群。
“SME2是SME的新一代版本。第一,它新增了更多指令集,可進一步提升性能和能效。第二,它支持更小的數(shù)據(jù)類型——具體而言是2 bit和4 bit。”
Arm終端事業(yè)部產(chǎn)品管理副總裁James McNiven表示,隨著每年高度量化模型的不斷增多,這類小數(shù)據(jù)類型在移動生態(tài)系統(tǒng)中的重要性正日益凸顯。這也是我們重點將SME2整合到Arm Lumex平臺中的原因所在。
Arm C1 CPU集群為實際場景中的AI驅(qū)動型任務帶來了顯著的AI性能提升,包括:AI性能提升高達五倍,語音類工作負載延遲降低4.7倍,音頻生成速度提升2.8倍。
此外,通過Arm、支付寶與vivo的三方合作下,將大語言模型(LLM)的交互響應時間縮短了多達40%,證明了SME2可為終端設(shè)備帶來更快速的實時生成式AI體驗。
除了速度的提升,在搭載SME2的單個核心上運行神經(jīng)攝像頭降噪功能,可以在1080P分辨率下實現(xiàn)幀率超120幀/秒 (fps),或在4K分辨率下實現(xiàn)幀率達30fps。這使得智能手機用戶即使身處光線最暗的場景,也能捕捉到更銳利、清晰的圖像。
“我想強調(diào)的是,由于SME2直接集成到了CPU當中,在工作負載的支持上能起到高度可擴展性。這意味著,SME2 帶來的AI功能不僅能應用于4000元以上的高端手機,還能下沉到2000元等不同價位段的手機中,最大幅度地推廣AI技術(shù)落地。”Arm高級副總裁兼終端事業(yè)部總經(jīng)理Chris Bergey表示。
Mali GPU,讓AI推理性能提升最高20%
CPU之外,全新的Arm Mali G1-Ultra GPU則搭載了新一代光線追蹤單元RTUv2。
與前一代Arm Immortalis-G925 GPU相比,Mali G1-Ultra的光線追蹤性能提升高達兩倍,并在主流圖形基準測試中,性能表現(xiàn)提升20%。在AI方面,通過新的FP16矩陣計算路徑,該GPU在AI與機器學習網(wǎng)絡上的推理速度比 Immortalis-G925快20%。
在邊緣計算方面,Mali G1-Ultra引入新的矩陣乘法單元(MMUL) FP16指令,可加速如語義分割、去噪、深度估計、物體檢測、語音識別和圖像增強等端側(cè)關(guān)鍵AI工作負載。與上一代Immortalis-G925相比,其性能提升高達104%。
Arm提供的數(shù)據(jù)顯示,目前搭載Arm GPU的芯片累計出貨量突破120億顆。
“AI已不再僅僅是一項技術(shù)功能,它已成為下一代移動與消費技術(shù)的支撐底座。依托Arm Lumex平臺,我們持續(xù)提升端側(cè)AI體驗,以滿足用戶日益增長的需求與期待。”
Arm高級副總裁兼終端事業(yè)部總經(jīng)理Chris Bergey表示,從出貨量角度來看,手機行業(yè)的增長已趨于平緩。但是,我們?nèi)蕴幱贏I發(fā)展的初期階段,尤其是在手機領(lǐng)域,AI正推動著更高的計算需求,并創(chuàng)造全新的價值。
此外,Chris Bergey還強調(diào)領(lǐng)先的手機廠商——無論是蘋果還是三星——都已不同程度地朝著自研芯片的方向發(fā)展。這實際上是整個泛半導體行業(yè)所面臨的趨勢,Arm CSS平臺正是順應這一趨勢而生。
“我們提供一個經(jīng)過驗證的計算基礎(chǔ),讓客戶能夠以相對較低的成本實現(xiàn)自身所需的定制化。”
Chris Bergey稱,Arm CSS平臺真正的價值并非是“做出比Arm工程師設(shè)計的更優(yōu)秀的Arm CPU”,而是客戶通過在 Arm 平臺基礎(chǔ)上構(gòu)建自己的SoC,額外創(chuàng)造更大的商業(yè)價值。(本文首發(fā)于鈦媒體APP,作者 | 饒翔宇 編輯 | 鐘毅)

快報
根據(jù)《網(wǎng)絡安全法》實名制要求,請綁定手機號后發(fā)表評論
端側(cè) AI 高隱私,數(shù)據(jù)不跑云端,再也不怕個人信息泄露,安全感拉滿!
手機從工具變智能體,端側(cè) AI 是關(guān)鍵,Arm 這架構(gòu)升級算打好基礎(chǔ)了!
Arm 抓準端側(cè) AI 趨勢升級架構(gòu),幫手機廠商跟上節(jié)奏,太懂行業(yè)需求了!
Mali GPU AI 推理快 20%,邊緣計算性能提 104%,手機處理 AI 任務更給力了!
端側(cè) AI 成手機剛需,Arm 都專門升級架構(gòu)了,看來以后手機 AI 會更厲害!
Arm Lumex 平臺不光服務旗艦機,還能下沉到 2000 元機,AI 普及要加速了!
端側(cè) AI 讓手機從通信工具變智能體,這迭代速度,感覺手機越來越 “聰明” 了!
廠商用 Arm 平臺做自研 SoC,成本低還能定制,這對中小廠商太友好了!
神經(jīng)攝像頭降噪能 4K 30fps,暗光拍照也清晰,以后夜拍不用愁了!
1080P 120fps 的降噪效果,拍視頻畫面更穩(wěn)更清楚,視頻博主有福了!