2026年2月7日 星期六

Arm Ethos-U-Vela 可支援的 TFLite 運算子

作者:Jack OmniXRI, 2026/02/06

Workflow Cortex-M and Ethos-U

參考資料來源:
https://gitlab.arm.com/artificial-intelligence/ethos-u/ethos-u-vela/-/blob/main/SUPPORTED_OPS.md

Arm 為了讓 Cortex-M55/M85/M82 單晶片(MCU)更適用於 AI 推論應用,通常會搭配微型神經網路處理器(MicroNPU) Ethos-U55/U65/U85 進行硬體加速。為了讓 PyTorch / TensorFlow 等框架訓練出來模型能更順利在這種組合的晶片上運行,通常會先將模型轉換成 TensorFlow Lite (*.tflite)格式,最後再經過 Arm Vela Compiler 轉換成適合 MCU 及 NPU 的 TFLite 格式( *_vela.tflite)。

轉換過程中若 TFLite 運算子(Operators, Ops)可滿足 NPU 硬體特性,則 Vela Compiler 會將其送至 NPU 執行,其它無法處理的運算子就交給 MCU 處理。Cortex-M55/M85/M82 使用 M-Profile Vector Extension (MVE 或稱 Helium) 指令集,可處理向量計算,搭配 Arm CMSIS-NN 函式庫可大幅優化及加速計算。

為了讓大家更清楚不同的 MicroNPU 可以支援哪些 TFLite(現稱 LiteRT) 運算子,可參考下表。更多的使用方式及限制可參考原文

Vela 版本:4.5.0

Ethos-U55/U65Ethos-U85說明
ABSABS取絕對值
ADDADD加法
ARG_MAXARG_MAX取多項中最大值
AVERAGE_POOL_2DAVERAGE_POOL_2D2D 平均池化
BATCH_MATMUL批次矩陣乘法
CAST資料強制轉型
CONCATENATIONCONCATENATION張量合併
CONV_2DCONV_2D2D 卷積
DEPTHWISE_CONV_2DDEPTHWISE_CONV_2D
DIV除法
EQUAL相等
EXPEXP指數
EXPAND_DIMSEXPAND_DIMS擴張資料為1的維度
FULLY_CONNECTEDFULLY_CONNECTED全連結
GATHER索引提取
GREATER大於
GREATER_EQUAL大於等於
HARD_SWISHHARD_SWISH激活函數HARD_SWISH
LEAKY_RELULEAKY_RELU激活函數LEAKY_RELU
LESS_EQUAL小於等於
LOG對數
LOGICAL_AND邏輯與
LOGICAL_NOT邏輯反
LOGICAL_OR邏輯或
LOGISTICLOGISTIC激活函數Sigmoid
MAXIMUMMAXIMUM最大值
MAX_POOL_2DMAX_POOL_2D2D 最大池化
MEANMEAN平均值
MINIMUMMINIMUM最小值
MIRROR_PADMIRROR_PAD鏡向填充
MULMUL乘法
NOT_EQUAL不等於
PACK多維資料堆疊
PADPAD擴大維度填充
PADV2擴大維度填充
PRELUPRELU激活函數PRELU
QUANTIZEQUANTIZE量化數值
REDUCE_ALL資料縮減(邏輯與)
REDUCE_ANY資料縮減(邏輯或)
REDUCE_MAX資料縮減(最大值)
REDUCE_MIN資料縮減(最小值)
RELURELU激活函數RELU
RELU6RELU6激活函數RELU6
RELU_0_TO_1RELU_0_TO_1激活函數RELU 0~1
RELU_N1_TO_1RELU_N1_TO_1激活函數RELU -1~1
RESHAPERESHAPE改變資料維度
RESIZE_BILINEARRESIZE_BILINEAR雙線性內插縮放
RESIZE_NEAREST_
NEIGHBOR
RESIZE_NEAREST_
NEIGHBOR
最近鄰插值縮放
REVERSE_V2反轉資料
RSQRTRSQRT平方根導數
SHAPE取得資料維度
SCATTER_ND數據散佈到張量
SELECT條件式選擇
SELECT_V2條件式選擇
SLICESLICE提取子區域
SOFTMAXSOFTMAX激活函數SOFTMAX
SPLITSPLIT子區域分割
SPLIT_V子區域分割
SQUARED_DIFFERENCESQUARED_DIFFERENCE差值平方
SQUEEZESQUEEZE移除資料為1的維度
STRIDED_SLICESTRIDED_SLICE
SUBSUB減法
SUMSUM加線
TANHTANH激活函數TANH
TILE資料平鋪(複製)
TRANSPOSETRANSPOSE矩陣轉置
TRANSPOSE_CONVTRANSPOSE_CONV反卷積
UNIDIRECTIONAL_
SEQUENCE_LSTM
UNIDIRECTIONAL_
SEQUENCE_LSTM
LSTM單向序列資料優化
UNPACKUNPACK張量拆解

更多關於 Ethos-U55/U65 及 Ethos-U85 的完整介紹,可參考下列連結。


沒有留言:

張貼留言

【頂置】簡報、源碼、系列文快速連結區

常有人反應用手機瀏覽本部落格時常要捲很多頁才能找到系列發文、開源專案、課程及活動簡報,為了方便大家快速查詢,特整理連結如下,敬請參考! Edge AI Taiwan 邊緣智能交流區 全像顯示與互動交流區 台科大(NTUST)邊緣人工智慧實務(2026) 南開科大...