2026年6月29日 星期一

2026 台灣AI晶片發展現況及未來挑戰

 

作者:許哲豪(Jack Hsu), OmniXRI, 2026/03/06
本文已授權新電子科技雜誌社 2026 年五月及六月號刊登

20260304_Taiwan_AI_Chip

前言

為了讓大家更清楚台灣目前在推論用 AI 晶片、相關開發板及其配套開發工具的自主性,特別整理了18家公司,近90個相關晶片及開發板,分成5大類型,還有4套AI開發工具,希望這些資料能讓大家更了解產業發展發展現況及未來挑戰。文末有提供所有廠商和相關產品的連結,也有補充一些相關文章,或許能幫助大家對這些晶片及開發板有更進一步的認識。整理過程中難免疏漏,還請多多指教。

AI 興起與技術演進

2012 年 Geoffrey Hinton 教授帶著學生以深度學習(Deep Learning, DL)「卷積神經網路」(Convolution Neural Network, CNN) AlexNet 贏得全球最大規模電腦視覺辨識挑賽 ILSVRC (ImageNet)冠軍,大幅將錯誤率從25%降到15%,從此開啟新一波 「鑑別式 AI」 (Discriminative AI) 浪潮。

2022年底 OpenAI 基於 「轉換器」(Transformer) 技術的 ChatGPT 現世,開啟了超巨量資料(據推估約45TByte)加上超巨量參數模型(據估約 175B, 1750億以上)完成接近人類自然對話能力的 「大語言模型」(Large Language Model, LLM),於是有了 「生成式 AI」(Generative AI, GenAI) 百花齊放的時代。

隨著半導體製造及模型壓縮技術的快速迭代,生成式 AI 已從單純文字對話型式,演進到文字、影像/影片、聲音混合輸出入的 「多模態模型」(Multimodal) 及結合電腦視覺及語音辨識的 「視覺語言模型」(Vision-Language Model, VLM)。近年來更是從單純電腦計算進化到可與真實物理世界互動的 「視覺─語言─動作模型」(Vision-Language-Action, VLA),加上能深度思考及串接各項 AI API 服務的 「代理型 AI」 (Agentic AI),讓科幻電影中的各式機器人也能有機會出現在現實生活中。

AI_Model_history
Fig. 1 AI(神經網路)技術演進。(OmniXRI整理製作,2025/11/29)

政府投入及聚焦方向

在這幾波的AI浪潮中,各國莫不投入大量資源來搶佔這個市場,不管是 AI 的晶片設計製造、異質晶片整合、運算機台機房、模型訓練推論軟體平台、領域應用軟體開發及人才培訓都是重點。

行政院於2018年9月成立 「AI on Chip示範計畫籌備小組」,規劃並聚焦產學研共識之技術研發項目。針對「半通用AI晶片」、「異質整合 AI 晶片」、「新興運算架構 AI 晶片」與「AI 晶片軟體編譯環境開發」等四個議題,制定我國 AI on Chip 發展藍圖。[1]

基於此一計畫,2019 年 台灣人工智慧晶片聯盟(AI-on-Chip Taiwan Alliance, AITA 諧音愛台聯盟) 正式成立,結合國內外產學研單位,設立「AI 系統應用」、「異質 AI 晶片整合」、「新興運算架構 AI 晶片」、「AI 系統軟體」四大關鍵技術委員會。[2]

2023年底政府更提出 「晶片驅動臺灣產業創新方案」(簡稱「晶創臺灣方案」),規劃2024到2033年要挹注3,000億元經費,第一期自2024年啟動,為期五年,主要運用我國半導體晶片製造與封測領先全球的優勢,結合生成式 AI 等關鍵技術發展創新應用,提早布局臺灣未來科技產業,並推動全產業加速創新突破。包括四大領域,結合生成式 AI + 晶片帶動全產業創新、強化國內培育環境吸納全球研發人才、加速產業創新所需異質整合及先進技術、利用矽島實力吸引國際新創與投資來臺。[3]

雲端訓練/邊緣推論?

俗話說分久必合、合久必分,在 AI 領域中亦存在究竟要在雲端亦或在本地(邊緣)端執行的激烈討論。目前 AI 應用上主要分成模型「訓練」及「推論」,前者需要超巨量計算,必須使用超高單價、超高性能的設備甚至機房才能完成,因此多半由特定商業巨頭或大型科研單位建置後再以雲端服務租用方式提供給使用者。

而後者算力需求較小隨著客端應用情境、模型大小、推論精度、推論速度、反應即時性、資料隱私性、功率消耗、系統整合、設備單價、同時請求數量及平均推論成本等不同需求,適用的推論設備可能從台幣數百元到數百萬元不等,有時為了得到更好性價比及彈性,甚至可以採用雲端和邊緣端的混合方案。

目前 AI 訓練端幾乎都被輝達(NVIDIA)的 GPU、谷歌(Google)的 TPU 佔據,台灣的台積電(TSMC)、眾多半導體封測廠、工業電腦及 AI 伺服器大廠提供了極佳的技術及產能,對全球 AI 市場的推動功不可沒,但可惜這些全部是代工,並無法直接對台灣本土 AI 晶片產業建立核心技術提供實際助力。

而在 AI 推論端,NVIDIA 和 GOOGLE 就不一定是必然選擇了,由大到小,大致可分為五個等級。[4][5][6]

  • 邊緣伺服器(Edge Server):提供公司內網使用的邊緣運算主機,讓多個週邊裝置共用一個智慧大腦,如 Nvidia EGX 等。
  • 個人電腦(AI PC):帶有 AI 加速推論 GPU / NPU 的筆電或桌機,可執行鑑別式及生成式AI應用,如 Intel, AMD, Qualcomm, Apple, Nvidia 等。
  • 行動通訊(Mobile AI):結合行動通訊及AI加速推論能力之設備,可執行鑑別式及生成式AI應用,Qualcomm, MediaTek 等。
  • 單板微電腦(Single Board Computer):採用多核心微處理器(MPU / SoC)或加上神經網路加速運算處理器(NPU)之設備,多半可執行鑑別式 AI 應用,少數力高的可執行生成式 AI 應用,如 Raspberry Pi, Kneron(耐能) Kneo Pi, Nvidia Jetson Orin 等單板微電腦,另有像 Hailo, DeepX 等獨立 NPU 擴展板配合單板微電腦使用。
  • 穿戴式(Wearable) AI:具有高度平行計算能力之單晶片(MCU)或加上神經網路加速運算處理器(NPU)之晶片,如 STM, NXP, ALIF, Nuvoton(新唐), Himax(奇景)及採用基於 Arm Helium(MVE)指令集加 Ethos-U MicroNPU 等。

vMaker_EdgeAI_17_Fig02
Fig. 2 不同等級的 Edge AI 方案。[4](OmniXRI整理製作,2024/05/15)

台灣 AI 晶片發展現況

目前大型 AI 晶片開發不易,建立生態系更是難上加難,所以大部份的國家都把重點放在邊緣端推論的 AI 晶片開發,尤其在神經網路處理器(NPU)、單板微電腦(SoC/MPU + NPU)和單晶片(MCU + NPU) [7] [8],台灣也不例外,從政府投入計畫的聚焦方向便可看出。

為了更清楚說明台灣有哪些推論用的 AI 晶片可提供開發者進行開發,這裡簡單分成下列幾個大類,接下來就依序作更完整的介紹。

20260304_Taiwan_AI_Chip_029
Fig. 3 台灣 AI 晶片五大分類主要供應商。(OmniXRI整理製作,2026/03/06)

半專用型

此類 AI 晶片通常為特定用途,如智慧健康、智慧交通、3D 感測等,開發者僅能撰寫程式處理週邊輸出入信號,如感測器或顯示器等。為了讓傳統嵌入式工程師不用懂 AI 原理及開發工具就能輕鬆整合,通常 AI 模型已由晶片廠預訓練好部署在晶片中或者僅提供小幅度客製化調整。由於 AI 終端產品開發時必須和晶片供應商有密切合作,所以此類晶片多半不太容易在網路上取得更進一技術規格甚至開發手冊。

20260304_Taiwan_AI_Chip_001
Fig. 4 台灣半專用型 AI 晶片供應商。(OmniXRI整理製作,2026/03/06)

盛群(Holtek)

盛群是台灣老牌通用型單晶片供應商,這兩年在原有客群基礎上加入小型 AI 應用,推出以 Arm Cortex-M4 為主核的 Edge AI 智慧健康 HT32 系列 [9],包括:

  • 2D IR 手勢辨識: 可精準識別多種手勢,實現靈活直覺的無接觸控制。包括六種基礎手勢及二種旋轉手勢。
  • 卡片式血壓計: 結合 CNN 與 BPNN 模型,濾除雜訊並精準預測血壓與心率,量測結果符合 AAMI 標準。
  • CGM健康量測: 24 小時不間斷追蹤血糖變化。採用 SVM 模型,具自適應調整能力;量測誤差低於 10%。
  • 體成份分析: 一次測量 PBF、SMM、TBW、礦物質,提供完整體成分評估。根據體型差異與分析結果,提供客製化的健康建議。

20260304_Taiwan_AI_Chip_002
Fig. 5 盛群(Holtek) 智慧健康 HT32 系列。(OmniXRI整理製作,2026/03/06)

義隆電(Elan)

義隆電是台灣老牌通用型單晶片供應商,在各種人機介面及觸控領域晶片有很多優秀產品。2020年和中研院資訊所廖弘源所長及王建堯博士合作推出 YOLOv4 影像物件偵測算法並應用於智慧交通,成為當下全世界最優秀的 AI 模型之一。後來又衍生出 YOLOv7/v9 將辨識能力及推論速度推到高點。義隆在此基礎上結合自家晶片推出很多視覺辨識產品[10],包括:

  • 智慧交通(ITS) 三合一監控系統整合了影像辨識、即時交通號誌控制和行人闖紅燈預測功能,無需外接設備。
  • 智慧汽車(Automotive): 先進駕駛輔助系統(ADAS)、智慧座艙觸控顯示技術(TDDI)、Mini-LED局部調光控制和AI感知能力。
  • 無人機(Drone): AI 提升影像辨識、控制和空拍性能,可實現目標追蹤和360°避障,更安全及精準的自主飛行。
  • 智慧穿戴(Wearable): 指尖輕鬆操控,透過點擊、雙擊和滑動等直覺式手勢即可無縫切換,不受汗水、溫度或濕度的影響。

20260304_Taiwan_AI_Chip_003
Fig. 6 義隆電(Elan) 智慧晶片系列產品。(OmniXRI整理製作,2026/03/06)

神盾(Egis)

神盾為知名指紋辨識系統供應商,2019年獲得經濟部「AI on chip」 計畫,推出世界第一顆基於可重組類比 AI 運算技術之屏下大面積光學指紋辨識晶片[11],透過AI大量指紋圖庫運用類比AI電路的設計與自我學習,即使在指紋成像品質不佳的情況下,仍有效辨別特徵點,增強指紋的辨識率,創造出低成本、低功耗、高效能,以及防偽能力強的優勢產品。

20260304_Taiwan_AI_Chip_004
Fig. 7 神盾(Egis) 光學指紋辨識晶片。(OmniXRI整理製作,2026/03/06)

鈺立微(EYS3D)

鈺立微是鈺創子公司,主要提供各種 3D 感測晶片、模組,可應用於 3D 影像辨識、機器人避障、地圖建置等。2025年底推出輕量級邊緣 AI 即時運算感測融合 ‒ XINK Nano 平台[12],具備高效能 NPU,可支援 RGB 與 ToF (Time of Flight) 雙感測融合運算技術,可於本地端直接運算判斷,支援 YOLOv8、姿態估測等常見 AI 模型。目前已成功導入智慧停車解決方案,包括車格即時管理、智慧車牌辨識及充電系統整合與科技執法。主要包括:

  • eCV-5 Arm Cortex-A55 4核 + Cortex-M4 2核 + NPU(5TOPS)。
  • eCV-4 Arm Cortex-A55 2核 + DSP。

20260304_Taiwan_AI_Chip_005
Fig. 8 鈺立微(EYS3D) 3D 感測 AI 晶片及相關產品。(OmniXRI整理製作,2026/03/06)

NPU IP 型

通用型神經網路處理器(NPU)或稱深度學習加速器(DLA)是 AI 晶片最不可或缺的核心,可以取代 GPU 在推論時高耗能的問題。台灣目前僅有少數 IC 設計公司有能力提供相關矽智財(IP)給通用型單晶片(MCU)、微處理器(MPU)或系統級晶片(SoC)設計公司進行整合設計。

由於 AI 算法演進速度太快,常用運算子(Operator)已發展到上千種,因此 NPU 在既要提高推論效能又要保持開發彈性下,不可能全部支援,多半只會把重點放在矩陣運算及基礎數學效能上,部份計算則交回 CPU 處理,若加上 AI 開發框架(如 TensorFlow, PyTorch等)的相容問題,就會讓 NPU 程式開發更為麻煩。隨著各家 IC 設計公司對開發晶片整體時間的壓縮,並期待有更完整的驗證和實績,促使很多 NPU IP 提供商也開始推出自有品牌的 AI 晶片甚至是開發板。

20260304_Taiwan_AI_Chip_006
Fig. 9 台灣 NPU IP型 AI 晶片供應商。(OmniXRI整理製作,2026/03/06)

耐能(Kneron)

耐能(Kneron)是最早提出 NPU 概念並實現的公司之一,其主要核心為自家最引以為傲的可重構神經網路(RANN)專利技術,以較彈性作法令晶片在運行不同尺寸的模型時具有即時調整硬體配置作法,其 NPU IP KDP [13]系列已發展到第四代,除授權給其它廠商外,亦有自製 KL 系列 SoC,主要包括:

  • KDP 300 (超低功耗版)
  • KDP 500 (152GOPS@500MHz)
  • KDP 700 (第二代NPU 5.8TOPS)
  • 第三代NPU KL830(for Edge GPT)
  • 第四代NPU KL1140(for Mamba)

英業達(Inventech)

英業達(Inventech)主要是伺服器及筆電代工大廠,2023年推出
VectorMesh [14]系列 NPU IP,自研的 NPU 擁有低邏輯閘數(Gate count)與獨家高運算元(PEs)密度設計架構,於 PPA(效能/功耗/面積)表現出色。依據終端應用所需的算力大小共分三個系列。

  • Minima (for MCU)
  • Parva – P200 (16TOPS for VLM)
  • Magna ─ M100 (100TOPS for Model Training, AI PC, LMM)

晶心(Andes)

晶心(Andes)是世界知名 RISC-V CPU IP 供應商,近年來隨邊緣智慧需求,原先 CPU 中的平行 P(SIMD)及向量 V(Vector)擴展指令集已不夠用,於是推出 AndesAIRE AnDLA 系列[15],其重要規格如下。

  • AnDLA I350: 32~4096 MAC, 64GOPS ~ 8TOPS @1GHz
  • AnDLA I370: 2TOPS @1GHz, 可支援 RNN

MCU + NPU 型

台灣目前有數十家通用型及專用型單晶片生產廠商,其 CPU 內核從 Intel 8051系列到 Arm Cortex-M 系列都有,其中 Cortex-M 在 MCU 市佔率高達五成,若以 32 位元 MCU 來看更是佔據超過八成。傳統 Cortex-M4 以上等級內核已開始支援 DSP (SIMD) 平行運算指令集,可滿足聲音/關鍵字辨識、異常振動、運動手勢及智慧感測器等微型 AI (TinyML)應用。Cortex-M55/85/52 指令集(Arm v8.1M, Helium, MVE)更是有支援多組 128 位元向量計算,開始可以處理較小尺寸的影像辨識。

隨著影像類型 AI 應用越來越普及,CPU 已無法滿足,於是開始加入小型 NPU 來加速推論,目前在 MCU 等級以 Arm 的 MicroNPU Ethos-U55/U65/U85 有較多廠商採用 [7] [8]。這樣的架構已有很多開發工具可以支援,很方便一般開發者使用,可選用現成或自訂定義練訓好的 AI 模型經過轉換工具即可部署到 MCU 中,實現各種小型 AI 創意。

以下僅針對有帶 NPU 的 MCU 進行介紹。

20260304_Taiwan_AI_Chip_007
Fig. 10 台灣 MCU + NPU 型 AI 晶片供應商。(OmniXRI整理製作,2026/03/06)

奇景(Himax)

奇景(Himax)是一家專注在影像顯示驅動、車用、AR/VR微投影、CMOS影像感測器的 IC 設計公司,近年來在 MCU AI 領域亦有許多投入,生產出台灣第一顆使用 Arm Cortex-M55 + MicroNPU Ethos-U55 的單晶片 WisEyes 2 (WE2) - HX6538 [16],可用於影像分類、物件偵測、人臉特徵點、姿態偵測等 AI 應用。

WE2(HX6538)重要規格如下。

  • Arm Cortex-M55 2核 (150MHz, 400MHz)
  • Arm MicroNPU Ethos-U55 (400MHz)
  • SRAM 2432KB
  • 64KB Boot ROM
  • external 1~16MB QSPI Flash

另外亦有多個開發板使用 WE2,方便更多開發者開發自定義應用,包括:

20260304_Taiwan_AI_Chip_008
Fig. 11 奇景光電(Himax) WiseEye 2(HX6538) 及相關開發板。(OmniXRI整理製作,2026/03/06)

新唐(Nuvoton)

新唐(Nuvoton)為世界前十大的 MCU 供應商,產品線非常齊全,從 8051, Cortex-M0/M0+/M3/M4/M7/M23/M55 都有,其中 Cortex-M55 系列[17]是目前算力最強的 MCU,非常適合用於小型影像類 AI 應用。在這個系列有二個子項,M55M1 及 M5531,最主要的差別在於前者有 Arm MicroNPU Ethos-U55 而後者沒有。較完整規格如下所示。

  • Arm Cortex-M55 @220MHz
  • Arm MicroNPU Ethos-U55 @220MHz (110GOPS) (only M55M1)
  • SRAM 1.5MB
  • Flsh 2MB
  • 可外部擴充 HyperRAM/Flash, OSPI Flash

另外新唐自行製作了三種開發板,提供一般開發者使用。

20260304_Taiwan_AI_Chip_009
Fig. 12 新唐(Nuvoton) Cortex-M55 系列晶片及相關開發板。(OmniXRI整理製作,2026/03/06)

瑞昱(Realtek)

瑞昱(Realtek) 是知名無線網路、多媒體、消費性電子、電腦週邊控制晶片供應商,在智慧物聯網(AIoT)及網路攝影機(IPCam)領域有亦很多相關產品,為了擴展無線網路攝影機智慧影像辨識能力,推出帶有 NPU 的產品 AmebaPRO2(RTL8735B) [18],更完整規格如下所示。

  • 32bit Arm V8M, up to 500MHz
  • Intelligent Engine(NPU) @ 0.4TOPS (非 Arm NPU)
  • 768K ROM, 512K RAM, 16MB Flash, DDR2/3L up to 128MB
  • WiFi 2.4G/5G Hz, 802.11 a/b/g/n
  • BLE 5.1
  • up to 5MP or 1080P@45fps
  • H.264/265 encoder

另外瑞昱也有推出以此晶片的模組及開發板。

20260304_Taiwan_AI_Chip_010
Fig. 13 瑞昱(Realtek) RTL8735B 晶片及相關開發板。(OmniXRI整理製作,2026/03/06)

阿比特(Upbeat)

阿比特(Upbeat)在穿戴式裝置晶片有不少成果,近年來隨著智慧製造與無人系統興起,所以推出了全時(Always-On) AI 運算的微機電(MEMS)聲音振動感測器 UPM01 和低極功耗 AI 晶片 UP201/301[19],使用 RISC-V 作為主控 CPU,並利用 NN 和 DSP 引擎來加速訊號處理工作。重要的技術規格如下所示。

  • 異質 RISC-V 2核,
    • Always-On(E21) @32K~11MHz
    • Non-Always-On(E34) @25M~400MHz
  • 雙 NPU 可彈性調整計算效能
    • NPU2 Always-On
    • NPU1 Non-Always-On
  • SRAM 1.5MB, External OSPI Flash up to 256MB
  • GFX 2.5D GPU
  • 8-bit Parallel Camera(only UP301)

另外使用 UP201 也推出了開發板 Trina-Pi

20260304_Taiwan_AI_Chip_011
Fig. 14 阿比特(Upbeat) UP201/UP301 晶片及相關開發板。(OmniXRI整理製作,2026/03/06)

SoC/MPU + NPU 型

隨著鑑別式 AI 應用的普及,在系統級晶片(SoC)及微處理器(MPU)晶片中加入神經網路處理器(NPU)已是越來越常見,利用此類晶片可開發出各式通用型單板微電腦(SBC)或嵌入式開發板,只需搭配一般電腦等級使用的 AI 模型訓練及部署工具就能完成推論。

在此類型晶片中有幾乎都是使用 Arm Cortex-A 系列 CPU 內核,依不同代指令集,可能支援不同加速運算指令集,包括 v7 以上平行運算 NEON(SIMD)、v8-A 以上可伸縮向量擴展(SVE)、v9-A 可伸縮矩陣擴展(SME)及向量處理器(VPU)。雖然這些晶片可輕鬆跑小型影像類的 AI 應用,但遇到較大尺寸影像或較大參數量模型時可能就不夠用了。以下就只針對有自帶 NPU 的晶片,其它單純只使用 Arm Cortex-A 的 SoC/MPU 就暫時略過。

20260304_Taiwan_AI_Chip_012
Fig. 15 台灣 SoC/MPU + NPU 型 AI 晶片供應商。(OmniXRI整理製作,2026/03/06)

凌陽(Sunplus)

凌陽(Sunplus)是知名的專業IC設計公司,專注於車用數位影音、智能座艙(Smart Cockpit)、先進駕駛輔助系統(ADAS)及邊緣運算(Edge AIoT)晶片設計。近年致力於高性能運算、低功耗邊緣架構,應用於智慧機器人與AI PC等領域,其中 C3V 晶片(SP7350)[20] 及開發板最具代表性,其晶片重要規格如下。

  • Arm Cortex-A55 4核(@2.1GHz)
  • Arm Cortex-M4 @400MHz 284KB SRAM
  • AI Engine(NPU) 4.6TOPS@1GHz
  • DDR4 up to 8GB
  • H.264 Codec

另外使用這個晶片的開發有兩款,如下所示。

20260304_Taiwan_AI_Chip_013
Fig. 16 凌陽(Sunplus) C3V(SP7350) 及相關開發板。(OmniXRI整理製作,2026/03/06)

耐能(Kneron)

耐能(Kneron)除提供 NPU IP 外亦有將其技術整合成系統級 片(SoC)如 KL520 / KL720 系列,為方便開發者使用,有多種外觀型式,如 USB 加速棒、Mini PCIe 介面卡及開發板型式。最近為更貼近一般開發者,推出一款外觀尺寸、排針接口和樹莓派相容的開發板,名為「KNEO-Pi」[21],使用 KLM730A 晶片,主要規格如下所示。

  • Arm Cortex-A55 4核
  • KDP730 NPU (4eTOPS@INT8)
  • DSP (AI co-processor)
  • MJPEG/H.264/H2.65 Decoder
  • 樹莓派相容尺寸及GPIO排針
  • 可支援2組CSI及1組DSI

更完整 KNEO-Pi 開發參考手冊連結如下。

20260304_Taiwan_AI_Chip_014
Fig. 17 耐能(Kneron) KLM730A 晶片及相關開發板。(OmniXRI整理製作,2026/03/06)

聯發科(MediaTek)

聯發科(MediaTek)是世界知名手機晶片(SoC)供應商,早年在智慧物聯網(AIoT)興起年代 Linkit 7688/7697 系列幾乎是開發者的不二選擇。這兩年為了讓 AI 擺脫雲端可直接在裝置上執行,於是推出更強悍的「Genio」系列[22],讓嵌入式 AI 應用的開發者有更多的選擇。這個系列的晶片都有搭配 NPU(早期稱為 APU),從入門級到高階都有,可應用於各種場景,以下簡單列出相關產品規格。

晶片型號主要核心AI 算力主要應用
Genio 12004x A78 (2.2GHz)
4x A55 (2.0GHz)
4.8 TOPS頂級邊緣 AI:
智慧工業控制、企業級設備、
高階影音處理、三螢幕 4K 輸出。
Genio 7202x A78 (2.6GHz)
6x A55 (2.0GHz)
10 TOPS
(混合算力)
生成式 AI:
智慧零售、智慧城市、醫療設備、
支援 LLM 大語言模型。
Genio 7002x A78 (2.2GHz)
6x A55 (2.0GHz)
4.0 TOPS智慧家庭與零售:
互動式資訊站 (Kiosk)、
智慧家庭中控、自動販賣機。
Genio 5202x A78 (2.2GHz)
6x A55 (2.0GHz)
10 TOPS
(混合算力)
主流生成式 AI:
商用顯示器、
工業 HMI、智慧零售、
支援高效能 LPDDR5 記憶體。
Genio 5102x A78 (2.0GHz)
4x A55 (2.0GHz)
4.8 TOPS高效能數位看板:
數位廣告看板、智慧家電、
主流物聯網網關。
Genio 3504x A53 (2.0GHz)0.35 TOPS入門級物聯網:
健身器材、門禁系統、
可攜式零售裝置、語音輔助設備。

(註: CPU 皆為 Arm Cortex-A 系列)

目前已有多家廠商使用 Genio 系列晶片開發出單板微電腦及嵌入式開發板,這裡簡單列出幾個例子。

20260304_Taiwan_AI_Chip_015
Fig. 18 聯發科(MediaTek) Genio 系列晶片及相關開發板。(OmniXRI整理製作,2026/03/06)

聯詠(Novatek)

聯詠(Novatek)為知名平面顯示器驅動 IC 及影像處理系統單晶片的 IC 設計公司,近年來推出了一系列具有 AI 影像辨識的晶片[23],算力從 0.7 ~ 6.4 TOPS,讓開發者有更多選擇,適用於不同場景。

晶片型號主要核心AI算力主要應用
NT98692Cortex-A73 x46.4 TOPS8K 邊緣運算攝影機、後端XVR
NT98530Cortex-A53 x42.0 TOPS高階 4K 安防監控(IPC)
NT98529Cortex-A9 x21.0 TOPS中高階 IPC、人臉辨識
NT98568Cortex-A7 x20.5 TOPS電池型門鈴、智慧家居
NT98566Cortex-A9 x10.7 TOPSWi-Fi6 智慧相機
NT98632Cortex-A53 x20.75 TOPSNVR 錄影機、網路監控
NT98560Cortex-A9 x10.7 TOPS主流級影像監控

(註:聯詠官網並沒有列出完整產品表列及規格,以上規格為自行從網路收集整理,如有誤植,以聯詠官方資料為準)

另外由於聯詠的 NT985XX / NT986XX 相當受歡迎,所以有很多廠商將其製作成開發板或自家專用產品。如Fig. 19 所示。更多 AI 影像處理晶片介紹可參考下列影片。

Novatek_IVOT_Products
【YOUTUBE】 Novatek x AITG|聯詠ivot 晶片新技術應用與創新:AI-ISP, MLLM, NVR and NAS

20260304_Taiwan_AI_Chip_016
Fig. 19 聯詠(Novatek) AI 影像處理晶片及相關開發板。(OmniXRI整理製作,2026/03/06)

晶心(Andes)

晶心(Andes)是世界知名 RISC-V CPU IP 供應商,原先只授權並不自己製作晶片,近年來隨邊緣智慧需求,為了讓開發者能更容易進行 AI 相關應用開發,推出 AndesAIRE(Andes AI Runs Everywhere)[24],整合了 RISC-V CPU、加速指令集(P、V擴展)、AI 加速器(AnDLA)、AI 加速函式庫(NN/Vector/DSP Lib)及軟體開發包(SDK),同時也推出自有系統級晶片(SoC) 奇萊(QiLai)及開發板航海家(Voyager)。

  • QiLai(奇萊) 系統晶片
    • RISC-V AX45MP 4核(@2.2GHz)
    • NX27V 向量處理器(@1.5GHz)
    • 512bit VLEN, DLEN
  • Voyager(航海家) 開發板
    • QiLai SoC
    • 16GB DDR4, 16Mb SPI Flash
    • 支援 AndeSight, AndeSoft, AndesAIRE NN SDK

目前已有多家廠商使用 RISC-V 有帶 P 或 V 擴展指令集的 IP 製作出輕量 AI 開發板,如下所示。

20260304_Taiwan_AI_Chip_017
Fig. 20 晶心(Andes) AI 晶片及相關開發板。(OmniXRI整理製作,2026/03/06)

華碩(Asus)

華碩(Asus)是世界知名筆電供應商,為擴展嵌入式應用,多年前就有推出樹莓派相容開發板「Thinker Board」[25],之後隨著不同應用需求,逐漸發展成一個系列產品。雖然華碩本身沒有開發 AI 相關晶片,但這個系列提供了多種 AI 晶片的開發板,如下所示。

20260304_Taiwan_AI_Chip_018
Fig. 21 華碩(Asus) Thinker Board AI 相關開發板。(OmniXRI整理製作,2026/03/06)

生成式 AI 型

在生成式 AI 應用中不管是文字、影音生成,通常需要用到數十億(1B)到數千億(數百B)個參數才能完成推論,對於算力及記憶體需求極高,若想要在邊緣端進行推論,只能選擇較小的模型(7B甚至1B以下)並將參數(權重)從32位元浮點數(FP32)降至4位元整數(INT4)。生成式應用多半使用 Transformer 類型模型,傳統的 NPU 並不一定適用,因此需要新一代 NPU 才能支援。

20260304_Taiwan_AI_Chip_019
Fig. 22 台灣生成式 AI 型晶片供應商。(OmniXRI整理製作,2026/03/06)

聯發科(MediaTek)

聯發科(MediaTek)是世界知名手機晶片(SoC)供應商,早在數年前鑑別式 AI 興起時就已在天璣系列晶片內置 APU(八代後改稱NPU)來加速推論,在天璣(Dimensity) 9300 後就開始加入生成式推論引擎,最新的天璣 9500[26]更是採用了雙 NPU 及支援更多的模型可以在晶片上執行。天璣 9500 的重要規格如下所示。

  • CPU:
    • 1x Arm C1-Ultra @4.21GHz
    • 3x Arm C1-Premium @3.5GHz
    • 4x Arm C1-Pro @2.7GHz
  • GPU: Arm Mali-G1-Ultra MC12
  • NPU 990 (約 100TOPS)

更多天璣(Dimensity)系列晶片規格如下所示。

晶片型號APU/NPUAI 算力主要用途
天璣 9000APU59014 TOPS導入 ETHZ AI Benchmark v5 標準;
多模態融合運算
天璣 9200APU69018 TOPS混合精度運算;
AI 影像超分(AI-SR)優化
天璣 9300APU790約 30~40 TOPS硬體級生成式 AI 引擎;
支援 33B 參數模型;LoRA Fusion 技術
天璣 9400NPU890約 50 TOPSAgentic AI 引擎;50 tokens/sec
生成速度;時域張量加速
天璣 9500NPU990約 100 TOPS雙 NPU 設計(高功耗+低功耗);
支援 BitNet 1.58-bit;4K 影像生成

20260304_Taiwan_AI_Chip_020
Fig. 23 聯發科(MediaTek) 天璣系列生成式晶片。(OmniXRI整理製作,2026/03/06)

耐能(Kneron)

耐能(Kneron)除了傳統 NPU 外,近年也開發了針對 Transformer 模型推論的 NPU IP 及晶片,輕量級生成應用有 KneoEdge KL1140[27],重量級生成應用則有 KNEO300 (EdgeGPT)系列。重要規格如下所示。

  • KNEO300(EdgeGPT) Edge端伺服器
    • 適用於生成式 AI 應用,可聯級使用
    • KNEO300 30TOPS(8x Cortex-A53)
    • KNEO330 48TOPS(KL830)
    • KNEO350 192TOPS
  • KneoEdge KL1140 晶片
    • 高效能、低功耗的邊緣運算處理器
    • 全球首款能在终端完整行 Mamba 模型架構的 NPU
    • 4顆級聯可運行1200億(120B)參數之模型

20260304_Taiwan_AI_Chip_021
Fig. 24 耐能(Kneron) 生成式應用晶片及相關設備。(OmniXRI整理製作,2026/03/06)

創鑫(Neuchips)

創鑫(Neuchips)是由清大資工林永隆教授率領的團隊成立的,主要專注在高效能 AI 推論晶片,早期開發出 RecAccel N3000 專注於深度學習推薦模型(DLRM),後隨著大語言模型興起,將其晶片調整成更適合的晶片,推出 Raptor N3000 語言模型推論晶片[28]。其主要規格如下

  • ARC HS48 CPU
  • SRC EV72 DSP, FPU
  • 64GB DRAM
  • 矩陣運算引擎 × 10 (動態 MLP 引擎, DME)
  • 向量運算引擎 × 2 (特徵交叉, FX)
  • 嵌入式引擎

另外基於 Raptor N3000 晶片,還有開發出兩張推論卡適合桌機及筆電使用。

20260304_Taiwan_AI_Chip_022
Fig. 25 創鑫(Nuchips) 大語言模型推論晶片及相關推論卡。(OmniXRI整理製作,2026/03/06)

台灣發展軟體科技(Skymizer)

台灣發展軟體科技(Skymizer)是台灣知名編譯器(Compiler)供應商,早期專注在編譯器開發,後隨著邊緣運算興起,參與過多項客製化模型優化(壓縮)工作,累積出對硬體推論效率提升的技術。近年來有鑑於大語模型普及,GPU推論過於耗電,因此轉身投入大語言模型處理器(LPU) IP[29] 研發並推出自家高效語言指令架構(LISA),企圖讓更多邊緣裝置也能輕鬆擁有生成式 AI 應用。目前僅有 IP,尚未有廠商導入,但自家已進入晶片測試階段。目前有兩個 IP,分別對應一般性能及高效推論。

  • HyperThought
    • 高吞吐量,100GB/S 只需0.5TOPS 即可實現 30 token/sec
    • 28nm 製程,多核可擴展設計
    • 八核 HTX301 LPU 為 Llama 3 7B預填充值實現240 tonken/sec
  • EdgeThought
    • 可將生成式AI應用引入各種邊緣設備達到成本效益優化
    • Skymizer 編譯器可優化執行效能
    • 可使用自行研發高效語言指令架構 LISA(v2, V3) 提高 LPU 效能

20260304_Taiwan_AI_Chip_023
Fig. 26 台灣發展軟體科技(Skymizer) LPU 相關IP。(OmniXRI整理製作,2026/03/06)

台灣 AI 晶片未來挑戰

好的 AI 晶片也要有好的 AI 開發工具才能發揮最大作用,一個邊緣 AI 推論應用從資料收集標註、模型開發訓練、優化部署、推論加速每個步驟都需要專業的開發工具。台灣有豐富的 IC 設計、嵌入式系統(微處理 SoC / MPU、單晶片 MCU)、工業電腦(單板微電腦)、智慧手機的晶片供應商及軟韌硬體開發人才,但較缺乏 AI 推論專用的軟體工具及系統整合供應商。

由於 AI 推論的加速方式有很多種,CPU / GPU / NPU / DSP / LPU 各自有特定的方式,但通用型的 AI 框架(如 TensorFlow, PyTorch等)並無法滿足所有硬體架構。為了讓 AI 晶片能發揮最大推論能力,跑到理論上全速值,通常還要有一些配套的轉換工具軟體及特定函式庫。

有鑑於此,台灣有些廠商就推出自己的專屬工具,避免那些通用型工具無法將硬體效能全部發揮出來。當然這些工具如果持續發展,支援更多的晶片、開發板,未來也是有機會成為第二個 Edge Impulse

20260304_Taiwan_AI_Chip_024
Fig. 27 台灣 AI 晶片開發工具供應商。(OmniXRI整理製作,2026/03/06)

峻魁(eNeural)

峻魁(eNeural)為陽明交大郭峻因教授領軍成立的公司,主要關注在模型壓縮與量化、嵌入式 AI IP 及大語言模型如何導入邊緣裝置,主要應用領域在先進駕駛輔助系統(ADAS)及智慧家電及智慧物聯網等。

目前公司為了滿足模型小型化並高效推論,開發出一套 AI-Craft [30],這套工具暫時沒有市售,但已協助他們完成許多專案,未來有機會釋出商用。以下就簡單說明其子系統。

  • ACraft 自動標註:只需建立參考物件,就可在連續影像中自動標註。
  • PCraft 模型剪枝:可自動將模型冗餘部份刪除,減少參數量,並可提升推論速度。
  • QCraft 參數量化:將模型參數數值從 32位元浮點數(FP32) 降至 8甚至4位元整數,以減少模型大小及記憶體使用。
  • LCraft 大語言模型優化:這部份未完全公開僅在少數研討會中提及。

20260304_Taiwan_AI_Chip_025
Fig. 28 峻魁(eNeural) AI 開發工具 AI-Craft。(OmniXRI整理製作,2026/03/06)

新唐(Nuvoton)

新唐(Nuvoton)在 AI 晶片除了較領先市場的 NuMicro M5531(Cortex-M55)、M55M1(Cortex-M55 + Ethos-U55) 系列外,另外還有 MA35D1(Arm Cortex-A35) 和 M467(Arm Cortex-M4) 等系列。由於硬體加速方式略有不同,為了讓開發者能更容易上手,開發出兩套工具 NuML Toolkit 和 NuEdgeWise [31]可滿足自家所有 AI 晶片,以下簡單說明主要功能。

  • NuML Toolkit
    提供已訓練完成的模型,經此工具即可「載入模型」、「轉換模型」及「部署模型到開發板」。
  • NuEdgeWise
    提供快速「標註資料」、「訓練模型」、「校驗模型」及「測試模型」等功能,最後再部署到開發板上進行測試。

20260304_Taiwan_AI_Chip_026
Fig. 29 新唐(Nuvoton) AI 開發工具 NuML / NuEdgeWise。(OmniXRI整理製作,2026/03/06)

晶心科技(Andes)

晶心科技(Andes)目前在 AI 推論加速上 RISC-V CPU 可採用平行(SIMD, P擴展)和向量(Vector, V擴展)指令集,另外加速器部份有 AnDLA,為了讓開發流程更具一致性,推出了推出 AndesAIRE(Andes AI Runs Everywhere)架構[32]。其中包含兩大工具 NN SDK 和 NN Lib,主要功能如下所示。

  • AndesAIRE™ NN SDK
    NNPilot : 神經網路優化工具
    TFLM : TensorFlow Lite for Microcontroller
    Driver & Runtime : 驅動程式及執行中函式庫
  • AndesAIRE™ NN Library
    DSP/SIMD/Vector 指令優化
    激活函數、基本數學、級聯、捲積、全連結、池化、Softmax、工具函式

20260304_Taiwan_AI_Chip_027
Fig. 30 晶心(Andes) AI 開發工具 AndesAIRE。(OmniXRI整理製作,2026/03/06)

聯發科(MediaTek)

聯發科(MediaTek)為了讓手機晶片天璣系列在開發生成式 AI 應用時能更容易調優模型,且更清楚了解模型執行的瓶頸為何,因此在自家的 NeuroPilot SDK[33] 上加入了視覺化工具 Neuron Studio。重要規格如下所示。

  • NeuroPilot SDK(核心工具)
    • AI 開發的底層架構與技術核心。
    • 包含編譯器、執行中函式庫、驅動程式、API、以及各種命令列工具 。
  • Neuron Studio (視覺化工具)
    • 建立在SDK上的一站式視覺化開發環境。
    • 提供圖形化介面,整合模型開發、優化、調試與分析。

20260304_Taiwan_AI_Chip_028
Fig. 31 。(OmniXRI整理製作,2026/03/06)

台灣 AI 晶片未來展望

目前台灣在訓練端 AI 晶片自行研發上投入資源不足,因此很難建立核心技術,但在生產製造上卻有全世界不容易取代的地位,從台積電晶圓製作、先進封裝廠、AI 伺服器組裝廠到 AI 資料中心、雲平台服務供應商無一不是台灣的強項。對於邊緣端,台灣目前雖已有部份廠商投入推論用 AI 晶片及開發板設計製造,但對於配套軟體開發甚至系統整合仍在起步階段,值得更多學研單位及廠商投入。

目前 AI 發展趨勢已逐漸從感知型 AI 、生成式 AI 、代理型 AI 發展到物理型 AI,慢慢從雲端重新回到邊緣。雖然台灣過往二、三十年已建立起堅實的嵌入式系統核心技術,不論 IC 設計或軟韌硬體都有完整的供應商及開發者生態系,但若沒有接住這波浪潮,讓產業提升到邊緣 AI ,建立新的核心技能,那將是非常可惜的一件事。今(2026)年初新唐宣佈和工研院合作,要從晶片端和軟體端進行整合,讓百工百業能更容易應用微型AI[34]。國研院也在推動晶片級先進封裝研發平台[35],相信只要有更多產官學研投入,將會迎來台灣 AI 晶片下個世代的新商機。

小結

從本文整理的數十家廠商及近百種產品中可看出,台灣目前在邊緣推論 AI 晶片及開發板上已有初步成果,從半專用型、NPU IP型、MCU+NPU型、SoC/MPU+NPU型到生成式AI型都已有少數廠商投入,而配套開發工具也正在逐漸成形。AI 趨勢已開始朝物理型 AI 遷移,只要擺脫傳統只重硬體不重軟體甚至忽略系統整合價值的陋習,建立新的核心技術及理念,培養更多技術人才,相信台灣一定能在下一波浪潮獲得嶄新不可憾動的世界地位。

後記

本文同步發表於新電子科技雜誌 2026 年
五月號:主題探索 ─ 盤點18品牌90款晶片/開發板(1) 台廠兵分五類進軍邊緣AI晶片
六月號:市場透視 ─ 盤點18品牌90款晶片/開發板(2) 邊緣AI推論展現台晶片廠優勢

參考文獻

[1] 「AI on Chip示範計畫籌備小組」啟動 政院邀產官學研合作 推升台灣AI晶片產業發展 打造世界級人工智慧大腦
[2] 台灣人工智慧晶片(AITA)聯盟簡介
[3] 晶創臺灣方案—奠基臺灣未來10年科技國力
[4] 許哲豪,開發者如何選擇 Edge AI 開發方案
[5] 許哲豪,從Computex 2024看邊緣智慧明日之星NPU
[6] 許哲豪,從CES 2024 看Edge AI及TinyML最新發展趨勢
[7] 2022/10/18 許哲豪,MCU攜手NPU讓tinyML邁向新里程碑
[8] 2022/12/29 許哲豪,有了TinyML加持MCU也能開始玩電腦視覺了
[9] 盛群,Edge AI 產品介紹
[10] 義隆電,產品與解決方案
[11] 神盾,獲行政院補助AI on Chip計畫第一案
[12] 鈺立微與鈺創共同發佈 XINK Nano邊緣 AI即時運算感測融合平台 成功落地智慧停車場應用,推進智慧城市大未來
[13] 耐能,終端AI─可重構NPU
[14] 英業達,英業達「VectorMeshTM」NPU IP 奪 EE TIMES 2024 亞洲金選獎
[15] 晶心,AndesAIRE – Andes AI Runs Everywhere
[16] 奇景,WiseEye2 AI Processor (WE2) - HX6538
[17] 新唐, Cortex-M55 MCU
[18] 瑞昱, IoT AI Video SoC / MCU - AmebaPRO2 TRL8735B
[19] 阿比特, Products - SoCs - UP201/UP301
[20] 凌陽,產品資訊 ─ AI Vision SOC Sunplus SP7350 / C3V
[21] 耐能,重新定義邊緣 AI 開發:KNEO Pi 開啟智慧硬體新時代
[22] 聯發科, Powering the New Era of AI Applications MediaTek Genio SoCs
[23] 聯詠,產品介紹 ─ SoC
[24] 晶心,AndesAIRE™ – Andes AI Runs Everywhere
[25] 華碩,Tinker Board
[26] 聯發科,天璣 Dimensity 9500
[27] 耐能,耐能新一代 AI 系列晶片發布 邁向全端 AI 基礎建設新時代
[28] 創鑫,產品 ─ AI 推論晶片、生成式AI推論卡
[29] 台灣發展軟體科技,產品 ─ HyperThought, EdgeThought
[30] 峻魁,Service - AI-Craft
[31] 新唐,Machine Learning Tools - NuML Toolkit / NuEdgeWise
[32] 晶心,解決方案 ─ AndesAIRE - AndesAIRE™ NN SDK, AndesAIRE™ NN Library
[33] 聯發科,NeuroPilot, Neuron Studio
[34] 【CTIMES】新唐攜手工研院推TinyML方案 加速百工百業AI落地
[35] 【經濟日報報導】國研院開發晶片級先進封裝研發平台 啟動臺灣半導體創新驅動新里程

延伸閱讀

[A] 2021/09/09 許哲豪,當智慧物聯網(AIoT)遇上微型機器學習(tinyML)是否會成為台灣單晶片(MCU)供應鏈下一個新商機!?
[B] 許哲豪,誰說單晶片沒有神經網路加速器NPU就不能玩微型AI應用?
[C] 許哲豪,OmniXRI TinyML 小學堂 (2025)
[D] 2026/01/28 許哲豪,穿戴式超低功耗 TinyML 開發板 Trina-Pi (UP201) 開箱實測
[E] 晶心科技,RISC-V 上的 AI 第三次處理器革命

沒有留言:

張貼留言

【頂置】簡報、源碼、系列文快速連結區

常有人反應用手機瀏覽本部落格時常要捲很多頁才能找到系列發文、開源專案、課程及活動簡報,為了方便大家快速查詢,特整理連結如下,敬請參考! Edge AI Taiwan 邊緣智能交流區 全像顯示與互動交流區 台科大(NTUST)邊緣人工智慧實務(2026) 南開科大...