2025年4月2日 星期三

OmniXRI TinyML 小學堂 (2025) 【第 4 講】arm 單晶片加速運算

本課程完全免費,請勿移作商業用途!更多課程內容請參考文末教學資源連結。歡迎追蹤、留言、訂閱、點讚、轉發,讓更多需要的朋友也能一起學習。

課程直播日期: 2025/04/02
課程直播連結: https://youtu.be/TYyz88IhGd8
課程簡報名稱: 20250402_TInyML_Course_Ch04_OmniXRI_Jack.pdf

OmniXRI TinyML 小學堂 (2025) 【第 3 講】微型人工智慧基礎

本課程完全免費,請勿移作商業用途!更多課程內容請參考文末教學資源連結。歡迎追蹤、留言、訂閱、點讚、轉發,讓更多需要的朋友也能一起學習。

課程直播日期: 2025/03/26
課程直播連結: https://youtu.be/FgmhEuYAXBU
課程簡報名稱: 20250326_TinyML_Course_Ch03_OmniXRI_Jack.pdf

2025年4月1日 星期二

輕鬆用 Intel AI PC 及 OpenVINO 建立數位分身

作者: Jack OmniXRI 2025/3/24

20250324_Digital_Avatar_00

隨著生成式人工智慧(Generative Artificial Intelligence, GenAI)技術的日益普及,數位分身(Digital Avatar)或稱數字人(Digital Human)也開始出現在很多智慧客服及人機互動應用上,讓使用者再也不用面對冷冰冰的機器進行操作。一個完整的數位分身,就像真人一樣,要具有自然語言對話、豐富肢體動作和產生生動表情的能力,其中就需要用到許多生成式AI技術,包括利用語音轉文字(Speech to Text, STT)得到問題的文字,交給大語言模型(Large Language Model, LLM)進行文字問答,再將文字轉語音(Text to Speech, TTS)把答案讀出,最後再配合語音自動對嘴形(Lip Sync)讓人物影像的嘴巴也能和語音同步動起來。

去(2024)年底曾寫過一篇文章「如何使用 Intel AI PC 及 OpenVINO 實現虛擬主播」[1],介紹了數位分身所需擁有的文字轉語音和聲音自動嘴型功能,算是實現了數位分身的後半段「自動讀稿機」的能力。此次就來幫大家介紹前半段,使用麥克風收音進行問話,然後再使用大語言模型來思考及產生問答結果,如此就能搞定數位分身的前半段,構成一個簡單完整的系統。

【頂置】簡報、源碼、系列文快速連結區

常有人反應用手機瀏覽本部落格時常要捲很多頁才能找到系列發文、開源專案、課程及活動簡報,為了方便大家快速查詢,特整理連結如下,敬請參考! Edge AI Taiwan 邊緣智能交流區 全像顯示與互動交流區 台科大(NTUST) 人工智慧與邊緣運算實務(2021-2...