2018年10月17日 星期三

【輔大-人人皆MAKER講座】開源的影像辨識玩法-從入門到進階_課程簡報

很高興今日(2018/10/17)受輔大創新造發展中心執行長王福堂助理教授邀請擔任「人人皆Maker講座」講師,分享「開源的影像辨識玩法─從入門到進階」。

此次主要簡報內容主要包括下列幾個項目,完整簡報請參考下方。
  • 認識影像辨識系統
  • 電腦視覺開源工具介紹:OpenCV、OpenVINO
  • 電腦視覺與人工智慧:常見視覺分析問題、深度學習與解決方案、應用場域
  • Maker如何玩影像辨識:入門 ─ 樹莓派、中階 ─ Intel神經計算棒、進階 ─ NVIDIA TX2、跨階 ─ 安卓手機+NNAPI
  • Maker創作經驗分享:OpenQCam 迷你相機、OpenQSignage 數位胸牌、OpenQPano 360度顯示器

※若看不清楚圖片內容,可點擊圖片放大至原始解析度觀看。







資料來源:http://szeliski.org/Book/












Intel OpenVINO Toolkit https://software.intel.com/en-us/openvino-toolkit































歐尼克斯實境互動工作室開源庫 https://github.com/OmniXRI


本文歡迎轉發(貼)及非商業用途使用,若有引用部份文章或圖片時煩請註明出處、作者:「歐尼克斯實境互動工作室 作者:Jack Hsu」及本文網址,謝謝!

3 則留言:

  1. 您好,我是剛接觸這領域的新手,有些問題想請教如下,

    1.如果要辨識"大賣場裡的各類商品",就您經驗OpenVino有類似的sample嗎? 如果沒有,是因為model不適合用要自己train嗎,還是有其它原因? 還是有建議的資料讓我去study看看.

    2.如果有辨識到物件,就您經驗該用那種方法去跟資料庫比對到底是那一個商品?因不太可能是一張張圖去比吧.

    感謝您看完我的問題,歡迎您給我任何建議.
    qroguekid

    回覆刪除
    回覆
    1. 就第一項問題來說,賣場上的商品要建立資料集訓練一事,大概沒人能提供,只能乖乖自己建立及標註,問題在於一般深度學習的影像分類或物件偵測都需要同一產品大量樣本(不同視角、位置、角度、光影、形變等)。另一項問題是每增加一樣新產品就要重新訓練一次模型,時間會是一項大問題。因此若只有固定品項(數百樣)或者只是當作練習或許還可試試,基本上除非有像AMAZON那樣的資源(算力及財力),不然很難實用化,只能淪為展示品。若您有興趣可參考一下CH大的https://chtseng.wordpress.com/2019/01/25/%E7%89%A9%E4%BB%B6%E5%81%B5%E6%B8%AC%E7%9A%84%E6%87%89%E7%94%A8-diy%E9%9B%BB%E8%85%A6%E8%A6%96%E8%A6%BApos%E7%B5%90%E5%B8%B3%E5%8F%B0/
      CH大的範例雖然不是用OpenVINO,但OpenVINO提供的範例中影像分類和物件偵測也是大同小異的,只是換了不同的對象而已。

      第二項問題,若是採用傳統機器學習特徵提取再分類的方式,就會有資料庫比對的問題,但若採深度學習方式,則數百萬到數億個權重值就變相是比較條件組合,就沒有一個一個比對問題。

      以上僅個人看法,若對OpenVINO有興趣可參考官方YOUTUBE中文教程 https://www.youtube.com/watch?v=1vfQyOcUi7Q&list=PLDKCjIU5YH6jF8_Za7vEflrUKJ5hj6qy3

      刪除
  2. Hi 您好,
    謝謝回覆及建議, CH大那個範例不錯, 我先來研究看看.
    qroguekid

    回覆刪除

【頂置】簡報、源碼、系列文快速連結區

常有人反應用手機瀏覽本部落格時常要捲很多頁才能找到系列發文、開源專案、課程及活動簡報,為了方便大家快速查詢,特整理連結如下,敬請參考! Edge AI Taiwan 邊緣智能交流區 全像顯示與互動交流區 台科大(NTUST) 人工智慧與邊緣運算實務 開南大學...