歐尼克斯實境互動工作室(OmniXRI)

OmniXRI (Omni-eXtened Reality Interaction) 歐尼克斯實境互動工作室是一個全方位電腦視覺、實境互動、邊緣計算及人工智慧技術的愛好者及分享者，歡迎大家不吝留言指教多多交流。這裡的文章大部份是個人原創，如有引用到他人內容都會註明，若不慎疏漏侵犯到，煩請儘快通知，我們會儘速處理。當然這裡的資料也歡迎引用及推廣，煩請註明出處(網頁網址)，謝謝!

2023年10月26日星期四

【vMaker Edge AI專欄 #10】訓練AI模型資料不足怎麼辦？聊聊資料集擴增手法

作者：Jack OmniXRI, 2023/10/16

相信有開發過邊緣智慧應用的朋友，一定都會經歷資料收集標註、模型選用訓練調參及部署推論檢驗的步驟。當模型訓練完成後，在測試集表現還不錯，但到了真實場景卻一塌糊塗，推論準確度急速下降。此時就要重新檢視資料集各分類是否有足夠數量的樣本及多樣性，即可以包含更大範圍的應用場景內容。

為解決這項問題，通常可以重新取樣、增加樣本數量和多樣性來解決，但不幸地是有時無法重新取樣，或部份分類的樣本不易取得。此時就要靠資料擴增(Data Augmentation)手法來協助擴展資料集的數量和多樣性，以利模型在訓練時能學習到對應的特徵，確保訓練結果在部署後也能保持一定的推論精度。

以下就簡單盤點一些常見的資料擴增手法，包含影像類（二維資料）及時序類（一維資料，如聲音、溫度、振動等各式感測器產生的連續信號），希望能帶給大家一些幫助。

閱讀更多 »

訂閱：文章 (Atom)