歐尼克斯實境互動工作室(OmniXRI): Intel OpenVINO強大免費開源的標註工具 CVAT 2.0來了!

2022年3月10日星期四

Intel OpenVINO強大免費開源的標註工具 CVAT 2.0來了!

Intel OpenVINO Toolkit Computer Vision Annotation Tool [1]

大家常說在人工智慧（AI）的時代，AI模型就像汽車，而資料就像汽油，沒了汽油，汽車就跑不動了。在「監督式學習」應用下若沒有大量且高品質的標註資料，那麼就很難驅使AI應用的實現及不斷改進。不過說到影像標註(Annotation)資料，可能一堆AI工程師馬上會抱怨這項工作吃力又無聊，急忙就把工作推給菜鳥來做。一張靜態影像標註少則一秒（如影像分類），多則數十秒（如物件偵測）到數百秒（影像分割），若再加上專業領域知識（如醫學影像）或是動態影片（如車流、人流）標註，那可就標註到天荒地老了。所以有一個強大、省力、支援性廣甚至是免費的標註工具，就成了大家心中最需要的。

CVAT(Computer Vision Annotation Tool)是一項由Intel所開源的影像標註工具，雖然目前依附在自家OpenVINO Toolkit下，但它可獨立安裝運行，適用於多種作業系統，如Windows, Mac, Linux等，亦可完美輸出入各種AI框架所需多種資料集格式，如VOC, COCO, YOLO, TFrecord, MOT等十多種，沒有任何使用限制，大家可自行從Github[1]上取得。安裝步驟可參考官方說明文件[2]中的「Getting started - Installation」。CVAT亦有提供免費線上版本[3]，只需註冊一個帳號，不需安裝就能馬上體驗，不過目前只支援Chrome的瀏覽器。

不論是從本地端(localhost:8080)或雲端(cvat.org)啟動CVAT，都是在瀏覽器上操作，所以操作畫面都是相同的。首先創建一項任務(Task)，再指定幾個標註用的標籤(Labels)，可隨喜好自行決定名稱、顏色及其它屬性，之後也可再任意增減標籤數量及內容。接著上傳待標註的靜態影像（如*.jpg）或動態影片段（如*.mp4）。打開任務，點擊上傳之檔案即可開啟。如果想自動調整影像對比，可點選左側OpenCV按鍵後選擇「Image」頁面下的「影像直方圖等化(Histogram Equalization)」，或者選擇「智慧剪刀(Intelligent Scissors)」自動取得物件封閉輪廓。當然最常用的點、線、矩形框及多邊形標註工具，也可在左側工具列上找到。對於態影片中的物件追蹤標註也是難不倒CVAT的，只要設定幾個關鍵影格(Key Frame)的物件矩形框的位置及大小，其它中間的影格就可自動進行補間(Interpolation)，如此可節省下很多標註時間。

影片來源：Youtube - Intel Software

最新的CVAT版本還增加了AI工具(AI Tools)的無服務器自動標註(Serverless Functions for Automatic Labeling)功能，換言之就是使用常見預訓練好的物件偵測模型來幫大家先找出常見的物件，如Faster RCNN, Mask RCNN, YOLO v3/v5, RetinaNet, Face Detection等十多種模型，再由使用者自行增減自動找出的物件，而這項新功能不論靜態影像或動態影片段皆可使用，可大幅減少標註時間。

影片來源：Youtube - Intel Software

想了解更完整的使用說明，可參考CVAT Github[1]及官方說明文件[2]。

[1] Github, openvinotoolkit/cvat
https://github.com/openvinotoolkit/cvat

[2] Intel OpenVINO Toolkit CVAT Documentation
https://openvinotoolkit.github.io/cvat/docs/

[3] Computer Vision Annotation Tool (CVAT) Online
https://cvat.org/

1 則留言:

匿名2022年3月13日下午4:51
網誌管理員已經移除這則留言。
回覆刪除
回覆

新增留言

2022年3月10日 星期四

Intel OpenVINO強大免費開源的標註工具 CVAT 2.0來了!

1 則留言:

【頂置】簡報、源碼、系列文快速連結區

2022年3月10日星期四