「物件偵測」一直是電腦視覺的重點項目,已發展了二十多年[1],早期利用各種特徵提取和比對來找出人們對影像中有興趣的像素集合(物件),如VJ, HOG等。近幾年來,大家則把重點放在了「深度學習」的模型上[2],從剛開始的二階段偵測器(Two-stage Detector),如RCNN, SPPNet, Fast RCNN, Faster RCNN等,到目前最流行的一階段偵測器(One-stage Detector),如SSD, RetinaNet, EfficientDet, YOLO等,其中又以YOLO(You Only Look Once)系列發展的最好,一路發展出YOLOv2, YOLOv3, YOLOv4, YOLOv5(非學術論文), 去年更有ScaledYOLOv4, YOLOX, YOLOR等技術推出,讓大家有更快推論速度、更高推論精度、更彈性模型架構,讓同一張影像中大小物件都能順利被檢出。
OmniXRI (Omni-eXtened Reality Interaction) 歐尼克斯實境互動工作室是一個全方位電腦視覺、實境互動、邊緣計算及人工智慧技術的愛好者及分享者,歡迎大家不吝留言指教多多交流。 這裡的文章大部份是個人原創,如有引用到他人內容都會註明,若不慎疏漏侵犯到,煩請儘快通知,我們會儘速處理。當然這裡的資料也歡迎引用及推廣,煩請註明出處(網頁網址),謝謝!
2022年1月21日 星期五
使用Google Colab快速體驗ScaledYOLOv4
訂閱:
文章 (Atom)
【頂置】簡報、源碼、系列文快速連結區
常有人反應用手機瀏覽本部落格時常要捲很多頁才能找到系列發文、開源專案、課程及活動簡報,為了方便大家快速查詢,特整理連結如下,敬請參考! Edge AI Taiwan 邊緣智能交流區 全像顯示與互動交流區 台科大(NTUST) 人工智慧與邊緣運算實務 開南大學...
-
作者: Jack OmniXRI 2024/12/12 2022年底 OpenAI 引爆大語言模型(Large Lauguage Model, LLM)及生成式人工智慧(Generative Artificial Intelligence, GenAI),從此有各種文字、聲音...
-
作者:許哲豪(Jack Hsu), 2024/3/24 Fig. 1 GTC 2024 Keynote (Youtube)。[1] 這兩天相信很多人都被老黃GTC 2024演講[1]給震撼到了吧!如果你是剛買了H100的朋友,大概心中不免XXX,眼眶中充滿淚水暗罵老黃「你又跟我說...