「物件偵測」一直是電腦視覺的重點項目,已發展了二十多年[1],早期利用各種特徵提取和比對來找出人們對影像中有興趣的像素集合(物件),如VJ, HOG等。近幾年來,大家則把重點放在了「深度學習」的模型上[2],從剛開始的二階段偵測器(Two-stage Detector),如RCNN, SPPNet, Fast RCNN, Faster RCNN等,到目前最流行的一階段偵測器(One-stage Detector),如SSD, RetinaNet, EfficientDet, YOLO等,其中又以YOLO(You Only Look Once)系列發展的最好,一路發展出YOLOv2, YOLOv3, YOLOv4, YOLOv5(非學術論文), 去年更有ScaledYOLOv4, YOLOX, YOLOR等技術推出,讓大家有更快推論速度、更高推論精度、更彈性模型架構,讓同一張影像中大小物件都能順利被檢出。
OmniXRI (Omni-eXtened Reality Interaction) 歐尼克斯實境互動工作室是一個全方位電腦視覺、實境互動、邊緣計算及人工智慧技術的愛好者及分享者,歡迎大家不吝留言指教多多交流。 這裡的文章大部份是個人原創,如有引用到他人內容都會註明,若不慎疏漏侵犯到,煩請儘快通知,我們會儘速處理。當然這裡的資料也歡迎引用及推廣,煩請註明出處(網頁網址),謝謝!
2022年1月21日 星期五
使用Google Colab快速體驗ScaledYOLOv4
訂閱:
文章 (Atom)
【頂置】簡報、源碼、系列文快速連結區
常有人反應用手機瀏覽本部落格時常要捲很多頁才能找到系列發文、開源專案、課程及活動簡報,為了方便大家快速查詢,特整理連結如下,敬請參考! Edge AI Taiwan 邊緣智能交流區 全像顯示與互動交流區 台科大(NTUST) 人工智慧與邊緣運算實務 開南大學...
-
作者:Jack OmniXRI, 2024/11/15 2022年底 OpenAI 推出 ChatGPT 後,各大廠紛紛推出自己的大語言模型(Large Language Models, LLM),讓電腦也能像人類一樣地自然問答。不過一開始的模型參數量都非常驚人,高達數千億個...
-
從2017/11/8創建這個部落格至今已滿七年了,又是到了自我檢視的時候了。感謝過去一年間大家的支持,點閱次數已累積532,254次,較去年新增109,642次,新增貼文61篇。相較去年貼文數38篇增加了近一倍多,點閱率較去年的39,954增加了二倍多。 以往發文時會大力在FB各...