Використання нейромережевих засобів для розпізнавання об'єктів у мобільних системах з обходом перешкод
Анотація
Запропоновано вдосконалення нейромережевого методу розпізнавання об'єктів для пошуку доречних об'єктів в межах заданого контексту. Проаналізовано останні дослідження та підходи до вирішення проблеми розпізнавання об'єктів і виявлено ключові особливості декількох архітектур нейронних мереж. Наведено метод, що базується на поєднанні нейронної мережі, пристосованої до пошуку образів, та застосуванні додаткових алгоритмів для вилучення зайвих об'єктів, а саме алгоритму видалення дублікатів об'єктів та алгоритму фільтрації об'єктів відповідно до контексту. Застосовано готову архітектуру Single Shot Detector як основу нейронної мережі для розпізнавання об'єктів, треновану на наборі даних COCO. Розроблено алгоритм фільтрації об'єктів, який містить попереднє створення конфігурації, для визначення множин доречних класів об'єктів для різних контекстів. Розроблено гнучку конфігурацію, яка може бути модифікована та розширена новими умовами роботи, за потреби, без додаткових змін у логіці програмної частини. Проведено низку експериментів для визначення точності роботи системи у нових середовищах, під час яких систему протестовано з використанням набору даних ODSR-IHS, який містить зображення, отримані під час роботи роботів-порохотягів, і досягнуто точності розпізнавання 5 класів об'єктів на рівні 83 %. Виявлено під час проведення експериментів здатність системи знаходити більшу кількість значущих об'єктів, ніж передбачалось авторами набору даних, зокрема людей у кадрі, що свідчить про перспективність використання системи у різному оточенні. Встановлено, що завдяки використанню диверсифікованого набору даних із 80 класами об'єктів та відбором тільки значущих предметів розроблена система є ефективною під час використання у різних середовищах. Запропонований метод вирішує проблему перевикористання єдиної системи розпізнавання об'єктів у різних середовищах, що спрощує її використання у мобільних системах, які можуть працювати у різному оточенні.
Завантаження
Посилання
Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, & Xiangxiang Chu. (2023). YOLOv6 v3.0: A Full-Scale Reloading. https://doi.org/10.48550/arXiv.2301.05586
Huan Wang, Can Qin, Yue Bai, Yulun Zhang, & Yun Fu. (2022). Recent Advances on Neural Network Pruning at Initialization. https://doi.org/10.48550/arXiv.2103.06460
Hussam, Qassim, David, Feinzimer, & Abhishek, Verma. (2017). Residual Squeeze VGG16. https://doi.org/10.48550/arXiv.1705.03004
Jingru Yi, Pengxiang Wu, & Dimitris N. (2019). Metaxas. ASSD: Attentive Single Shot Multibox Detector. https://doi.org/10.48550/arXiv.1909.12456
Pinhao, Song, Pengteng, Li, Linhui, Dai, Tao, Wang, & Zhan, Chen. (2022). Boosting R-CNN: Reweighting R-CNN Samples by RPNs Error for Underwater Object Detection. https://doi.org/10.48550/arXiv.2206.13728
Sebastian, Cygert, & Andrzej, Czyzewski. (2021). Robust Object Detection with Multi-input Multi-output Faster R-CNN. https://doi.org/10.48550/arXiv.2111.13065
Sik-Ho Tsang. SSD – Single Shot Detector (Object Detection). (2018). Retrieved from: https://towardsdatascience.com/review-ssd-single-shot-detector-object-detection-851a94607d11
Teslyuk, V., Kazarian, A., Kryvinska, N., & Tsmots, I. (2021). Optimal artificial neural network type selection method for usage in smart house systems. Sensors, 21(1), 1–14, 47.
Tsung-Yi, Lin, Michael, Maire, Serge, Belongie, Lubomir, Bourdev, Ross, Girshick, James, Hays, Pietro, Perona, Deva, Ramanan, C. Lawrence, Zitnick, & Piotr Dollár. (2015). Microsoft COCO: Common Objects in Context. https://doi.org/10.48550/arXiv.1405.0312
Yilun, Chen, Shu, Liu, Xiaoyong, Shen, & Jiaya, Jia. (2019). Fast Point R-CNN. https://doi.org/10.48550/arXiv.1908.02990
Zekun Luo, Zheng Fang, Sixiao Zheng, Yabiao Wang, & Yanwei Fu. (2021). NMS-Loss: Learning with Non-Maximum Suppression for Crowded Pedestrian Detection. https://doi.org/10.1145/3460426.3463588

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.



