Система виявлення обличчя на зображенні з використанням глибинної згорткової нейронної мережі

Ключові слова: комп'ютерний зір, алгоритми розпізнавання, аналіз зорових образів, машинне навчання, штучний інтелект

Анотація

Здійснено огляд попередніх досліджень та актуальність систем з пошуку обличчя. Виявлено недоліки і труднощі, що впливають на їх ефективність. Запропоновано для реалізації систему для пошуку обличчя на зображенні на підставі алгоритмів розпізнавання обличчя. Пошук обличчя є першим кроком у різних інших застосуваннях: відстеження, аналіз, розпізнавання осіб. Окрім використання у поєднанні з технологіями, описаними вище, можна використовувати пошук обличчя, щоб: підрахувати кількість людей, які є на екрані або дивляться на цифровий дисплей; визначити, які ділянки зображення потрібно розмивати, щоб забезпечити конфіденційність. Використано глибинні згорткові нейронні мережі для реалізації, оскільки вони ефективніші для цієї задачі. Науковим результатом під час розроблення поданої системи є удосконалення алгоритмів розпізнавання обличчя на зображенні: пришвидшення, підвищення точності розпізнавання. Реалізовано першу версію запропонованої системи. Розроблена система може бути використана у різних сферах людської діяльності та в багатьох задачах аналітики. Для цього використано Tensoflow – спеціальний фреймоворк для розробки, навчання власних глибинних нейронних мереж. Вирішено використати набір даних LFW – People (Face Recognition) для навчання моделі. Використано Python бібліотеку LabelImg, щоб попередньо промаркувати навчальні дані, які нейронна мережа повинна знаходити на зображенні. Зроблено карту міток для навчання моделі. Запущено 25000 ітерацій для навчання моделі. Отримано рівень втрат 0,069 (похибка у 6,9 %) на останній ітерації. Модель показує однозначний результат для більшості тестових даних (≥99 %), але рівень точності у випадках, коли на зображенні містилися головні убори, є дещо нижчим (97 %). Модель поки що не тестувалася на даних із великим кутом повороту обличчя, тому важливо перевірити її стійкість для цього фактору і за змогою знизити його вплив на точність моделі.

Біографії авторів

О. В. Яловега, Національний університет "Львівська політехніка", м. Львів

магістрант, кафедра програмного забезпечення

Р. А. Мельник, Національний університет "Львівська політехніка", м. Львів

д-р техн. наук, професор, кафедра програмного забезпечення

Посилання

Aksasse, B., Ouanan, H., & Ouanan, M. (2017). Novel approach to pose invariant face recognition. Procedia Computer Science, 110, 434–439. https://doi.org/10.1016/j.procs.2017.06.108
Al-Waisy, A. S., Qahwaji, R., Ipson, S., & Al-Fahdawi, S. (2017). A multimodal deep learning framework using local feature representations for face recognition. Machine Vision and Applications, 29(1), 35–54. https://doi.org/10.1007/s00138-017-0870-2
Bah, S. M., & Ming, F. (2020). An improved face recognition algorithm and its application in attendance management system. Array, 5. https://doi.org/10.1016/j.array.2019.100014
Grafiki vtrat ta tempu navchannia rozroblenoi modeli glibinnoi zgortkovoi neironnoi merezhi. Retrieved from: https://www.drive.google.com/drive/folders/13Klb_rBFC-tckJ7S4LBrHQp-3ANB9Rhu?usp=sharing. [In Ukrainian].
Grytsyuk, M. Yu., & Hrytsiuk, Yu. I. (2018). Nature and Sustainable Development of Tourism in the Carpathian Region Ukraine. Scientific Bulletin of UNFU, 28(2), 99–110. https://doi.org/10.15421/40280219
Havrysh, V. I., & Hrytsiuk, Yu. I. (2021). Analysis of temperature regimes in heat-sensitive layered elements of digital devices caused by internal heating. Scientific Bulletin of UNFU, 31(5), 108–112. https://doi.org/10.36930/40310518
Hrytsiuk, Yu., Grytsyuk, P., Dyak, T., & Hrynyk, H. (2019). Software Development Risk Modeling. IEEE 2019 14th International Scientific and Technical Conference on Computer Sciences and Information Technologies (CSIT 2019), (Vol. 2, pp. 134–137), 17–20 September, Lviv, Ukraine. Lviv: Lviv Polytechnic National University, 206 p. https://doi.org/10.1109/stc-csit.2019.8929778
Kim, K., Baltrušaitis, T., Zadeh, A., Morency, L.-P., & Medioni, G. (2016). Holistically Constrained Local Model: Going Beyond Frontal Poses for Facial Landmark Detection. Procedings of the British Machine Vision Conference 2016. https://doi.org/10.5244/c.30.95
LFW – People (Face Recognition). Retrieved from: https://www.kaggle.com/atulanandjha/lfwpeople
Li, L., Mu, X., Li, S., & Peng, H. (2020). A Review of Face Recognition Technology. IEEE Access, 8, 139110–139120. https://doi.org/10.1109/access.2020.3011028
Liu, J., Fang, C., & Wu, C. (2016). A Fusion Face Recognition Approach Based on 7-Layer Deep Learning Neural Network. Journal of Electrical and Computer Engineering, 1–7. https://doi.org/10.1155/2016/8637260
Masi, I., Tran, A. T., Leksut, J. T., Hassner, T., Medioni, G. (2016). Do we really need to collect millions of faces for effective face recognition? Procedings of the European conference on computer vision 2016.
Salama AbdELminaam, D., Almansori, A. M., Taha, M., & Badr, E. (2020). A deep facial recognition system using computational intelligent algorithms. PLOS ONE, 15(12). https://doi.org/10.1371/journal.pone.0242269
TensorBoard. Retrieved from: https://www.tensorflow.org/tensorboard
Yin, X., & Liu, X. (2018). Multi-Task Convolutional Neural Network for Pose-Invariant Face Recognition. IEEE Transactions on Image Processing, 27(2), 964–975. https://doi.org/10.1109/tip.2017.2765830
Опубліковано
2022-04-28
Як цитувати
Яловега, О. В., & Мельник, Р. А. (2022). Система виявлення обличчя на зображенні з використанням глибинної згорткової нейронної мережі. Науковий вісник НЛТУ України, 32(2), 55-60. https://doi.org/10.36930/40320209
Розділ
Інформаційні технології