Використання алгоритмів машинного навчання для автоматизації процесу модерації контенту в групових чатах месенджерів

Ключові слова: Telegram-бот, оптимізація рою частинок, алгоритм рою салпів, оптимізація Сірого вовка, машини підтримки векторів, вибір класифікаційних функцій, класифікація, ансамблеві методи

Анотація

Проаналізовано особливості інтеграції методів машинного навчання ML (англ. Machine Learning) в автоматизовану систему модерації групових чатів Telegram для вдосконалення процесу управління широкомасштабними комунікаціями. З'ясовано, що проблема модерації великих групових чатів стає особливо нагальною через збільшення обсягу повідомлень і розмаїття контенту, що потребує ефективної системи їх фільтрації для забезпечення безпеки комунікаційного середовища. Застосовано розширені алгоритми вибору функцій класифікації, такі як оптимізація рою частинок PSO (англ. Particle Swarm Optimization), алгоритм рою салпів SSA (англ. Salp Swarm Algorithm) і оптимізація Сірого вовка GWO (англ. Gray Wolf Optimization), для автоматизації процесу виявлення найбільш релевантних характеристик повідомлень, що значно покращує процес модерації групових чатів. Досліджено особливості застосування методів класифікації, зокрема машин підтримки векторів SVM (англ. Support Vector Machines) та алгоритму найближчих сусідів kNN (англ. k-Nearest Neighbors), для ідентифікації неприйнятного або шкідливого контенту. Встановлено, що вибір класифікаційних функцій є критичним для зменшення розмірності даних і підвищення точності класифікації. Проведено порівняльний аналіз ефективності алгоритмів PSO, SSA і GWO в контексті модерації чатів. Показано, що алгоритм PSO демонструє високу ефективність завдяки швидкій адаптації до мінливого комунікаційного середовища, тоді як алгоритми SSA і GWO демонструють варіації у підходах до глобальної оптимізації вибору функцій класифікації. Розроблено систему класифікації, в якій комбінація алгоритмів PSO+SVM досягає найвищої точності, перевершуючи інші алгоритми за збалансованістю швидкості та точності класифікації. Наведено також результати для комбінацій алгоритмів SSA+kNN і алгоритмів GWO+kNN, які, хоча і показують високу ефективність, мають менш стабільні результати в різних умовах. Проведено оцінювання продуктивності зазначених алгоритмів за такими показниками, як точність, чутливість, специфічність, вивіреність і оцінка F1. Комплексний аналіз цих алгоритмів підтвердив, що впровадження вдосконалених алгоритмів вибору функцій класифікації значно покращує точність виявлення шкідливого контенту, зменшуючи кількість помилкових спрацьовувань і підвищуючи загальну ефективність процесу модерації. Дослідження відповідних алгоритмів щодо модерації вмісту також встановило потенційне застосування розробленої системи на інших платформах та у нових доменах для забезпечення масштабованого й адаптованого рішення та підтримки безпеки в онлайн-комунікаціях.

Завантаження

Дані завантаження ще не доступні.

Афіліація авторів

О. В. Мокрицька, Національний університет "Львівська політехніка", м. Львів

канд. техн. наук, доцент, кафедра систем автоматизованого проектування

Ю. М. Мочернюк, Національний лісотехнічний університет України, м. Львів

аспірант, кафедра інженерії програмного забезпечення

Посилання

Ahmad, R., Wazirali, R., Bsoul, Q., Abu-Ain, T., & Abu-Ain, W. (2021). Feature-selection and mutual-clustering approaches to improve DoS detection and maintain WSNs lifetime. Sensors, 21(14). https://doi.org/10.3390/s21144821

Almaiah, M., Almaiah, D., Alrawashdeh, R., Alkhdour, T., Al-Ali, R., Rjoub, G., & Aldahyani, T. (2024). Detecting DDoS attacks using machine learning algorithms and feature selection methods. International Journal of Data and Network Science, 8(2), 45–58. https://doi.org/10.5267/j.ijdns.2024.6.001

Gongane, V., Munot, M., & Anuse, D. (2022). Detection and moderation of detrimental content on social media platforms: current status and future directions. Social Network Analysis and Mining, 12. https://doi.org/10.1007/s13278-022-00951-3

Gulati, G., Jha, H. A., Jain, R., Sharma, M., & Chaudhary, V. (2024). Content moderation system using machine learning techniques. In: Hassanien, A. E., Castillo, O., Anand, S., & Jaiswal, A. (Eds.). International Conference on Innovative Computing and Communications. Springer, Singapore. https://doi.org/10.1007/978-981-99-4071-4_58

Han, H., Asif, M., Awwad, E. M., et al. (2024). Innovative deep learning techniques for monitoring aggressive behavior in social media posts. Journal of Cloud Computing, 13, 19 p. https://doi.org/10.1186/s13677-023-00577-6

Hongyu, P., Shanxiong, C., & Hailing, X. (2023). A high-dimensional feature selection method based on modified Gray Wolf Optimization. Applied Soft Computing, 135. https://doi.org/10.1016/j.asoc.2023.110031

Hrytsiuk, Y. I. (2022). Features of giving preference to the characteristics of the software product quality model. Scientific Bulletin of UNFU, 32(3), 79–102. https://doi.org/10.36930/40320313

Liu, X., & Du, Y. (2023). Towards effective feature selection for IoT botnet attack detection using a genetic algorithm. Electronics, 12(5). https://doi.org/10.3390/Electronics12051260

Mantri, A. (2021). Real-Time Content Moderation Using Artificial Intelligence and Machine Learning. International Journal of Scientific and Engineering Research, 10, 1682–1684. https://doi.org/10.21275/SR24724150350

Nachaoui, M., Lakouam, I., & Hafidi, I. (2024). Hybrid particle swarm optimization algorithm for text feature selection problems. Neural Comput & Applic, 36, 7471–7489. https://doi.org/10.1007/s00521-024-09472-w

Sang, B., Xu, W., Chen, H., & Li, T. (2023). Active antinoise fuzzy dominance rough feature selection using adaptive k-Nearest Neighbors. IEEE Transactions on Fuzzy Systems, 31(11), 3944–3958. https://doi.org/10.1109/TFUZZ.2023.3272316

Veena, K., Meena, K., Teekaraman, Y., Kuppusamy, R., & Radhakrishnan, A. (2022). SVM Classification and kNN Techniques for Cyber Crime Detection. Security Threats and Challenges in Future Mobile Communication Systems. https://doi.org/10.1155/2022/3640017

Wolters, A., Müller, K., & Riehle, D. M. (2022). Incremental Machine Learning for Text Classification in Comment Moderation Systems. Lecture Notes in Computer Science, 13427, 160–171. https://doi.org/10.1007/978-3-031-18253-2_10

Ye, Y., Le, T., & Lee, D. (2023). NoisyHate: Benchmarking Content Moderation Machine Learning Models with Human-Written Perturbations Online. https://doi.org/10.48550/arXiv.2303.10430


Переглядів анотації: 127
Завантажень PDF: 250
Опубліковано
2024-11-21
Як цитувати
Мокрицька, О. В., & Мочернюк, Ю. М. (2024). Використання алгоритмів машинного навчання для автоматизації процесу модерації контенту в групових чатах месенджерів. Scientific Bulletin of UNFU, 34(7), 52-59. https://doi.org/10.36930/40340707
Розділ
Інформаційні технології