Нові методи та рішення щодо побудови моделі поведінки користувачів

Ключові слова: вибірка шаблонів; послідовний асоціативний аналіз; кластеризація

Анотація

Наведено нові методи та рішення щодо побудови моделі поведінки користувачів, які дадуть змогу виявити закономірності планування зустрічей друзів на підставі аналізу їхнього щоденного руху. Для цього попередньо проаналізовано низку методів і алгоритмів кластеризації даних і виокремлено особливості їхнього застосування. З'ясовано, що основними перевагами методів кластеризації даних на підставі їхньої щільності є можливість виявлення кластерів вільної форми різного розміру та стійкості до шуму та викидів. Однак до недоліків цих методів можна віднести високу чутливість до встановлення вхідних параметрів, не чіткий опис класів і непридатність для кластеризації даних великих розмірів. З'ясовано, що основною проблемою всіх алгоритмів кластеризації є їх масштабованість із збільшенням обсягу оброблених даних. Встановлено, що основними проблемами більшості з них є складність налаштування оптимальних вхідних параметрів (для алгоритмів щільності, сітки чи моделі), ідентифікація кластерів різної форми та щільності (алгоритми розподілу, алгоритми на підставі сітки), нечіткі критерії завершення (ієрархічний, розділовий та на підставі моделі). Оскільки процедура кластеризації є тільки одним із етапів оброблення даних системи загалом, обраний алгоритм повинен бути простим у використанні та простим для налаштування вхідних параметрів. Дослідження показують, що ієрархічні методи кластеризації містять ряд алгоритмів, придатних як для оброблення даних невеликого обсягу, так і для аналізу великих даних, що є актуальним у галузі соціальних мереж. На підставі виконаного аналізу даних, зібрано інформацію для заповнення розумного профілю користувача. Значну увагу приділено дослідженню асоціативних правил, на підставі чого запропоновано алгоритм для вилучення асоціативних правил, що дало змогу знаходити статистично значущі правила, а також шукати тільки залежності, визначені загальним набором вхідних даних, та має високу обчислювальну складність, якщо існує багато правил класифікації. Розроблено підхід, що орієнтований на створення та розуміння моделей поведінки користувачів, прогнозування майбутньої поведінки за допомогою створеного шаблону. Досліджено методи моделювання попереднього оброблення даних (кластеризація) та виявлено закономірності планування зустрічей друзів на підставі аналізу щоденного руху людей та їхніх друзів. Наведено методи створення та розуміння моделей поведінки користувачів, застосовано алгоритм k-means для групування користувачів, що дало змогу визначити, наскільки добре кожен об'єкт знаходиться у своєму кластері. Введено поняття правил асоціації, розроблено метод пошуку залежностей, оцінено точність моделі.

Біографії авторів

Н. Б. Шаховська, Національний університет "Львівська політехніка", м. Львів

д-р техн. наук, професор, завідувач кафедри систем штучного інтелекту

Н. І. Мельникова, Національний університет "Львівська політехніка", м. Львів

канд. техн. наук, доцент, кафедра систем штучного інтелекту

Посилання

Bonchi, F., Castillo, C., Gionis, A., & Jaimes, A. (2011). Social Network Analysis and Mining for Business Applications. ACM Transactions on Intelligent Systems and Technology, 2(3), 1–37. https://doi.org/10.1145/1961189.1961194

Hardiman, S. J., & Katzir, L. (2013). Estimating clustering coefficients and size of social networks via random walk. Proceedings of the 22nd International Conference on World Wide Web (WWW2013), 539–550. https://doi.org/10.1145/2488388.2488436

Jadhav, B. S., Bhosale, D. S., & Jadhav, D. S. (2016). Pattern based topic model for data mining. International Conference on Inventive Computation Technologies (ICICT2016), 1–6. https://doi.org/10.1109/inventive.2016.7824855

Maulik, U., & Bandyopadhyay, S. (2000). Genetic algorithm-based clustering technique. Pattern Recognition, 33(9), 1455–1465. https://doi.org/10.1016/s0031-3203(99)00137-5

Melnykova, N., Marikutsa, U., & Kryvenchuk, U. (2018). The New Approaches of Heterogeneous Data Consolidation. IEEE 13th International Scientific and Technical Conference on Computer Sciences and Information Technologies (CSIT2018), 408–411. https://doi.org/10.1109/stc-csit.2018.8526677

Newman, M. E. J. (2003). Mixing patterns in networks. Physical Review E, 67(2), 113–126. https://doi.org/10.1103/physreve.67.026126

Osman, Ahmed, & Shahat, M. (2019). A Novel Big Data Analytics Framework for Smart Cities. Future Generation Computer Systems, 91, 620–33. https://doi.org/10.1016/j.future.2018.06.046

Ramírez-Rubio, R., Aldape-Pérez, M., Yáñez-Márquez, C., López-Yáñez, I., & Camacho-Nieto, O. (2017). Pattern classification using smallest normalized difference associative memory. Pattern Recognition Letters, 93, 104–112. https://doi.org/10.1016/j.patrec.2017.02.013

Ranjith, K. S., Zhenning, Y., Caytiles, R. D., & Iyengar, N. C. S. N. (2017). Comparative Analysis of Association Rule Mining Algorithms for the Distributed Data. International Journal of Advanced Science and Technology, 102, 49–60. https://doi.org/10.14257/ijast.2017.102.05

Shakhovska, N., Fedushko, S., Greguš ml., M., Melnykova, N., Shvorob, I., & Syerov, Y. (2019). Big Data analysis in development of personalized medical system. Procedia Computer Science, 160, 229–234. https://doi.org/10.1016/j.procs.2019.09.461

Shakhovska, N., Kaminskyy, R., Zasoba, E., & Tsiutsiura, M. (2018). Association Rules Mining in Big Data. International Journal of Computing, 17, 25–32.

Yang, T., Hou, Z., Liang, J., Gu, Y., & Chao, X. (2020). Depth Sequential Information Entropy Maps and Multi-Label Subspace Learning for Human Action Recognition. IEEE Access, 8, 135118–135130. https://doi.org/10.1109/access.2020.3006067

Yang, X., Lin, X., & Lin, X. (2019). Application of Apriori and FP-growth algorithms in soft examination data analysis. Journal of Intelligent & Fuzzy Systems, 37(1), 425–432. https://doi.org/10.3233/jifs-179097

Опубліковано
2020-11-03
Як цитувати
Шаховська, Н. Б., & Мельникова, Н. І. (2020). Нові методи та рішення щодо побудови моделі поведінки користувачів. Науковий вісник НЛТУ України, 30(5), 76-83. https://doi.org/10.36930/40300513
Розділ
Інформаційні технології