Аналіз тематичних зв'язків у багатомовному графі знань кібербезпеки

Б. М. Павлишенко; М. І. Стасюк

doi:10.36930/40360115

Б. М. Павлишенко Львівський національний університет ім. Івана Франка, Львів https://orcid.org/0000-0001-9515-3488
М. І. Стасюк Львівський національний університет ім. Івана Франка, Львів https://orcid.org/0009-0006-5256-2103

Ключові слова: асоціативні правила, семантична кластеризація, міжмовне узгодження, мережеві метрики, структуризація інформації

Анотація

Розширено методику аналізу кібербезпекових текстових корпусів шляхом формалізації міжтематичних залежностей як окремого структурного рівня над двомовним графом знань, що дає змогу перейти від аналізу окремих сутностей до мережевого трактування тематичних взаємодій. На основі 200 україномовних та 200 англомовних документів сформовано двомовний граф знань, виконано семантичну кластеризацію сутностей і побудовано асоціативні правила за заданими пороговими значеннями support, confidence та lift. Отримані правила відображено на рівень тематичних кластерів для побудови орієнтованого зваженого графа тематичних зв'язків, де вагою ребра виступає lift. Показано, що збереження орієнтованості графа є важливим, оскільки ігнорування напряму призводить до втрати інформації про конфігурацію тематичних потоків. Унаслідок цього орієнтований зважений граф забезпечує відображення міжтематичних впливів. Запропоновано інтегрований показник важливості ITS, який поєднує центральність за посередництвом, власну векторну центральність та максимальне значення lift для кожного кластера, проведено аналіз його чутливості за різних конфігурацій вагових коефіцієнтів. Встановлено стабільність ранжування домінантних кластерів за всіх протестованих параметрів, що свідчить про узгодженість топологічних і статистичних характеристик. Зокрема, кластери, пов'язані зі захистом маршрутизаторів, шкідливим програмним забезпеченням та офісним програмним забезпеченням, одночасно виконують роль структурних "містків" і беруть участь у найсильніших асоціативних залежностях. Окрім цього, використання двох мов дозволило сформувати дещо щільнішу та ієрархічно організовану структуру графа тематичних зв'язків порівняно з україномовною моделлю, навіть попри те, що англомовна підмножина окремо не генерувала достатньо сильних правил. Отже, інтеграція україномовного та англомовного корпусів у процес побудови графа дозволила підсилити приховані міжкластерні залежності, що не досягали порогових значень у межах одномовного корпусу та дала змогу виявити структурний центр графа. Переваги результатів дослідження полягають у формалізації моделі міжкластерних залежностей і розробленні кількісного механізму ранжування, що можна використати для аналітичної інтерпретації та виявлення структурно домінантних тематичних напрямів у сфері кібербезпеки. Подальші етапи дослідження передбачають масштабування корпусу, аналіз динаміки тематичних потоків у часі та перевірку стійкості інтегрованого показника важливості на великих мережах.

Завантаження

Дані завантаження ще не доступні.

Біографії авторів

Б. М. Павлишенко, Львівський національний університет ім. Івана Франка, Львів

д-р техн. наук, доцент, кафедра системного проектування

М. І. Стасюк, Львівський національний університет ім. Івана Франка, Львів

аспірант, кафедра системного проектування

Посилання

Alharbi, H., Hur, A., Alkahtani, H., & Ahmad, H. F. (2025). Enhancing cybersecurity through autonomous knowledge graph construction by integrating heterogeneous data sources. PeerJ Computer Science, 11, article ID e2768. https://doi.org/10.7717/peerj-cs.2768

Belcastro, L., Carlucci, C., Cosentino, C., Liò, P., & Marozzo, F. (2026). Enhancing network security using knowledge graphs and large language models for explainable threat detection. Future Generation Computer Systems, 176, article ID 108160. https://doi.org/10.1016/j.future.2025.108160

Bratsas, C., Anastasiadis, E. K., Angelidis, A. K., Ioannidis, L., Kotsakis, R., & Ougiaroglou, S. (2024). Knowledge Graphs and Semantic Web Tools in Cyber Threat Intelligence: A Systematic Literature Review. Journal of Cybersecurity and Privacy, 4(3), 518–545. https://doi.org/10.3390/jcp4030025

Cheng, Y., Bajaber, O., Tsegai, S. A., Song, D., & Gao, P. (2025). CTINexus: Automatic Cyber Threat Intelligence Knowledge Graph Construction Using Large Language Models. arXiv preprint arXiv:2410.21060. https://doi.org/10.48550/arXiv.2410.21060

Fan, W., Wang, X., Wu, Y., & Xu, J. (2015). Association rules with graph patterns. Proceedings of the VLDB Endowment, 8(12), 1502–1513. https://doi.org/10.14778/2824032.2824048

Fieblinger, R., Alam, M. T., & Rastogi, N. (2024). Actionable Cyber Threat Intelligence using Knowledge Graphs and Large Language Models. arXiv preprint arXiv:2407.02528. https://doi.org/10.48550/arXiv.2407.02528

Han, J., Kamber, M., & Pei, J. (2011). Data Mining: Concepts and Techniques (3rd ed.). Burlington: Morgan Kaufmann. URL: https://myweb.sabanciuniv.edu/rdehkharghani/files/2016/02/The-Morgan-Kaufmann-Series-in-Data-Management-Systems-Jiawei-Han-Micheline-Kamber-Jian-Pei-Data-Mining.-Concepts-and-Techniques-3rd-Edition-Morgan-Kaufmann-2011.pdf

Hu, Y., Zou, F., Han, J., Sun, X., & Wang, Y. (2024). LLM-TIKG: Threat intelligence knowledge graph construction utilizing large language model. Computers & Security, 145, article ID 103999. https://doi.org/10.1016/j.cose.2024.103999

Huang, L., & Xiao, X. (2024). CTIKG: LLM-Powered Knowledge Graph Construction from Cyber Threat Intelligence. First Conference on Language Modeling. URL: https://openreview.net/forum?id=DOMP5AqwQz

Li, Y., Thomas, M., & Osei-Bryson, K. M. (2014). Using Association Rules Mining to Facilitate Qualitative Data Analysis in Theory Building. In Lecture Notes in Information Systems and Organisation, 34, 79–91. https://doi.org/10.1007/978-1-4614-9463-8_7

Mouiche, I., & Saad, S. (2025). Entity and relation extractions for threat intelligence knowledge graphs. Computers & Security, 148, article ID 104120. https://doi.org/10.1016/j.cose.2024.104120

Papoutsoglou, M., Meditskos, G., Bassiliades, N., Kontopoulos, E., & Vrochidis, S. (2024). Mapping the Current Status of CTI Knowledge Graphs through a Bibliometric Analysis. In SETN 2024. ACM. https://doi.org/10.1145/3688671.3688738

Pavlyshenko, B., Stasiuk, M. (2025). Multilingual Knowledge Graph for Thematic Text Analysis. In International Scientific and Technical Conference Security of Modern Information and Communication Systems (SMICS-2025), pp. 380–384. URL:. https://smics.lnu.edu.ua/uk/zbirnyk/

Sasaki, Y., & Karras, P. (2024). Mining Path Association Rules in Large Property Graphs. In Proceedings of the 33rd ACM International Conference on Information and Knowledge Management (pp. 1994–2003). https://doi.org/10.1145/3627673.3679525

Termos, M., Ghalmane, Z., Brahmia, M. E. A., Fadlallah, A., Jaber, A., & Zghal, M. (2024). GDLC: A new Graph Deep Learning framework based on centrality measures for intrusion detection in IoT networks. Internet of Things, 26, article ID 101214. https://doi.org/10.1016/j.iot.2024.101214

Zhang, Z., Huang, J., & Tan, Q. (2020). Association Rules Enhanced Knowledge Graph Attention Network. arXiv preprint arXiv:2011.08431. https://doi.org/10.48550/arXiv.2011.08431

Zhu, B., Wang, R., Wang, J., Shao, F., & Wang, K. (2024). A survey: knowledge graph entity alignment research based on graph embedding. Artificial Intelligence Review, 57(9), article ID 229. https://doi.org/10.1007/s10462-024-10866-4