Аналіз тематичних зв'язків у багатомовному графі знань кібербезпеки
Анотація
Розширено методику аналізу кібербезпекових текстових корпусів шляхом формалізації міжтематичних залежностей як окремого структурного рівня над двомовним графом знань, що дає змогу перейти від аналізу окремих сутностей до мережевого трактування тематичних взаємодій. На основі 200 україномовних та 200 англомовних документів сформовано двомовний граф знань, виконано семантичну кластеризацію сутностей і побудовано асоціативні правила за заданими пороговими значеннями support, confidence та lift. Отримані правила відображено на рівень тематичних кластерів для побудови орієнтованого зваженого графа тематичних зв'язків, де вагою ребра виступає lift. Показано, що збереження орієнтованості графа є важливим, оскільки ігнорування напряму призводить до втрати інформації про конфігурацію тематичних потоків. Унаслідок цього орієнтований зважений граф забезпечує відображення міжтематичних впливів. Запропоновано інтегрований показник важливості ITS, який поєднує центральність за посередництвом, власну векторну центральність та максимальне значення lift для кожного кластера, проведено аналіз його чутливості за різних конфігурацій вагових коефіцієнтів. Встановлено стабільність ранжування домінантних кластерів за всіх протестованих параметрів, що свідчить про узгодженість топологічних і статистичних характеристик. Зокрема, кластери, пов'язані зі захистом маршрутизаторів, шкідливим програмним забезпеченням та офісним програмним забезпеченням, одночасно виконують роль структурних "містків" і беруть участь у найсильніших асоціативних залежностях. Окрім цього, використання двох мов дозволило сформувати дещо щільнішу та ієрархічно організовану структуру графа тематичних зв'язків порівняно з україномовною моделлю, навіть попри те, що англомовна підмножина окремо не генерувала достатньо сильних правил. Отже, інтеграція україномовного та англомовного корпусів у процес побудови графа дозволила підсилити приховані міжкластерні залежності, що не досягали порогових значень у межах одномовного корпусу та дала змогу виявити структурний центр графа. Переваги результатів дослідження полягають у формалізації моделі міжкластерних залежностей і розробленні кількісного механізму ранжування, що можна використати для аналітичної інтерпретації та виявлення структурно домінантних тематичних напрямів у сфері кібербезпеки. Подальші етапи дослідження передбачають масштабування корпусу, аналіз динаміки тематичних потоків у часі та перевірку стійкості інтегрованого показника важливості на великих мережах.
Завантаження
Посилання
Alharbi, H., Hur, A., Alkahtani, H., & Ahmad, H. F. (2025). Enhancing cybersecurity through autonomous knowledge graph construction by integrating heterogeneous data sources. PeerJ Computer Science, 11, article ID e2768. https://doi.org/10.7717/peerj-cs.2768
Belcastro, L., Carlucci, C., Cosentino, C., Liò, P., & Marozzo, F. (2026). Enhancing network security using knowledge graphs and large language models for explainable threat detection. Future Generation Computer Systems, 176, article ID 108160. https://doi.org/10.1016/j.future.2025.108160
Bratsas, C., Anastasiadis, E. K., Angelidis, A. K., Ioannidis, L., Kotsakis, R., & Ougiaroglou, S. (2024). Knowledge Graphs and Semantic Web Tools in Cyber Threat Intelligence: A Systematic Literature Review. Journal of Cybersecurity and Privacy, 4(3), 518–545. https://doi.org/10.3390/jcp4030025
Cheng, Y., Bajaber, O., Tsegai, S. A., Song, D., & Gao, P. (2025). CTINexus: Automatic Cyber Threat Intelligence Knowledge Graph Construction Using Large Language Models. arXiv preprint arXiv:2410.21060. https://doi.org/10.48550/arXiv.2410.21060
Fan, W., Wang, X., Wu, Y., & Xu, J. (2015). Association rules with graph patterns. Proceedings of the VLDB Endowment, 8(12), 1502–1513. https://doi.org/10.14778/2824032.2824048
Fieblinger, R., Alam, M. T., & Rastogi, N. (2024). Actionable Cyber Threat Intelligence using Knowledge Graphs and Large Language Models. arXiv preprint arXiv:2407.02528. https://doi.org/10.48550/arXiv.2407.02528
Han, J., Kamber, M., & Pei, J. (2011). Data Mining: Concepts and Techniques (3rd ed.). Burlington: Morgan Kaufmann. URL: https://myweb.sabanciuniv.edu/rdehkharghani/files/2016/02/The-Morgan-Kaufmann-Series-in-Data-Management-Systems-Jiawei-Han-Micheline-Kamber-Jian-Pei-Data-Mining.-Concepts-and-Techniques-3rd-Edition-Morgan-Kaufmann-2011.pdf
Hu, Y., Zou, F., Han, J., Sun, X., & Wang, Y. (2024). LLM-TIKG: Threat intelligence knowledge graph construction utilizing large language model. Computers & Security, 145, article ID 103999. https://doi.org/10.1016/j.cose.2024.103999
Huang, L., & Xiao, X. (2024). CTIKG: LLM-Powered Knowledge Graph Construction from Cyber Threat Intelligence. First Conference on Language Modeling. URL: https://openreview.net/forum?id=DOMP5AqwQz
Li, Y., Thomas, M., & Osei-Bryson, K. M. (2014). Using Association Rules Mining to Facilitate Qualitative Data Analysis in Theory Building. In Lecture Notes in Information Systems and Organisation, 34, 79–91. https://doi.org/10.1007/978-1-4614-9463-8_7
Mouiche, I., & Saad, S. (2025). Entity and relation extractions for threat intelligence knowledge graphs. Computers & Security, 148, article ID 104120. https://doi.org/10.1016/j.cose.2024.104120
Papoutsoglou, M., Meditskos, G., Bassiliades, N., Kontopoulos, E., & Vrochidis, S. (2024). Mapping the Current Status of CTI Knowledge Graphs through a Bibliometric Analysis. In SETN 2024. ACM. https://doi.org/10.1145/3688671.3688738
Pavlyshenko, B., Stasiuk, M. (2025). Multilingual Knowledge Graph for Thematic Text Analysis. In International Scientific and Technical Conference Security of Modern Information and Communication Systems (SMICS-2025), pp. 380–384. URL:. https://smics.lnu.edu.ua/uk/zbirnyk/
Sasaki, Y., & Karras, P. (2024). Mining Path Association Rules in Large Property Graphs. In Proceedings of the 33rd ACM International Conference on Information and Knowledge Management (pp. 1994–2003). https://doi.org/10.1145/3627673.3679525
Termos, M., Ghalmane, Z., Brahmia, M. E. A., Fadlallah, A., Jaber, A., & Zghal, M. (2024). GDLC: A new Graph Deep Learning framework based on centrality measures for intrusion detection in IoT networks. Internet of Things, 26, article ID 101214. https://doi.org/10.1016/j.iot.2024.101214
Zhang, Z., Huang, J., & Tan, Q. (2020). Association Rules Enhanced Knowledge Graph Attention Network. arXiv preprint arXiv:2011.08431. https://doi.org/10.48550/arXiv.2011.08431
Zhu, B., Wang, R., Wang, J., Shao, F., & Wang, K. (2024). A survey: knowledge graph entity alignment research based on graph embedding. Artificial Intelligence Review, 57(9), article ID 229. https://doi.org/10.1007/s10462-024-10866-4

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.



