Метод виявлення фіктивних підприємств на підставі Гаусового наївного класифікатора Байєса

Ключові слова: суб'єкти господарювання, економічні злочини, класифікація, машинне навчання

Анотація

Розроблено метод виявлення фіктивних підприємств на підставі машинного навчання за допомогою Гаусового наївного класифікатора Байєса, що є корисним для працівників державного сектору із запобігання економічним злочинам. Встановлено, що фіктивне підприємництво, як самостійний злочин, одночасно є своєрідним засобом вчинення цілої низки інших кримінальних правопорушень у сфері економіки. Це можуть бути суб'єкти господарювання, які мають ознаки фіктивності, а саме використання неправдивої інформації щодо засновників, адміністрації, місцезнаходження. Тому виявлення таких підприємств є актуальним питанням для будь-якої держави. Розслідування економічного злочину потребує багато часу для працівників правоохоронних органів і додаткових коштів. З огляду на це, розроблення інструменту розпізнавання фіктивного підприємства на підставі класичного методу машинного навчання є одним із перспективних напрямів зі швидкого виявлення економічних злочинів. Під час дослідження робіт у сфері діяльності фіктивних підприємств виявлено, що вони не описують саме виявлення фіктивних підприємств за допомогою інформаційних технологій. Тому потрібно розробити метод виявлення фіктивного підприємства на підставі машинного навчання за допомогою Гаусового наївного класифікатора Байєса, що надалі дасть змогу розробити програмне середовище для працівників державного сектору із запобігання економічних злочинів. У роботі визначено основні типи фіктивних підприємств, зокрема за призначенням та способом створення. На підставі цього запропоновано алгоритм виявлення фіктивного підприємства на підставі класичного методу машинного навчання, такого як Гаусовий наївний класифікатор Байєса, що уможливлює відстежування фіктивного підприємства. Для побудови методу використано дані 1100 компаній, що здійснювали економічну діяльність в Україні. Виконано розподіл ймовірності, за допомогою оцінки щільності ядра KDE (англ. Kernel Density Estimation). Побудовано діаграму кореляційної матриці, встановлено дуже малі коефіцієнти кореляції між більшістю ознак. Виведено гістограми відмінностей середніх значень і дисперсії вибірки для двох класів. Для машинного навчання моделі поєднано квантильний перетворювач і Гаусовий наївний класифікатор Байєса.

Біографії авторів

Х. В. Ліп'яніна-Гончаренко, Західноукраїнський національний університет, м. Тернопіль

канд. техн. наук, доцент, кафедра інформаційно-обчислювальних систем і управління

М. П. Комар, Західноукраїнський національний університет, м. Тернопіль

д-р техн. наук, доцент, кафедра інформаційно-обчислювальних систем і управління

А. О. Саченко, Західноукраїнський національний університет, м. Тернопіль

д-р техн. наук, професор, кафедра інформаційно-обчислювальних систем і управління

Т. В. Лендюк, Західноукраїнський національний університет, м. Тернопіль

канд. техн. наук, доцент, кафедра інформаційно-обчислювальних систем і управління

Посилання

Canhoto, A. I. (2021). Leveraging machine learning in the global fight against money laundering and terrorism financing: An affordances perspective. Journal of Business Research, 131, 441–452. https://doi.org/10.1016/j.jbusres.2020.10.012

Chen, Z., Van Khoa, L. D., Teoh, E. N., Nazir, A., Karuppiah, E. K. & Lam, K. S. (2018). Machine learning techniques for anti-money laundering (AML) solutions in suspicious transaction detection: a review. Knowledge and Information Systems, 57, 245–285. https://doi.org/10.1007/s10115-017-1144-z

Jahromi, A. H., & Taheri, M. (2017). A non-parametric mixture of Gaussian naive Bayes classifiers based on local independent features. In Proceedings of the 2017 Artificial Intelligence and Signal Processing Conference (AISP), 2017, 209-212. https://doi.org/10.1109/AISP.2017.8324083

Jullum, M., Løland, A., Huseby, R.B., Ånonsen, G., & Lorentzen, J. (2020). Detecting money laundering transactions with machine learning. Journal of Money Laundering Control, 23(1), 173–186. https://doi.org/10.1108/JMLC-07-2019-0055

Kumar, A., Das, S., Tyagi, V., Shaw, R. N., & Ghosh, A. (2021). Analysis of Classifier Algorithms to Detect Anti-Money Laundering. In: Bansal, J. C., Paprzycki, M., Bianchini, M., Das, S. (Eds). Computationally Intelligent Systems and their Applications. Studies in Computational Intelligence, 950. Springer, Singapore, 143–152. https://doi.org/10.1007/978-981-16-0407-2_11

Kute, D. V., Pradhan, B., Shukla, N., & Alamri, A. (2021). Deep learning and explainable artificial intelligence techniques applied for detecting money laundering – A critical review. IEEE Access, 9, 82300–82317. https://doi.org/10.1109/ACCESS.2021.3086230

Lipyanina, H., Maksymovych, V., Sachenko, A., Lendyuk, T., Fomenko, A., & Kit, I. (2020). Assessing the investment risk of virtual IT company based on machine learning. In: Babichev, S., Peleshko, D., Vynokurova, O. (Eds). Data Stream Mining & Processing. DSMP 2020. Communications in Computer and Information Science, 1158, 167–187. Springer, Cham. https://doi.org/10.1007/978-3-030-61656-4_11

Ontivero-Ortega, M., Lage-Castellanos, A., Valente, G., Goebel, R., & Valdes-Sosa, M. (2017). Fast Gaussian Naive Bayes for searchlight classification analysis. Neuroimage, 163, 471–479. https://doi.org/10.1016/j.neuroimage.2017.09.001

Salma, D. F., Murfi, H., & Sarwinda, D. (2019). The performance of one dimensional Naive Bayes classifier for feature selection in predicting prospective car insurance buyers. In: Tan, Y., Shi, Y. (Eds). Data Mining and Big Data, DMBD 2019. Communications in Computer and Information Science, 1071. Springer, Singapore, 124–132. https://doi.org/10.1007/978-981-32-9563-6_13

Tiwari, M., Gepp, A., & Kumar, K. (2020). A review of money laundering literature: the state of research in key areas. Pacific Accounting Review, 32(2), 271–303. https://doi.org/10.1108/PAR-06-2019-0065

Valdiviezo-Diaz, P., Ortega, F., Cobos, E., & Lara-Cabrera, R. (2019). A collaborative filtering approach based on Naive Bayes Classifier. IEEE Access, 7, 108581-108592. https://doi.org/10.1109/ACCESS.2019.2933048

Yodnual, O., & Chaisricharoen, R. (2021). Optimized classification for organizational workload. In Proceedings of the 2021 IEEE Joint International Conference on Digital Arts, Media and Technology with ECTI Northern Section Conference on Electrical, Electronics, Computer and Telecommunication Engineering, 313-317. https://doi.org/10.1109/ECTIDAMTNCON51128.2021.9425699

Опубліковано
2022-11-02
Як цитувати
Ліп’яніна-Гончаренко, Х. В., Комар, М. П., Саченко, А. О., & Лендюк, Т. В. (2022). Метод виявлення фіктивних підприємств на підставі Гаусового наївного класифікатора Байєса. Науковий вісник НЛТУ України, 32(5), 92-96. https://doi.org/10.36930/40320513
Розділ
Інформаційні технології