Математичні метод і модель диференціації фоностатистичних структур авторського стилю

  • I. Yu. Khomytska Національний університет "Львівська політехніка", м. Львів https://orcid.org/0000-0003-3470-7197
  • V. M. Teslyuk Національний університет "Львівська політехніка", м. Львів https://orcid.org/0000-0002-5974-9310
  • V. V. Beregovskyi Івано-Франківський національний технічний університет нафти і газу, м. Івано-Франківськ
Ключові слова: фоностатистична структура стилю; диференціація текстів; авторська атрибуція тексту

Анотація

Розроблено метод комплексного аналізу диференціації фоностатистичних структур авторського стилю англійської мови, який ґрунтується на поєднанні трьох статистичних критеріїв: критерію Стьюдента, критерію Колмогорова-Смірнова і критерію хі-квадрат. Поєднання цих критеріїв дає змогу підвищити достовірність диференціації авторських стилів. Для розв'язання задачі диференціації авторських стилів побудовано статистичну модель, яка підвищує достовірність результатів авторської атрибуції тексту. Розроблена програмна система реалізує метод і модель з використанням мови програмування Java, що забезпечує платформонезалежність. Для тестування програми вибрано статті С. Логан і Д. Вебстер з газети "Вільна газета" ("Freedom Paper", papers by S. Logan and D. Webster). Істотні відмінності встановлено за групами носових, дорсальних і велярних фонем за критерієм Стьюдента, за всіма вісьмома групами фонем за критерієм Колмогорова-Смірнова, істотні відмінності встановлено за групами сонорних, щілинних, дорсальних, зімкнених, губних і носових фонем за критерієм хі-квадрат. Поєднання використаних критеріїв дало змогу встановити групу фонем з найбільшою авторорозрізняльною здатністю. Це група дорсальних фонем. За цією групою можна диференціювати тексти різних авторів, що дає змогу змінімізувати кількість груп фонем, за якими здійснюється авторська атрибуція тексту.

Біографії авторів

I. Yu. Khomytska, Національний університет "Львівська політехніка", м. Львів

асистент, кафедра прикладної лінгвістики

V. M. Teslyuk, Національний університет "Львівська політехніка", м. Львів

д-р техн. наук, професор, кафедра систем автоматизованого проектування

V. V. Beregovskyi, Івано-Франківський національний технічний університет нафти і газу, м. Івано-Франківськ

канд. техн. наук, доцент, кафедра комп'ютерних систем і мереж

Посилання

Altman, H. (2005). Moda ta istyna v linhvistytsi. Problema kvantytatyvnoi linhvistyky. Chernivtsi: Ruta, (pp. 3–11). [In Ukrainian].

Altmann, G., Kohler, R., & Piotrowski, R. (2005). Quantitative Linquistik. Ein internationals Handbuch. Berlin, New-York: de Gruyter.

Argamon, Sh., Koppel, M., Pennebaker, J., & Schler, J. (2009). Automatically Profiling the Author of an Anonymous Text. Communications of the ACM, 52(2), 119–123. USA.

Bisikalo, O. V., & Vysotska, V. A. (2016). Sentence syntactic analysis application to keywords identification ukrainian texts. Radio electronics computer science control, 3(38), 54–65. Zaporizhzhya.

Gries, Th. S. (2009). Statistics for Linguistics with R. (Mouton Textbook), 335 p.

Juala, P. (2008). Authorship Attribution, Foundations and Trends (R) in Information Retrieval, 1(3), 233–334. Boston – Delft.

Khomytska, I. Yu., Tesliuk, V. M., & Labinska, L. S. (2018). Prohramna systema avtorskoi atrybutsii tekstiv na fonolohichnomu rivni. Problemy ta perspektyvy rozvytku ekonomiky i pidpryiemnytstva ta kompiuternykh tekhnolohii v Ukraini: Collection of theses of the 14th scientific-practical conference, Lviv. (pp. 15–16). [In Ukrainian].

Khomytska, I., Teslyuk, V., & Shakhovska, N. (Ed.). (2016). The Method of Statistical Analysis of the Scientific, Colloquial, Belles-Lettres and Newspaper Styles on the Phonological Level. Advances in Intelligent Systems and Computing, 512, 149–163. Lviv.

Khomytska, I., Teslyuk, V., & Shakhovska, N. (Ed.). (2018). Authorship and Style Attribution by Statistical Methods of Style Differentiation on the Phonological Level. Advances in Intelligent Systems and Computing III, 871, 105–118. Lviv.

Khomytska, I., Teslyuk, V., Holovatyy, A., & Morushko, O. (2018). Development of Methods, Models and Means for the Author Attribution of a Text. Eastern-European Journal of Enterprise Technologies, 3/2(93), 41–46. Kharkiv.

Koppel, M. (2009). Computational Methods in Authorship Attribution. Journal of the Association for Information Science and Technology, 60(1), 9–26. USA.

Levitckii, V. V. (2007). Kvantitativnye metody v lingvistike. Vinnytsia: New Book, 259 p. [In Russian].

Lytvyn, V., Vysotska, V., Dosyn, D., Holoschuk, R., & Rybchak, Z. (2017a). Application of Sentence Parsing for Determining Keywords in Ukrainian Texts. CSIT: Proceedings of the 12th Scientific and Technical Conference, Lviv. (pp. 326–331).

Lytvyn, V., Vysotska, V., Pukach, P., Bobyk, I., & Uhryn, D. (2017b). Development of a method for the recognition of authors style in the ukrainian language texts based on linguometry, stylemetry and glottochronology. Eastern-European Journal of Enterprise Technologies, 4/2(88), 10–18.

Perebyinis, V. S. (2013). Statystychni metody dlia linhvistiv. Vinnytsia: New Book, 170 p. [In Ukrainian].

Piotrovskii, R. G. (1999). Lingvisticheskii avtomat i ego rechemyslitelnoe obosnovanie. Minsk, 126 p. [In Russian].

Segal, D. M. (1968). Statisticheskaia odnorodnost teksta na fonologicheskom urovne v polskom iazyke. Strukturnaia tipologiia iazykov, 85–93. Moscow. . [In Russian].

Segal, D. M. (1972). Osnovy fonologicheskoi statistiki. Moscow: Science, 255 p. [In Russian].

Опубліковано
2019-09-26
Як цитувати
Khomytska, I. Y., Teslyuk, V. M., & Beregovskyi, V. V. (2019). Математичні метод і модель диференціації фоностатистичних структур авторського стилю. Науковий вісник НЛТУ України, 29(7), 155-159. https://doi.org/10.15421/40290731
Розділ
Інформаційні технології

Статті цього автора (авторів), які найбільше читають