Метод комплексного аналізу диференціації фоностатистичних структур стилів англійської мови

  • I. Yu. Khomytska Національний університет "Львівська політехніка", м. Львів https://orcid.org/0000-0003-3470-7197
  • V. M. Теslyuk Національний університет "Львівська політехніка", м. Львів https://orcid.org/0000-0002-5974-9310
  • V. V. Beregovskyi Івано-Франківський національний технічний університет нафти і газу, м. Івано-Франківськ
Ключові слова: фоностатистична структура стилю; стильова атрибуція тексту; авторська атрибуція тексту

Анотація

Розроблено метод комплексного аналізу диференціації фоностатистичних структур стилів англійської мови. Метод ґрунтується на поєднанні двох статистичних критеріїв перевірки гіпотези на однорідність вибірки: критерію Стьюдента і критерію Колмогорова-Смірнова. Поєднання даних критеріїв забезпечує підвищення ефективності диференціації стилів. На основі розробленого методу, побудовано статистичну модель визначення ступеня дії чинника авторської манери викладу. Модель дає змогу підвищити ефективність стильової та авторської атрибуцій тексту. Розроблені метод і модель програмно реалізовано мовою програмування Java. POST запити двох типiв: /process i /process/transcription. розроблено у програмi. За відсутності транскрипційного варіанта досліджуваного тексту, використовується перший запит, другий – за його наявності. Скоротити час роботи програми дає змогу другий запит. Вбудовану базу даних H2 написано мовою програмування Java. База даних H2 є відкритою, кросплатформною. Вона підтримує мову SQL, має добру інтеграцію із використовуваним фреймворком Spring Boot i не потребує додаткових інсталяцій. У структурі даних HashMap зберігається відповідь із сайту транскрипцiйного перекладу. Структура побудована на принципі ключ-значення i дає змогу уникати дублікатів. Якщо опрацьовується велика кількість даних, то зменшується кількість запитів у мережі Інтернет, що забезпечує незалежність і автономність програми. Малі затрати часу є характерними для роботи програми.

Біографії авторів

I. Yu. Khomytska, Національний університет "Львівська політехніка", м. Львів

асистент, кафедра прикладної лінгвістики

V. M. Теslyuk, Національний університет "Львівська політехніка", м. Львів

д-р техн. наук, професор, кафедра систем автоматизованого проектування

V. V. Beregovskyi, Івано-Франківський національний технічний університет нафти і газу, м. Івано-Франківськ

канд. техн. наук, доцент, кафедра комп'ютерних систем і мереж

Посилання

Argamon, Sh. (2009). Automatically Profiling the Author of an Anonymous Text. Communications of the ACM, 52(2), 119–123. USA.
Bisikalo, O. V., & Vysotska, V. A. (2016). Sentence syntactic analysis application to keywords identification ukrainian texts. Radio electronics computer science control, 3(38), 54–65. Zaporizhzhya.
Burrows, J. (2002). Delta: A Measure of Stylistic Difference and a Guide to Likely Authorship. Literary and Linguistic Computing, 17(3), 267–287.
Davydov, M., & Lozynska, O. (2016). Linguistic Models of Assistive Computer Technologies for Cognition and Communication. Proceedings of the 11th Scientific and Technical Conference. (pp. 171–174). Lviv.
Gries, Th. S. (2009). Statistics for Linguistics with R. Mouton Textbook, 335 p.
Juala, P. (2008). Authorship Attribution, Foundations and Trends (R) in Information Retrieval. Boston–Delft, 1(3), 233–334.
Kapociute-Dzikiene, J., Utka, F., & Sarkute, L. (2015). Authorship Attribution and Author Profiling of Lithuanian Literary Texts. Proceedings of the 5th Workshop on Balto-Slavic Natural Language Processing, (pp. 96–105). Hissac, Bulgaria.
Khomytska, I. Yu., Tesliuk, V. M., & Labinska, L. S. (2018b). Prohramna systema avtorskoi atrybutsii tekstiv na fonolohichnomu rivni. Problemy ta perspektyvy rozvytku ekonomiky i pidpryiemnytstva ta kompiuternykh tekhnolohii v Ukraini: zb. tez 14th nauk.-prakt. konf., (pp. 15–16). Lviv. [In Ukrainian].
Khomytska, I., & Teslyuk, V. (2016). The Method of Statistical Analysis of the Scientific, Colloquial, Belles-Lettres and Newspaper Styles on the Phonological Level. In N. Shakhovska (Ed.), Advances in Intelligent Systems and Computing, 512, 149–163. Lviv.
Khomytska, I., & Teslyuk, V. (2018). Authorship Attribution by Differentiation of Phonostatistical Structures of Styles. CSIT: Proceedings of the 13th Scientific and Technical Conference, (pp. 5–8). Lviv.
Khomytska, I., Teslyuk, V., & Shakhovska, N. (Ed.). (2018a). Authorship and Style Attribution by Statistical Methods of Style Differentiation on the Phonological Level. Advances in Intelligent Systems and Computing III, 871, 105–118. Lviv.
Khomytska, I., Teslyuk, V., Holovatyy, A., & Morushko, O. (2018). Development of Methods, Models and Means for the Author Attribution of a Text. Eastern-European Journal of Enterprise Technologies, 3/2(93), 41–46. Kharkiv.
Koppel, M. (2009). Computational Methods in Authorship Attribution. Journal of the Association for Information Science and Technology, 60(1), 9–26. USA.
Lytvyn, V., Vysotska, V., Dosyn, D., Holoschuk, R., & Rybchak, Z. (2017b). Application of Sentence Parsing for Determining Keywords in Ukrainian Texts. CSIT: Proceedings of the 12th Scientific and Technical Conference. (pp. 326–331). Lviv.
Lytvyn, V., Vysotska, V., Pukach, P., Bobyk, I., & Uhryn, D. (2017a). Development of a method for the recognition of authors style in the Ukrainian language texts based on linguometry, stylemetry and glottochronology. Eastern-European Journal of Enterprise Technologies, 4/2(88), 10–18.
Shestakevych, T., Vysotska, V., Chyrun, L., & Chyrun, L. (2014). Modelling of semantics of natural language sentences using generative grammars. Computer Science and Information Technologies: Proceedings of the 9th Int. Conference CSIT2014, (pp. 19–22), November 18–22, 2014. Lviv.
Stamatatos, E. (2009). A Survey of Modern attribution Methods. Journal of the Association for Information Science and Technology, 60, 538–556.
Опубліковано
2019-06-27
Як цитувати
Khomytska, I. Y., ТеslyukV. M., & Beregovskyi, V. V. (2019). Метод комплексного аналізу диференціації фоностатистичних структур стилів англійської мови. Науковий вісник НЛТУ України, 29(6), 140-143. https://doi.org/10.15421/40290627
Розділ
Інформаційні технології