ОЦІНКА АДЕКВАТНОСТІ МАШИННОГО ПЕРЕКЛАДУ ПИСЬМОВИХ СПЕЦІАЛІЗОВАНИХ ТЕКСТІВ
DOI:
https://doi.org/10.20535/2617-5339.2023.12.291604Анотація
Машинний переклад став критично важливим для подолання мовних відмінностей в епоху глобального зв'язку, передусім у спеціалізованих галузях. У цій статті розглядається складний процес оцінювання адекватності машинного перекладу для письмової спеціалізованої літератури. В дослідженні проаналізовано помилки, яких припускаються системи машинного перекладу Google Translate (далі – GT) та DeepL Translate (далі – DT) під час перекладу навчальних матеріалів з біології.
У роботі підкреслено, що спеціалізовані тексти вимагають не лише термінологічної точності, а й збереження контексту, що робить галузевий машинний переклад надзвичайно складним. У попередніх працях було розглянуто кілька підходів до оцінювання, які наголошували на необхідності людської перевірки поряд з автоматизованими системами. Помилки машинного перекладу – від термінологічних і семантичних недоліків до стилістичних і граматичних – підкреслюють важливість ретельного пост-редагування.
Результати дослідження продемонстрували, що, незважаючи на коректний переклад термінології загального вжитку, її використання у складних реченнях викликало труднощі. Обидві системи часто не розпізнавали тонкощів, що призводило до викривлених інтерпретацій. Стилістичні помилки, зокрема дослівний переклад без урахування контексту, ще більше послаблюють перекладені речення. Переклад також супроводжувався граматичними помилками, що демонструють складність синтаксичних структур у спеціалізованій тематиці.
Дослідження виявило мінімальні відмінності між GT і DT, зокрема, GT краще перекладав термінологію, а DT демонстрував більш ефективні граматичні структури. Проте обидві системи застосовували дослівний переклад, що призвело до стилістичних помилок і неточного вибору слів. У цій роботі підкреслено необхідність людського редагування для забезпечення коректного перекладу експертних матеріалів, а також необхідність постійного вдосконалення технології машинного перекладу для підвищення точності термінології та збереження контексту в спеціалізованих текстах.
Посилання
Alkatheery, E. R. (2023). Google Translate Errors in Legal Texts: Machine Translation Quality Assessment. Arab World English Journal for Translation & Literary Studies, 7(1), 208–219. https://doi.org/10.24093/awejtls/vol7no1.16 [in English]
Baroni, M. & Bernardini, S. (2005). A New Approach to the Study of Translationese: Machine-learning the Difference between Original and Translated Text. Literary and Linguistic Computing, 21(3), 259–274. https://doi.org/10.1093/llc/fqi039 [in English]
Biriukov, A. (2004). Rozrobka metodiv otsinky yakosti mashynnoho perekladu na osnovi resultativ doslidgen z otsinky yakosti perekladu tradytsiinoho. Kultura Narodov Prichernomoria, 55(1), 100–105. http://dspace.nbuv.gov.ua/handle/123456789/35771 [in Ukrainian]
Bojar, O., Graham, Y., Kamran, A., & Stanojević, M. (2016). Results of the WMT16 Metrics Shared Task. Proceedings of the First Conference on Machine Translation, 2, 199–231. https://doi.org/10.18653/v1/w16-2302 [in English]
Brai, A. Y. (2023). Zasoby dlia otsinky yakosti mashynnoho perekladu. Materialy XV Mizhnarodnoi Studentskoi Naukovo-praktychnoi Konferentsii, Liudyna yak subiekt mizhkulturnoi komunikatsii: suchasni tendentsii u filolohii, perekladi, ta navchanni mov, 84–87. [in Ukrainian]
Brglez, M. & Vintar, Š. (2022). Lexical diversity in statistical and neural machine translation. Information, 13(2), 93. https://doi.org/10.3390/info13020093 [in English]
Chatterjee, S. & Yadav, S. B. (2019). The origin of prebiotic information system in the Peptide/RNA world: a simulation model of the evolution of translation and the genetic code. Life, 9(1), 25. https://doi.org/10.3390/life9010025 [in English]
Chevdar, D. M. (2018). Osoblyvosti mashynnoho perekladu politychnoho dyskursu. Naukovyi Visnyk PNPU im. K. U. Ushynskoho, 27, 211–222. [in Ukrainian]
Chu, C. & Wang, R. (2020). A survey of Domain adaptation for Machine Translation. Journal of Information Processing, 28(0), 413–426. https://doi.org/10.2197/ipsjjip.28.413 [in English]
Conneau, A., Kruszewski, G., Lample, G., Barrault, L., & Baroni, M. (2018). What you can cram into a single $&!#* vector: Probing sentence embeddings for linguistic properties. Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 2126–2136. https://doi.org/10.18653/v1/p18-1198 [in English]
Dinu, G., Mathur, P., Federico, M., & Al-Onaizan, Y. (2019). Training Neural Machine Translation to Apply Terminology Constraints. Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics. https://doi.org/10.18653/v1/p19-1294 [in English]
Haque, R., Hasanuzzaman, M., & Way, A. (2019). Investigating Terminology Translation in Statistical and Neural Machine Translation: A Case Study on English-to-Hindi and Hindi-to-English. Proceedings of the International Conference on Recent Advances in Natural Language Processing (RANLP 2019). https://doi.org/10.26615/978-954-452-056-4_052 [in English]
Haque, R., Hasanuzzaman, M., & Way, A. (2019a). Terminology translation in Low-Resource scenarios. Information, 10(9), 273. https://doi.org/10.3390/info10090273 [in English]
Justeson, J. S. & Katz, S. M. (1995). Technical terminology: some linguistic properties and an algorithm for identification in text. Natural Language Engineering, 1(1), 9–27. https://doi.org/10.1017/s1351324900000048 [in English]
Lavie, A. & Agarwal, A. (2007). METEOR: An Automatic Metric for MT Evaluation with High Levels of Correlation with Human Judgments. Proceedings of the Second Workshop on Statistical Machine Translation, 228–231. https://doi.org/10.3115/1626355.1626389 [in English]
LESSON 13: TOPOGRAPHY AND STRUCTURE OF URINARY SYSTEM ORGANS. (n.d.). Medmuv. https://medmuv.com/kafedra/internal/anatomy/classes_stud/en/nurse/1/bsn/ptn/1/13.%20TOPOGRAPHY%20AND%20STRUCTURE%20OF%20URINARY%20SYSTEM%20ORGANS.htm [in English]
Miscchenko, A. L. (2013). Mashynnyi pereklad u konteksti suchasnoho naukovo-tekhnichnoho perekladu. Visnyk Kharkivskoho Natsionalnoho Universytetu Imeni V. N. Karazina, 1051(73), 172–180. http://nbuv.gov.ua/UJRN/VKhIFL_2013_73_29 [in Ukrainian]
Och, F. J. (2003). Minimum error rate training in statistical machine translation. Proceedings of the 41st Annual Meeting on Association for Computational Linguistics, 1, 160–167. https://doi.org/10.3115/1075096.1075117 [in English]
Specia, L. (2014). Statistical machine translation. In IGI Global eBooks (pp. 897–931). https://doi.org/10.4018/978-1-4666-6042-7.ch043 [in English]
Specia, L., Scarton, C., & Paetzold, G. H. (2018). Quality estimation for machine translation. In Synthesis lectures on human language technologies. Morgan & Claypool Publishers. https://doi.org/10.1007/978-3-031-02168-8 [in English]
Xu, J., Crego, J. M., & Sénellart, J. (2020). Boosting Neural Machine Translation with Similar Translations. Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics. https://doi.org/10.18653/v1/2020.acl-main.144 [in English]
##submission.downloads##
Опубліковано
Номер
Розділ
Ліцензія
Наше видання використовує положення про авторські права CREATIVE COMMONS для журналів відкритого доступу.
Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:
1. Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
2. Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.