Анализ ошибок машинного перевода текстов разных жанров в паре "русский и якутский языки" = Analyzing machine translation errors in texts of different genres in the Yakut-Russian language pair
Обложка

Анализ ошибок машинного перевода текстов разных жанров в паре "русский и якутский языки" = Analyzing machine translation errors in texts of different genres in the Yakut-Russian language pair

Статья в журнале

Русский

811.161.1'255.2=512.157; 811.512.157'255.2=161.1

10.25587/2782-6627-2025-2-39-52

машинный перевод; русский язык; якутский язык; переводческие ошибки; лексика; грамматика; искажение; неточность; Google Translate; Яндекс.Переводчик; постредактирование машинного перевода; machine translation; Yakut language; Russian language; translational errors; vocabulary; grammar; alterations ; infelicity; Yandex Translate; machine translation post-editing

Вестник Северо-Восточного федерального университета им. М. К. Аммосова = Vestnik of North-Eastern Federal Univercity: электронное научное периодическое издание. – 2025

В статье на примере трех отрывков из текстов разных жанров анализируются ошибки, допущенные онлайн-переводчиками Яндекс. Переводчик и Google Translate в паре "русский и якутский языки". Якутский язык в онлайн-переводчики был внедрен несколько лет назад, и массовое их использование только начинается. Анализ ошибок машинного перевода в паре "русский и якутский языки" может способствовать выработке рекомендаций для эффективного обучения и машинных систем, и переводчиков-людей, прежде всего постредактированию автоматизированного перевода. Поэтому на данном этапе развития теории и практики русско-якутского перевода выработка классификации ошибок машинного перевода, представленная в данной статье, является весьма актуальной. В экспериментальных целях с помощью указанных сервисов были сделаны переводы следующих текстов: а) отрывок из научного доклада на русском языке; б) отрывок из перевода Библии на якутском языке (обратный перевод на русский язык); в) стихотворение на якутском языке на тему нравственности. Классификация ошибок машинного перевода в этой паре языков основывается на существующих в других парах языков типологиях: а) лексико-семантические и лексико-стилистические ошибки; б) нормативно-узуальные ошибки; в) грамматические ошибки; г) орфографические ошибки; д) пунктуационные ошибки. Описывается характер ошибок и поясняются причины их возникновения. Основными причинами ошибок оказываются: а) разный объем заложенных в машины исходных данных для осуществления анализа языка текста, предназначенного к переводу; б) специфика сходств и различий контактирующих языков, связанная с полисемией и грамматическими лакунами. При сравнении качества переводов обоих сервисов отмечаются их сильные и слабые стороны, проявленные при переводе с якутским языком. В конце статьи делают с выводы о совершенствовании лингвистических баз этих сервисов и о необходимости приобретения соответствующих новых компетенций профессиональными переводчиками, работающими в паре "русский и якутский языки".
The article analyzes errors of web translators Google Translate and Yandex Translate in the Yakut-Russian language pair in three texts of different genres. The Yakut language was introduced to webtranslators several years ago, and their mainstream use is at an early stage. Analyzing machine translation in the Yakut-Russian language pair can contribute to the development of recommendations for the effective training of both machine systems and human translators, primarily in machine translation post-editing. Thus, the classification of machine translation errors in this article is relevant in the current development stage of the Yakut-Russian theory and practice. For the experiment’s purposes, the following texts were translated via the specified services: a) an excerpt from a scientific paper in Russian; b) an excerpt from a translation of the Bible into Yakut (reverse translation into Russian); c) a poem in Yakut on morality. The classification of machine translation errors in this language pair is based on typologies of other language pairs: a) lexico-semantic and lexico-stylistic errors; b) errors in standards and usage; c) grammar errors; d) spelling errors; e) punctuation errors. The nature of errors is described and the reasons for their occurrence are explained. The main causes of errors are: a) the difference in the volume of initial data in the machine systems for analyzing the language of the text being translated; b) the special nature of similarities and differences of contacting languages, associated with polysemanticity and grammar gaps. Upon comparing the quality of translations of both services, their strengths and weaknesses in translation with the Yakut language are noted. The article concludes that the linguistic databases of these services need improvements, and human translators who work with the Yakut-Russian language pair need to acquire corresponding expertise.

Васильева, А. А.
Анализ ошибок машинного перевода текстов разных жанров в паре "русский и якутский языки" / А. А. Васильева, О. В. Бурцева ; Северо-Восточный федеральный университет им. М. К. Аммосова // Вестник Северо-Восточного федерального университета им. М. К. Аммосова. Серия "Алтаистика". - 2025, N 2 (17). - С. 39-52. - DOI: 10.25587/2782-6627-2025-2-39-52
DOI: 10.25587/2782-6627-2025-2-39-52

Войдите в систему, чтобы открыть документ

Вам будет интересно