15
октября
2025
год
В Сургуте нашли способ избавить онлайн-переводчики от ошибок
Инструмент для анализа ошибок программ-переводчиков, который позволяет улучшать качество разработок в этой области, создали ученые СурГУ. Исследователями получен патент, сообщили в пресс-службе вуза.
Сегодня онлайн-переводчики стали привычным инструментом, однако качество их работы остается нестабильным. Для анализа и улучшения ошибок таких программ используются различные специальные метрики, рассказали в Сургутском государственном университете (СурГУ).
Ученые вуза создали программу, которая, по их словам, обеспечивает более глубокий и многогранный анализ, чем стандартные подходы.
«Многие метрики оценки, особенно BLEU (Bilingual Evaluation Understudy) — одна из самых распространенных систем, которая подсчитывает дословные совпадения фраз, могут давать однобокую картину. Наша разработка решает эту проблему, обеспечивая комплексный анализ, который выявляет слабые места перевода на уровне синтаксиса и передачи смысла», – рассказала магистрант СурГУ направления "Лингвистика" Ярослава Бакуменко.
По ее словам, предложенная программа оценивает не только лексическое соответствие (насколько точно подобраны слова), но и семантическую точность (правильно ли передан смысл) и правильность синтаксической структуры (верно ли построено предложение). Ее ключевое преимущество в сравнении с аналогами заключается в объединении нескольких методов оценки в один автоматизированный инструмент.
В ходе исследования были проанализированы переводы, выполненные популярными онлайн-сервисами и коммерческой нейросетью. Для каждого перевода был сгенерирован подробный отчет, в котором предложения с низкими оценками по любой из метрик автоматически выделялись для дальнейшего анализа.
По словам ученых СурГУ, часть переводчиков показала хорошие результаты по лексическому соответствию (точности подбора слов). При этом все исследуемые системы столкнулись с трудностями при передаче сложных грамматических конструкций.
«Нам удалось создать инструмент, который не просто дает общую оценку, а позволяет выявить конкретные типы ошибок — лексические, грамматические или смысловые. Это делает процесс анализа более эффективным и помогает понять, в каком направлении нужно дорабатывать системы машинного перевода», – отметила доцент кафедры лингвистики и переводоведения СурГУ Аксана Таджибова.
Основой разработки ученых СурГУ стала программа на языке Python, использующая специализированную библиотеку для обработки естественного языка nltk, которая помогает компьютеру "понимать" и разбивать текст на отдельные предложения и слова. Также использовалась библиотека Stanza, выполняющая грамматический анализ и определяющая роль каждого слова в предложении.
Источник: РИА Новости