https://1prime.ru/20210330/833350341.html

Эксперт рассказал, почему ошибаются электронные переводчики

Эксперт рассказал, почему ошибаются электронные переводчики - 30.03.2021, ПРАЙМ

Эксперт рассказал, почему ошибаются электронные переводчики

Каждый день появляется множество новых терминов, которых может не быть в исходных данных

2021-03-30T06:55+0300

2021-03-30T07:50+0300

https://cdnn.1prime.ru/img/83316/57/833165775_0:318:3077:2048_1920x0_80_0_0_421a446947379ff3f4ae8a002a8c3147.jpg

ПРАЙМ

4.7

internet-group@rian.ru

7 495 645-6601

ФГУП МИА «Россия сегодня»

https://xn--c1acbl2abdlkab1og.xn--p1ai/awards/

192

2021

ПРАЙМ

4.7

internet-group@rian.ru

7 495 645-6601

ФГУП МИА «Россия сегодня»

https://xn--c1acbl2abdlkab1og.xn--p1ai/awards/

192

Новости

ru-RU

https://1prime.ru/docs/about/copyright.html

ПРАЙМ

4.7

internet-group@rian.ru

7 495 645-6601

ФГУП МИА «Россия сегодня»

https://xn--c1acbl2abdlkab1og.xn--p1ai/awards/

192

1920

1080

true

1920

1440

true

https://cdnn.1prime.ru/img/83316/57/833165775_166:0:2897:2048_1920x0_80_0_0_494f1b69acd6c8ec6583f1158fa72555.jpg

1920

true

ПРАЙМ

4.7

internet-group@rian.ru

7 495 645-6601

ФГУП МИА «Россия сегодня»

https://xn--c1acbl2abdlkab1og.xn--p1ai/awards/

192

ПРАЙМ

4.7

internet-group@rian.ru

7 495 645-6601

ФГУП МИА «Россия сегодня»

https://xn--c1acbl2abdlkab1og.xn--p1ai/awards/

192

ит-бизнес, технологии, новости, it-отрасль

ИТ-бизнес, Технологии, Новости, IT-отрасль

06:55 30.03.2021 (обновлено: 07:50 30.03.2021)

Эксперт рассказал, почему ошибаются электронные переводчики

Поиск в интернете - ПРАЙМ, 1920, 30.03.2021

Перейти в медиабанк

Читать Прайм в

Дзен Telegram

МОСКВА, 30 мар — ПРАЙМ. Основой любого электронного переводчика становятся начальные данные, качество и объем которых влияют на результат перевода, однако каждый день появляется множество новых терминов, которых может не быть в исходных данных, в результате чего возникают неточности в переводе, разъяснил РИА Новости основатель компании машинного перевода Lingvanex Алексей Рудак.

В России могут понизить налоги компаниям, внедряющим российский софт

17 марта 2021, 10:37

Ранее пользователи интернета заметили, что, например, английскую фразу "Biden changed for bad" платформа Google переводит как "Байден изменился к лучшему", а аналогичное предложение с именем президента России "Putin changed for bad" как "Путин изменился в худшую сторону". Также в декабре пользователи Google обращали внимание на то, что если в переводчике ввести на английском языке фразу "Thank you, Mr President" ("Спасибо, мистер президент"), то сервис переводил это как "Спасибо, Владимир Владимирович". Позднее все эти неточности исправили.

"Основа всего — это данные, на которых происходит обучение алгоритма перевода. Качество и объем таких данных напрямую влияет на результат перевода. Чем больше разнообразных текстов увидит алгоритм, тем больше ситуаций, на которых он может обучиться и, соответственно, больше тематик и слов он переведет правильно", — рассказал эксперт.

Рудак пояснил, что каждый день появляются новые термины, имена собственные, речевые обороты, которых может не быть в исходных данных для обучения. Чтобы переводить новые понятия, алгоритм должен постоянно дообучаться, выискивая новую информацию, которая появляется в интернете. Затем эта информация фильтруется и добавляется к тем данным, которые были вначале, на основе чего происходит обучение электронного переводчика заново.

"Чем больше ошибок в данных, тем больше ошибок в переводе. Из-за того, что в интернете каждый может написать что угодно, от ошибок и дезинформации никто не застрахован. А проверять все данные на корректность специалистом очень долго и дорого. Поэтому для фильтрации используется компьютерные программы", — указал эксперт.

Кроме того, если пользователь заметил ошибку перевода, он может прислать разработчикам правильный вариант перевода слова или фразы. "И если много людей на одно и то же слово или фразу пришлют одинаковый вариант, то алгоритм перевода перестроится таким образом, чтобы переводит эту фразу по-другому уже для всех остальных пользователей. С одной стороны, это помогает находить ошибки, но с другой позволяет пользователям манипулировать результатами перевода", — резюмировал Рудак.

ИТ-бизнес Технологии Новости IT-отрасль