Рейтинг@Mail.ru
Российские ученые научились распознавать "шиншиллу" без языкового контекста - 21.03.2025, ПРАЙМ
Регистрация пройдена успешно!
Пожалуйста, перейдите по ссылке из письма, отправленного на
Российские ученые научились распознавать "шиншиллу" без языкового контекста

Российские ученые научили ИИ распознавать "шиншиллу" без языкового контекста

Читать Прайм в
Дзен Telegram
МОСКВА, 21 мар - ПРАЙМ. Российские ученые научили искусственный интеллект (ИИ) распознавать рукописное слово "шиншилла" без языкового контекста - это снизит вероятность галлюцинации, то есть фантазии, нейросети на слова, которые встречаются редко, и усовершенствует системы распознавания документов, рассказали РИА Новости в Smart Engines.
"Ученые компании Smart Engines обучили ИИ распознавать трудночитаемые рукописные слова, такие как "шиншилла", без языкового контекста. Новая нейросеть не использует знаний о словах русского языка и учитывает только особенности сопряжения букв на изображении. Такой подход кардинально снижает вероятность галлюцинаций ИИ на редко встречающихся словах, включая имена собственные. Эта разработка вывела на новый уровень системы распознавания паспортов РФ, которые используются ведущими банками, сотовыми операторами и другими российскими компаниями", - сказали в компании.
Слово "Шиншилла" является своеобразным тестом Тьюринга для систем распознавания рукописного текста на кириллице, объяснили в Smart Engines. При неаккуратном почерке строчные формы букв "ш", "л", "и" становятся практически неразличимы.
Разработчики обучили нейросеть "Да Винчи" на 1,2 миллиона строк рукописного текста, синтезированного с равномерным распределением сочетаний букв. Это позволяет сокращать риск галлюцинаций ИИ, одной из распространенных проблем. Как объяснил генеральный директор Smart Engines, доктор технических наук Владимир Арлазаров, при анализе документов нельзя допускать галлюцинаций, потому что эти данные используются в скоринговых моделях и бизнес-процессах в учетных системах.
"Основной целью было создать метод ИИ, который умел бы читать такие сложные для прочтения рукописные слова, как "шиншилла", но без использования языкового контекста. Это необходимо для распознавания документов - паспортов, штампов о регистрации и других. В них надо читать ровно то, что написано, а не то, что правильно с точки зрения языка", – добавил Арлазаров.
 
 
 
Лента новостей
0
Сначала новыеСначала старые
loader
Онлайн
Заголовок открываемого материала
Чтобы участвовать в дискуссии,
авторизуйтесь или зарегистрируйтесь
loader
Чаты
Заголовок открываемого материала