https://1prime.ru/20250321/uchenye-855980897.html
Российские ученые научились распознавать "шиншиллу" без языкового контекста
Российские ученые научились распознавать "шиншиллу" без языкового контекста - 21.03.2025, ПРАЙМ
Российские ученые научились распознавать "шиншиллу" без языкового контекста
Российские ученые научили искусственный интеллект (ИИ) распознавать рукописное слово "шиншилла" без языкового контекста - это снизит вероятность галлюцинации,... | 21.03.2025, ПРАЙМ
2025-03-21T07:07+0300
2025-03-21T07:07+0300
2025-03-21T07:07+0300
технологии
общество
москва
рф
https://cdnn.1prime.ru/images/sharing/article/rus/855980897.jpg?1742530045
МОСКВА, 21 мар - ПРАЙМ. Российские ученые научили искусственный интеллект (ИИ) распознавать рукописное слово "шиншилла" без языкового контекста - это снизит вероятность галлюцинации, то есть фантазии, нейросети на слова, которые встречаются редко, и усовершенствует системы распознавания документов, рассказали РИА Новости в Smart Engines.
"Ученые компании Smart Engines обучили ИИ распознавать трудночитаемые рукописные слова, такие как "шиншилла", без языкового контекста. Новая нейросеть не использует знаний о словах русского языка и учитывает только особенности сопряжения букв на изображении. Такой подход кардинально снижает вероятность галлюцинаций ИИ на редко встречающихся словах, включая имена собственные. Эта разработка вывела на новый уровень системы распознавания паспортов РФ, которые используются ведущими банками, сотовыми операторами и другими российскими компаниями", - сказали в компании.
Слово "Шиншилла" является своеобразным тестом Тьюринга для систем распознавания рукописного текста на кириллице, объяснили в Smart Engines. При неаккуратном почерке строчные формы букв "ш", "л", "и" становятся практически неразличимы.
Разработчики обучили нейросеть "Да Винчи" на 1,2 миллиона строк рукописного текста, синтезированного с равномерным распределением сочетаний букв. Это позволяет сокращать риск галлюцинаций ИИ, одной из распространенных проблем. Как объяснил генеральный директор Smart Engines, доктор технических наук Владимир Арлазаров, при анализе документов нельзя допускать галлюцинаций, потому что эти данные используются в скоринговых моделях и бизнес-процессах в учетных системах.
"Основной целью было создать метод ИИ, который умел бы читать такие сложные для прочтения рукописные слова, как "шиншилла", но без использования языкового контекста. Это необходимо для распознавания документов - паспортов, штампов о регистрации и других. В них надо читать ровно то, что написано, а не то, что правильно с точки зрения языка", – добавил Арлазаров.
москва
рф
ПРАЙМ
internet-group@rian.ru
7 495 645-6601
ФГУП МИА «Россия сегодня»
https://xn--c1acbl2abdlkab1og.xn--p1ai/awards/
2025
ПРАЙМ
internet-group@rian.ru
7 495 645-6601
ФГУП МИА «Россия сегодня»
https://xn--c1acbl2abdlkab1og.xn--p1ai/awards/
Новости
ru-RU
https://1prime.ru/docs/about/copyright.html
ПРАЙМ
internet-group@rian.ru
7 495 645-6601
ФГУП МИА «Россия сегодня»
https://xn--c1acbl2abdlkab1og.xn--p1ai/awards/
ПРАЙМ
internet-group@rian.ru
7 495 645-6601
ФГУП МИА «Россия сегодня»
https://xn--c1acbl2abdlkab1og.xn--p1ai/awards/
ПРАЙМ
internet-group@rian.ru
7 495 645-6601
ФГУП МИА «Россия сегодня»
https://xn--c1acbl2abdlkab1og.xn--p1ai/awards/
технологии, общество , москва, рф
Технологии, Общество , МОСКВА, РФ
Российские ученые научились распознавать "шиншиллу" без языкового контекста
Российские ученые научили ИИ распознавать "шиншиллу" без языкового контекста
МОСКВА, 21 мар - ПРАЙМ. Российские ученые научили искусственный интеллект (ИИ) распознавать рукописное слово "шиншилла" без языкового контекста - это снизит вероятность галлюцинации, то есть фантазии, нейросети на слова, которые встречаются редко, и усовершенствует системы распознавания документов, рассказали РИА Новости в Smart Engines.
"Ученые компании Smart Engines обучили ИИ распознавать трудночитаемые рукописные слова, такие как "шиншилла", без языкового контекста. Новая нейросеть не использует знаний о словах русского языка и учитывает только особенности сопряжения букв на изображении. Такой подход кардинально снижает вероятность галлюцинаций ИИ на редко встречающихся словах, включая имена собственные. Эта разработка вывела на новый уровень системы распознавания паспортов РФ, которые используются ведущими банками, сотовыми операторами и другими российскими компаниями", - сказали в компании.
Слово "Шиншилла" является своеобразным тестом Тьюринга для систем распознавания рукописного текста на кириллице, объяснили в Smart Engines. При неаккуратном почерке строчные формы букв "ш", "л", "и" становятся практически неразличимы.
Разработчики обучили нейросеть "Да Винчи" на 1,2 миллиона строк рукописного текста, синтезированного с равномерным распределением сочетаний букв. Это позволяет сокращать риск галлюцинаций ИИ, одной из распространенных проблем. Как объяснил генеральный директор Smart Engines, доктор технических наук Владимир Арлазаров, при анализе документов нельзя допускать галлюцинаций, потому что эти данные используются в скоринговых моделях и бизнес-процессах в учетных системах.
"Основной целью было создать метод ИИ, который умел бы читать такие сложные для прочтения рукописные слова, как "шиншилла", но без использования языкового контекста. Это необходимо для распознавания документов - паспортов, штампов о регистрации и других. В них надо читать ровно то, что написано, а не то, что правильно с точки зрения языка", – добавил Арлазаров.