Выпущен первый в России специализированный датасет поддельных документов для разработчиков ИИ

Новости сегодня - Выпущен первый в России специализированный датасет поддельных документов для разработчиков ИИ

Исследователи российской ИИ-компании Smart Engines представили первый в России масштабный датасет с поддельными документами – MIDV-DM. Он включает 8 тыс. изображений с удостоверениями личности РФ, СНГ и других стран. Вошедшие в набор образцы были изготовлены с помощью наиболее распространенных у мошенников методов подделки. Датасет позволит разработчикам со всего мира обучать, тестировать и совершенствовать антифрод-системы на базе ИИ.

MIDV-DM стал первым публичным датасетом, который систематизировал все основные способы манипуляций с документами. В основу набора легла 1 тыс. изображений из ранее опубликованной исследователями Smart Engines выборки MIDV-2020: образцы внутреннего паспорта РФ, национальные паспорта и ID-карты Азербайджана, Латвии, Эстонии, Финляндии и других. Разработчики использовали такие манипуляции с документами, как вставка текстовых полей или фото из «донорского» документа, «маскирование» отдельных полей документа, склеивание разных фрагментов в один образ, вставка посторонних объектов – эмблем, голограмм и др.

Новый набор данных позволяет разработчикам повышать точность антифрод-решений. Это особенно актуально на фоне участившихся случаев мошенничества с поддельными документами – в России число уголовных дел по фальсификации, изготовлению и обороту подделок (ст. 327 УК РФ) увеличилось на 34% и составило 3,9 тыс. в 2024 году. Такие данные представлены в ежегодном исследовании специалистов Smart Engines и юридической фирмы INTELLECT.

«При создании MIDV-DM мы сознательно вышли за рамки сценариев с текстовыми манипуляциями, детекция которых уже не является проблемой для современных систем. В датасет вошли подделки с изменением подписи, фотографии держателя и отдельных полей документа – то есть полный спектр типичных атак, с которыми на практике сталкиваются банки, МФО и госструктуры. Это позволит ИИ-системам учиться с повышенной точностью видеть не только замененные ФИО, но и сложные структурные несоответствия в документе», – отмечает Владимир Арлазаров, генеральный директор Smart Engines, доктор технических наук.

В дальнейшем с помощью MIDV-DM Smart Engines планирует развивать собственную антифрод-систему «Шерлок 2о» – мультимодальную ИИ-модель, способную одновременно работать с изображениями документов из оптического, ультрафиолетового и инфракрасного спектров, текстовыми полями, данными NFC-чипа, штрих-кодами, метаданными и сигнатурами. В общей сложности система проверяет документ на подлинность по 600 параметрам.

 

Выпущен первый в России специализированный датасет поддельных документов для разработчиков ИИ

Понравилась новость - поделитесь с Друзьями!

Новости партнеров:

Рубрика: IT, Новости

Вам могло бы понравиться:

Вклады на сегодня с пополнением через СБП: зачисление, лимиты и когда начинают начисляться проценты Вклады на сегодня с пополнением через СБП: зачисление, лимиты и когда начинают начисляться проценты
Наночастицы серебра убивают больше бактерий и замедляют рост устойчивости Наночастицы серебра убивают больше бактерий и замедляют рост устойчивости
Италия открывает морской заповедник для дельфинов Италия открывает морской заповедник для дельфинов
Как Грибок, Питающийся Радиацией, Может Переписать Правила Космического Строительства Как Грибок, Питающийся Радиацией, Может Переписать Правила Космического Строительства

Оставить комментарий

Вы должны Войти, чтобы оставить комментарий.

©2015 - 2025 Актуальные Новости Сегодня. Все права защищены.
При копировании материалов активная гиперссылка на этот сайт ОБЯЗАТЕЛЬНА!