Решение для обработки документов, удостоверяющих личность
Для разработчиков
PassportReader SDK
Сравнение документов ContentReader® Engine
Автоматическое сравнение документов для снижения рисков подписания некорректных версий
Многофункциональный OCR SDK для разработчиков
ContentReader® Engine
Intelligent Search
Для бизнеса
Корпоративный поиск по всем источникам данных
Серверное решение для распознавания и конвертации документов
ContentReader® Server
Универсальная платформа для интеллектуальной обработки информации
ContentCapture®
Для персонального использования
Электронные словари для изучения иностранных языков
Lingvo®
ContentReader® PDF 15 для офиса
Интеллектуальный редактор PDF с функцией сравнения и автораспознавания
Многофункциональный редактор PDF
ContentReader® PDF 15 для дома
Для ритейла
Оптимизация операционных процессов с помощью автоматической обработки документов
Оптимизация затрат на операционную деятельность: обработка показаний приборов, другое
Для энергетики
Кросс-индустриальные
Автоматизация ключевых бизнес-процессов: обработка первичных документов, извлечение данных из документов
Автоматизация обработки различных документов на промышленных предприятиях
Для промышленности
Для банков
Автоматизация обработки основных финансовых документов: открытие счета, обработка кредитных заявок, другое
Оптимизация оцифровки, электронные архивы, обработка бланков и анкет, другое
Для госсектора
Истории успеха
Клиенты
О нас
О компании Content AI
Пресс-релизы и интервью, информация для СМИ
Новости
Наша команда
Руководство и менеджмент
Вакансии в Content AI
Карьера
Российские вендоры ПО
Технологическое сотрудничество
Партнерский портал
Перейти во внутренний портал для наших партнеров. Стать партнером
Наши партнеры
Дистрибьюторы, партнеры по массовым и корпоративным продуктам
Справочная информация о продуктах Content AI
Онлайн-справка
База знаний
Ответы на частые вопросы пользователей
Техническая поддержка
Отправить запрос в техническую поддержку
Магазин
Консультация
Content AI — российский разработчик решений в области интеллектуальной обработки информации.
Используйте OCR-технологии с элементами искусственного интеллекта
ContentReader® Engine. Многофункциональный OCR SDK для разработчиков
Запросить пробную версию
Консультация
Классификация документов: машинное обучение и обработка естественного языка
Инструментарий ContentReader® Engine включает технологию для классификации документов, что позволяет создавать приложения для автоматического распределения документов по предопределенным категориям и классам. В передовых алгоритмах классификации используются технологии машинного обучения и обработки естественного языка, которые позволяют выявить малейшие отличия между документами разных категорий и настроить гибкие процессы классификации.
Новый интеллектуальный классификатор по внешнему виду (Image Classifier) позволяет собирать и обрабатывать визуальную информацию об изображениях документов и быстро классифицировать их. Текстовый классификатор (Text Classifier) работает с текстовой информацией на документах, в том числе анализируя смысл текста, что позволяет повысить точность классификации. Классификаторы по внешнему виду и текстовый можно использовать как отдельно, так и совместно.
Как это работает?
Классификация документов проходит в три этапа:
1
Подготовка наборов документов для обучения классификации
На этом этапе определяются классы документов. Для каждого класса подбирается несколько примеров документов для определения общих признаков.
2
Обучение классификационной модели
Информация о классах документов и соответствующих параметрах импортируется для обучения в классификационную модель (Classification Model), которая впоследствии обучается. Модель может использовать классификаторы по внешнему виду и текстовый как отдельно, так и совместно. Эффективность работы можно улучшить за счет установления баланса между полнотой и точностью данных.
3
Классификация
Все поступающие документы классифицируются согласно классификационной модели. Чтобы правильно классифицировать тип документа, определяются параметры для каждого документа, которые сравниваются с информацией, полученной на этапе обучения. Разработчики могут создавать правила, которые позволяют обновлять наборы данных для обучения и переобучать классификационную модель.
Технология позволяет получать информацию о том, к каким из заданных категорий может относиться документ и с какой вероятностью. Информацию о вероятности можно использовать для определения следующих шагов обработки, среди которых анализ и отправка документов по определенному пути.
В документации ContentReader® Engine процесс классификации представлен примером кода, который можно использовать при создании приложений или для тестирования работы технологии.
Закажите эффективное решение
Заполните форму и получите консультацию, как наиболее эффективно использовать наши решения для задач вашего бизнеса.