Решение для обработки документов, удостоверяющих личность
Для разработчиков
PassportReader SDK
Сравнение документов ContentReader® Engine
Автоматическое сравнение документов для снижения рисков подписания некорректных версий
Многофункциональный OCR SDK для разработчиков
ContentReader® Engine
ИИ-ассистенты на основе поисковых технологий
Intelligent Search
Для бизнеса
Серверное решение для распознавания и конвертации документов
ContentReader® Server
Универсальная платформа для интеллектуальной обработки информации
ContentCapture®
Для персонального использования
Электронные словари для изучения иностранных языков
Lingvo®
ContentReader® PDF 15 для офиса
Интеллектуальный редактор PDF с функцией сравнения и автораспознавания
Многофункциональный редактор PDF
ContentReader® PDF 15 для дома
Для ритейла
Оптимизация операционных процессов с помощью автоматической обработки документов
Оптимизация затрат на операционную деятельность: обработка показаний приборов, другое
Для энергетики
Кросс-индустриальные
Автоматизация ключевых бизнес-процессов: обработка первичных документов, извлечение данных из документов
Автоматизация обработки различных документов на промышленных предприятиях
Для промышленности
Для банков
Автоматизация обработки основных финансовых документов: открытие счета, обработка кредитных заявок, другое
Оптимизация оцифровки, электронные архивы, обработка бланков и анкет, другое
Для госсектора
Истории успеха
Клиенты
О нас
О компании Content AI
Пресс-релизы и интервью, информация для СМИ
Новости
Наша команда
Руководство и менеджмент
Вакансии в Content AI
Карьера
Российские вендоры ПО
Технологическое сотрудничество
Партнерский портал
Перейти во внутренний портал для наших партнеров. Стать партнером
Наши партнеры
Дистрибьюторы, партнеры по массовым и корпоративным продуктам
Справочная информация о продуктах Content AI
Онлайн-справка
База знаний
Ответы на частые вопросы пользователей
Техническая поддержка
Отправить запрос в техническую поддержку
 

ContentCapture®

Понимает даже самые хаотичные документы: извлечение данных
с помощью LLM


ContentCapture

Распознает, классифицирует документы, извлекает данные, проверяет их корректность и передает в корпоративные информационные системы. Универсальное кросс-платформенное решение для автоматизации обработки информации из любых типов документов: отсканированных бумаг, фотографий, электронных документов, текстов писем и вложений.

Благодаря большим языковым моделям (LLM) улучшена возможность извлечения информации из слабоструктурированных и неструктурированных документов со сложной вариативной структурой расположения данных.

ContentCapture имеет статус ИИ-продукта в Реестре.

Подходит для импортозамещения ABBYY FlexiCapture, Kofax Capture, IBM Datacap.

Почему ContentCapture

  • ИИ-технологии

    Атрибутивное распознавание

    с помощью LLM

    Извлечение данных из неструктурированных документов, перегруженных канцелярской лексикой: договоров, приказов, претензий, уставов, протоколов, доверенностей и проч.


    Распознавание рукописного текста (ICR)

    Автоматическая обработка данных из паспортов, анкет, заявлений и др.


    Предобработка изображений

    (CNN, GAN)

    Нейросети используются для автоулучшения изображений: удаление шумов, выравнивание, чтение текста на сложных фонах и применяются для сложной "реставрации"


    Автоматическая классификация (ML)
    Сортировка входящих документов по типам и направление по workflow без ручного вмешательства
  • Надежность

    Внедрения
    • Проверено в крупнейших компаниях России с нагрузкой до 2 млн документов/сутки
    • Легко интегрируется в любую ИТ-инфраструктуру для долгосрочной автоматизации

    Безопасность
    • Гибкое скрытие данных по уровню доступа для операторов верификации
    • HTTPS-шифрование для защиты от перехвата и кибератак

    Импортонезависимость
    • Входит в реестр отечественного ПО, замещает ABBYY FlexiСapture, Kofax Capture, IBM Datacap
    • Работает на Windows и на отечественных ОС: Astra Linux, РедОС, AltLinux
  • Режим «единого окна»
    Многоканальный ввод данных
    ContentCapture обрабатывает бумажные и цифровые документы, поступающие из любых источников: МФУ, сканеров, электронной почты, FTP и "горячих папок"

    Все типы документов

    В отличие от аналогов, ContentCapture поддерживает свыше 40 форматов документов, включая сложные файлы с таблицами и графическими элементами, обеспечивая распознавание даже плохо читаемого текста

Схема работы

image
Импорт

ContentCapture обрабатывает в едином потоке электронные письма и вложения, бумажные документы, электронные документы в офисных форматах, фотографии с камер

Классификация

В систему достаточно ввести 10 образцов нового класса документа, и технология автоматически научится определять тип документа по внешнему виду или взаимному расположению элементов

Распознавание

Распознавание текста:

  • печатного — на 190 языках
  • рукопечатного — на 110 языках
  • рукописного — на русском и английском

Решение также распознает линейные и двухмерные штрихкоды, различные метки

Извлечение данных

ContentCapture автоматически извлекает данные из структурированных и неструктурированных документов.


Автоматическая проверка данных:

  • сверка информации из документов с базами данных
  • проверка форматирования
  • нормализация данных. Решение приводит в единый вид данные, которые написаны по-разному, но одинаковые по значению, для корректного наполнения ИС
  • подключение пользовательских алгоритмов проверки
Верификация

Система сравнивает данные распознавания с отсканированным оригиналом документа и автоматически подсвечивает неуверенно распознанные данные, а также отображает информацию о непройденных проверках данных.


Способы проверки данных:

  • групповая верификация: посимвольная проверка данных
  • верификация в окне документа: проверка документа
  • контекстная верификация: проверка полей
Экспорт

ContentCapture автоматически сохраняет результаты распознавания в файлы различных форматов, экспортирует их в базы данных, учетные и иные информационные системы:


  • Microsoft™ SharePont
  • базы данных, соответствующие стандарту ODBC: Oracle, Microsoft SQL Server, Microsoft Access, PostgreSQL
  • ERP, ECM, CRM и др.

Данные можно одновременно экспортировать в различные директории и преобразовать сразу в несколько форматов

Мониторинг и Администрирование

ContentCapture включает в себя консоль администрирования и мониторинга на базе HTML5 для настройки различных вариантов отчетов:

  • о работе операторов
  • о производительности комплекса (оценить распределение ресурсов по тенантам, вычислить среднюю производительность, рассчитать эффективность работы комплекса за выбранный интервал времени)
  • по количеству ошибок.
Также возможно создание графиков и дашбордов для пользователей с разными ролями: администратор, пользователь и т. д.

Сценарии применения


Готовые гибкие описания документов

Указан неполный список. Если необходимого документа не оказалось в списке — напишите нам

Вебинар «Автоматизация ввода первичной бухгалтерской документации c помощью ContentCapture»

Рассказываем, как упростить и ускорить обработку первичных документов с помощью универсальной платформы ContentCapture.

Смотреть ›

Эффекты от внедрения

Сокращение времени принятия решений

Быстрая и точная обработка данных ускоряет принятие управленческих решений

Снижение издержек

на обработку документов

Автоматическая классификация, распознавание и экспорт данных из любых источников и типов документов в ИС

Контроль на всех этапах и уровнях

Расширенные возможности мониторинга помогают управлять потоком документов и оптимизировать работу сотрудников


Заказчики

alfabank-logo
partner-logo
rubytech-logo
slavneft-logo
mazda-logo
nokian-logo
kngk-inpz-logo
unipro_energy-logo
it_severstal-logo
open-logo

Истории успеха

ТЭК-Торг сократил время проверки закупки в 10 раз с помощью Content AI
Заказчик в несколько раз ускорил обработку первичной бухгалтерской документации с помощью ContentCapture
Content AI оцифровала биографический двухтомник Льва Толстого

Спецификация

ContentCapture 14 Cross-platform

Форматы и языки

Оставьте заявку на пробную версию

Заполните форму и получите консультацию, как наиболее эффективно использовать ContentCapture
для задач вашего бизнеса