Универсальная платформа
для интеллектуаль­ной
обработки информации

ContentCapture. Только нужная информация

ContentCapture

ContentCapture – универсальная платформа для интеллектуальной обработки информации из любых типов документов: отсканированных бумаг, фотографий, электронных документов, текстов писем и вложений. Решение распознает, классифицирует документы, извлекает данные, проверяет их корректность и передает в корпоративные информационные системы. C ContentCapture можно ускорить и упростить любые процессы, связанные с документооборотом.

Эффект от внедрения

  • Сокращение времени принятия решений

    Быстрая и точная обработка данных ускоряет принятие управленческих решений.




  • Снижение издержек

    на обработку документов

    Автоматическая классификация, распознавание и экспорт данных из любых источников и типов документов в ИС.

  • Контроль на всех этапах и уровнях

    Расширенные возможности мониторинга помогают управлять потоком документов и оптимизировать работу сотрудников.



Глубокая интеграция с другими системами

ContentCapture оснащена мощными инструментами, позволяющими гибко интегрировать процесс потокового ввода в текущую деятельность компании, что значительно упрощает обмен данными внутри организации.
Решения могут быть интегрированы с различными информационными системами, например, ECM, CRM, RPA, АБС и т.д.
Как это работает
ContentCapture – универсальная платформа для интеллектуальной обработки информации. Решение позволяет извлекать данные из любых типов входящих документов: например, из отсканированных бумаг, фотографий, электронных писем или вложений. Решение классифицирует, распознает документы, извлекает данные, верифицирует и передает их в корпоративные информационные системы. ContentCapture может выступать единой корпоративной платформой для множества бизнес-процессов, таких как управление взаимоотношениями с клиентами, производственная, закупочная и юридическая деятельность компании.


1

Импорт

ContentCapture обрабатывает в едином потоке электронные письма и вложения, бумажные документы, электронные документы в офисных форматах, фотографии с камер и мобильных устройств.


Решение легко масштабируется и подходит для обработки любого объёма документации в форматах TXT, EML, XLSX, VSD, HTML, DOCX, XLS, VSDX, DOC, PPTX, HTM, PPT, и RTF.

2

Интеллектуальная классификация

Классификация с применением технологий ИИ позволяет автоматически сортировать документы по типам и по пользовательским категориям.


В систему достаточно ввести 10 образцов нового класса документа, и технология автоматически научится определять тип документа по внешнему виду или взаимному расположению элементов.


ContentCapture умеет собирать документы в комплекты по заданным алгоритмам, а также собирать разрозненные многостраничные документы с сохранением порядка следования разделов, номеров и числа страниц.

3

Распознавание

Система распознает в документе только необходимый для дальнейшей работы текст.


  • Распознавание печатного текста на 190 языках;
  • Распознавание текста, написанного от руки печатными буквами, на 110 языках;
  • Распознавание линейных и двухмерных штрихкодов, различных меток и галок.
4
Извлечение данных

ContentCapture автоматически извлекает данные из структурированных и неструктурированных документов.


Автоматические проверки данных:

  • Сверка информации из документов с базами данных;
  • Проверка форматирования;
  • Нормализация: приведение в единый вид по-разному написанных, но одинаковых по значению данных для корректного наполнения информационных систем;
  • Подключение пользовательских алгоритмов проверки.
5
Верификация

Система сравнивает данные распознавания с отсканированным оригиналом документа и автоматически подсвечивает неуверенно распознанные данные, а также отображает информацию о не пройденных проверках данных. Способы проверки данных:


  • Групповая верификация: система выводит на проверку одинаково распознанные символы в ряде документов. Это помогает быстро заметить и исправить данные, отличающиеся от остальных.
  • Верификация в окне документа: выделеяются неуверенно распознанные символы и поля с неверными типами данных и невыполненными правилами.
  • Контекстная верификация: на проверку подаются поля с заданным значением. Исправляются ошибки заполнения и ошибки формата поля.
6

Экспорт данных

ContentCapture автоматически сохраняет результаты распознавания в файлы различных форматов, экспортирует их в базы данных, учётные и иные информационные системы:


  • Microsoft™ SharePont;
  • базы данных, соответствующие стандарту ODBC: Oracle, Microsoft SQL Server, Microsoft Access;
  • системы планирования ресурсов предприятия (ERP), управления контентом (ECM) и взаимоотношениями с клиентами(CRM).

Данные можно одновременно экспортировать в различные директории и преобразовать сразу в несколько форматов.

7
Консоль администрирования
и мониторинга

ContentCapture включает в себя консоль администрирования и мониторинга на базе HTML5 для настройки различных вариантов отчетов:


  • о работе операторов;
  • о производительности комплекса (оценить распределение ресурсов по тенантам, вычислить среднюю производительность, рассчитать эффективность работы комплекса за выбранный интервал времени);
  • по количеству ошибок.

Также возможно создание графиков и дашбордов для пользователей с разными ролями: администратор, пользователь и т.д.

Возможности
Ключевые возможности ContentCapture
  • Извлекайте данные из любых документов

    В ContentCapture применяются технологии искусственного интеллекта, что значительно расширяет функциональные возможности системы.


    Благодаря машинному обучению и обработке текста на естественном языке платформа автоматически распознает, классифицирует, извлекает, проверяет и передает данные в информационные системы из любых текстовых сообщений и документов, задействованных в производственных процессах.

  • Масштабируемость и высокая производительность
    Решение ContentCapture легко масштабировать вертикально и горизонтально, когда компании требуется более высокая скорость обработки при больших объёмах данных.

    ContentCapture способна обрабатывать более трех миллионов страниц в день. Инструменты централизованной конфигурации и настройки позволят Вам контролировать работу всех станций и операторов в распределённой инфраструктуре.
  • Кроссбраузерная поддержка и современный дизайн на базе HTML5

    Веб-станции ContentCapture на базе HTML5 поддерживают браузеры Chrome, Firefox, Safari, IE, Opera и другие.


    Благодаря удобному интерфейсу веб-станций, компании с филиальной сетью могут распределить производственные процессы по подразделениям вне зависимости от того, как используются рабочие станции – локально, удаленно или через браузер.

  • Интеллектуальная классификация

    Система классифицирует любые типы входящих документов как по внешнему виду и взаимному расположению элементов, так и по текстовому содержанию.


    Классификация по изображению основана на машинном обучении (свёрточные нейронные сети). Текстовая классификация опирается на статистический и семантический анализ.


    ContentCapture комбинирует результаты применения различных технологий классификации и автоматически подбирает лучший алгоритм сортировки.


    Интеллектуальная классификация позволяет упростить управление информацией в организации, сократить время на обработку данных и ускорить принятие решений.

  • Автообучение

    С помощью автообучения можно сократить время на внедрение и уменьшить расходы на обслуживание системы. За счет технологий искусственного интеллекта на результатах работы верификаторов система сама учится извлекать данные из ряда документов, что позволяет быстро настраивать шаблоны для новых типов документов.


    Администратор может редактировать, настраивать или отменять результаты автообучения. Система корректирует свою работу, собирая обратную связь от пользователей, что сильно снижает затраты на её техническую поддержку. Это особенно важно при реализации масштабных проектов с необходимостью обрабатывать большое количество данных.

  • Поддержка SLA (Service Level Agreement)

    Мониторинг SLA – одна из основ работы современного бизнеса. Новые возможности позволяют оптимизировать работу системы, устанавливать и контролировать скорость обработки для наиболее критичных бизнес-процессов. Система позволяет задавать желаемое время обработки данных и уровень важности для каждого типа обрабатываемых пакетов документов. Порядок заданий в очереди рассчитывается автоматически, чтобы завершить обработку в установленное время. При большой нагрузке возможно распределить задачи, близкие к истечению срока, вручную. Встроенные отчеты и наглядные панели мониторинга помогут контролировать работу системы и соблюдение сроков SLA.



  • Мультитенантность

    ContentCapture позволяет создавать логически изолированную защищенную среду для различных групп пользователей (тенантов), применяя при этом общие политики для пользователей-тенантов и единую аппаратную инфраструктуру.


    Используя централизованное управление и администрирование над всеми тенантами, можно сократить время настройки и защитить конфиденциальные данные в разных рабочих группах.

  • Комплекты документов

    ContentCapture позволяет создавать комплекты документов с неограниченным уровнем вложенности для различных бизнес-процессов и транзакций. Это поможет ускорить оформление новых клиентов или упростить управление инцидентами.

    Вы сможете автоматически проверить состав, полноту документов в комплекте, ускорив проверку данных с помощью заранее настроенных правил.
  • Единое решение для всех типов документов
    ContentCapture 12 в едином потоке обрабатывает бумажные и электронные документы из разных источников — МФУ, сетевых сканеров, электронных писем, FTP, горячих папок и мобильных устройств.

    Документы Word, Excel, PDF, тело электронного письма, отсканированные изображения и другие электронные документы можно обрабатывать одновременно.
Спецификация

ContentCapture 12 Distributed

Форматы и языки
Закажите эффективное решение
Заполните форму и получите консультацию, как наиболее эффективно использовать наши решения для задач вашего бизнеса.

С апреля 2022 года техническую поддержу продуктов ABBYY на территории России оказывает компания Content AI (ООО «Контент ИИ»).