ContentCapture®
Эффект от внедрения
Сокращение времени принятия решений
Быстрая и точная обработка данных ускоряет принятие управленческих решений.
Снижение издержек
на обработку документов
Автоматическая классификация, распознавание и экспорт данных из любых источников и типов документов в ИС.
Контроль на всех этапах и уровнях
Расширенные возможности мониторинга помогают управлять потоком документов и оптимизировать работу сотрудников.
Глубокая интеграция с другими системами
Импорт
ContentCapture® обрабатывает в едином потоке электронные письма и вложения, бумажные документы, электронные документы в офисных форматах, фотографии с камер и мобильных устройств.
Решение легко масштабируется и подходит для обработки любого объема документации в форматах TXT, EML, XLSX, VSD, HTML, DOCX, XLS, VSDX, DOC, PPTX, HTM, PPT, и RTF.
Интеллектуальная классификация
Классификация с применением технологий ИИ позволяет автоматически сортировать документы по типам и по пользовательским категориям.
В систему достаточно ввести 10 образцов нового класса документа, и технология автоматически научится определять тип документа по внешнему виду или взаимному расположению элементов.
ContentCapture® умеет собирать документы в комплекты по заданным алгоритмам, а также собирать разрозненные многостраничные документы с сохранением порядка следования разделов, номеров и числа страниц.
Распознавание
Система распознает в документе только необходимый для дальнейшей работы текст.
ContentCapture® автоматически извлекает данные из структурированных и неструктурированных документов.
Автоматические проверки данных:
Система сравнивает данные распознавания с отсканированным оригиналом документа и автоматически подсвечивает неуверенно распознанные данные, а также отображает информацию о не пройденных проверках данных. Способы проверки данных:
Экспорт данных
ContentCapture® автоматически сохраняет результаты распознавания в файлы различных форматов, экспортирует их в базы данных, учетные и иные информационные системы:
Данные можно одновременно экспортировать в различные директории и преобразовать сразу в несколько форматов.
ContentCapture® включает в себя консоль администрирования и мониторинга на базе HTML5 для настройки различных вариантов отчетов:
Также возможно создание графиков и дашбордов для пользователей с разными ролями: администратор, пользователь и т. д.
В ContentCapture® применяются технологии искусственного интеллекта, что значительно расширяет функциональные возможности системы.
Благодаря машинному обучению и обработке текста на естественном языке платформа автоматически распознает, классифицирует, извлекает, проверяет и передает данные в информационные системы из любых текстовых сообщений и документов, задействованных в производственных процессах.
Кроссбраузерная поддержка и современный дизайн на базе HTML5
Веб-станции ContentCapture® на базе HTML5 поддерживают браузеры Chrome, Firefox, Safari, IE, Opera и другие.
Благодаря удобному интерфейсу веб-станций, компании с филиальной сетью могут распределить производственные процессы по подразделениям вне зависимости от того, как используются рабочие станции — локально, удаленно или через браузер.
Интеллектуальная классификация
Система классифицирует любые типы входящих документов как по внешнему виду и взаимному расположению элементов, так и по текстовому содержанию.
Классификация по изображению основана на машинном обучении (сверточные нейронные сети). Текстовая классификация опирается на статистический и семантический анализ.
ContentCapture® комбинирует результаты применения различных технологий классификации и автоматически подбирает лучший алгоритм сортировки.
Интеллектуальная классификация позволяет упростить управление информацией в организации, сократить время на обработку данных и ускорить принятие решений.
Автообучение
С помощью автообучения можно сократить время на внедрение и уменьшить расходы на обслуживание системы. За счет технологий искусственного интеллекта на результатах работы верификаторов система сама учится извлекать данные из ряда документов, что позволяет быстро настраивать шаблоны для новых типов документов.
Администратор может редактировать, настраивать или отменять результаты автообучения. Система корректирует свою работу, собирая обратную связь от пользователей, что сильно снижает затраты на ее техническую поддержку. Это особенно важно при реализации масштабных проектов с необходимостью обрабатывать большое количество данных.
Мониторинг SLA — одна из основ работы современного бизнеса. Новые возможности позволяют оптимизировать работу системы, устанавливать и контролировать скорость обработки для наиболее критичных бизнес-процессов. Система позволяет задавать желаемое время обработки данных и уровень важности для каждого типа обрабатываемых пакетов документов. Порядок заданий в очереди рассчитывается автоматически, чтобы завершить обработку в установленное время. При большой нагрузке возможно распределить задачи, близкие к истечению срока, вручную. Встроенные отчеты и наглядные панели мониторинга помогут контролировать работу системы и соблюдение сроков SLA.
Мультитенантность
ContentCapture® позволяет создавать логически изолированную защищенную среду для различных групп пользователей (тенантов), применяя при этом общие политики для пользователей-тенантов и единую аппаратную инфраструктуру.
Используя централизованное управление и администрирование над всеми тенантами, можно сократить время настройки и защитить конфиденциальные данные в разных рабочих группах.
Комплекты документов
ContentCapture® 12 Distributed
Процессор
Сервер Приложений: не менее 2 ГГц, рекомендуется использовать процессор с 2-мя и более ядрами
Остальные серверы: не менее 2 ГГц
Операционная система
Замечание. Для работы с локализованным интерфейсом операционная система должна обеспечивать необходимую языковую поддержку.
Оперативная память
Не менее 2 ГБ для каждого компонента
Замечание. Дополнительно 4 ГБ, если установлен Сервер Баз Данных.
Место на диске
Браузер
(для просмотра Консоли Администрирования и Мониторинга)
Замечание. Наилучшим браузером для работы с ContentCapture является Google Chrome либо другие браузеры на основе Chromium.
Внимание! Отказ от ответственности для пользователей Internet Explorer / Известная проблема
Из-за известных ограничений Internet Explorer 11 в ContentCapture могут возникать проблемы при одновременной обработке десятков страниц или при наличии большого числа задач верификации. Использование Internet Explorer в течение длительного периода времени может привести к тому, что браузер будет потреблять все больше памяти компьютера, замедлению работы пользователя и в конечном итоге к сбою в работе браузера.
Чтобы избежать нежелательных прерываний задач, Content AI рекомендует использовать для веб-верификации Microsoft Edge, Google Chrome или другие браузеры. Тем не менее, веб-станции ContentCapture полностью функционируют в Internet Explorer 11 и в некоторых случаях его можно использовать для обработки документов.
Особенности работы в браузере Internet Explorer
Другие требования
Процессор
не менее 2 ГГц
Операционная система
Замечание. Для работы с локализованным интерфейсом операционная система должна обеспечивать необходимую языковую поддержку.
Оперативная память
Станция Настройки Проекта, Станция Верификации, Станция Верификации Данных: 2 ГБ
Станция Обработки: не менее 2,5 ГБ на каждое ядро процессора
Станция Сканирования: 1 ГБ
Место на диске
Станция Сканирования: 1 ГБ (включая 200 МБ для установки и место для отсканированных изображений)
Остальные станции: 4 ГБ (включая 2 ГБ для установки)
Другие требования
Процессор
не менее 1,6 ГГц
Операционная система
Замечание. Для работы с локализованным интерфейсом операционная система должна обеспечивать необходимую языковую поддержку.
Оперативная память
1 ГБ
Место на диске
Браузер
Замечание. Наилучшим браузером для работы с ContentCapture является Google Chrome либо другие браузеры на основе Chromium.
Замечание. Для корректной работы Internet Explorer 11 требуется установить .NET Framework 4.5 на компьютере, на котором установлен Сервер Приложений, или добавить адрес Сервера Приложений в список сайтов, просматриваемых в режиме совместимости.
Замечание. Версия Internet Explorer для Metro-интерфейса Windows не поддерживается.
Внимание! Отказ от ответственности для пользователей Internet Explorer / Известная проблема
Из-за известных ограничений Internet Explorer 11 в ContentCapture могут возникать проблемы при одновременной обработке десятков страниц или при наличии большого числа задач верификации. Использование Internet Explorer в течение длительного периода времени может привести к тому, что браузер будет потреблять все больше памяти компьютера, замедлению работы пользователя и в конечном итоге к сбою в работе браузера.
Чтобы избежать нежелательных прерываний задач, Content AI рекомендует использовать для веб-верификации Microsoft Edge, Google Chrome или другие браузеры. Тем не менее, веб-станции ContentCapture полностью функционируют в Internet Explorer 11 и в некоторых случаях его можно использовать для обработки документов.
Особенности работы в браузере Internet Explorer
Другие требования
При установке ABBYY Scanning Plugin доступен выбор из двух вариантов:
Таблица выше иллюстрирует совместимость ABBYY Scanning Plugin с различными операционными системами при различных правах доступа.
Замечание. Чтобы разрешить установку Content AI Scanning Plugin для Windows Server 2012, необходимо запускать исполнимый файл Setup.exe от имени администратора либо изменить политику безопасности, установив значение ключа реестра HKEY_LOCAL_MACHINE\Software\Policies\Microsoft\Windows\Installer DisableMSI равным «0».
Процессор
не менее 2 ГГц
Операционная система
Замечание. Для работы с локализованным интерфейсом операционная система должна обеспечивать необходимую языковую поддержку.
Оперативная память
1 ГБ
Место на диске
400 МБ
Другие требования
Работу комплекса поддерживают следующие виртуальные машины:
Замечание. Версия Hyper-V соответствует версии операционной системы.
Замечание. Виртуальные машины Hyper-V не поддерживают работу с USB устройствами.
2. Платформы виртуализации, имитирующие рабочее место / приложение:
3. Сервисы облачных вычислений:
абхазский
аварский
агульский
адыгейский
азербайджанский (кириллица) ●○
азербайджанский (латиница)
аймара ○
албанский ○
алтайский
английский ●○
арабский (Саудовская Аравия) ●
армянский (восточный) ●
армянский (грабар) ●
армянский (западный) ●
африкаанс ○
ацтекский ○
баскский ○
башкирский ●
белорусский
бемба ○
бирманский
блэкфут ○
болгарский ●○
бретонскийx
буготу ○
бурятский ○
валлийский
венгерский ●
волоф ○
вьетнамский ●
гавайский ○
гагаузский
галисийский ○
ганда ○
греческий ●
грузинский
гуарани ○
гэлау ○
гаэльский (Шотландия) ○
дакота (сиу) ○
даргинский
датский ●
дун ○
дунганский
зулу
иврит ●
идиш
ингушский
индонезийский ●
ирландский ○
исландский
испанский ● ○
итальянский ● ○
кабардино-черкесский
казахский ○
калмыцкий
каракалпакский
карачаево-балкарский ○
каталанский ●
кашубский ○
кечуа (Боливия) ○
кикуйю
киргизский ○
китайский (традиционный)
китайский (упрощенный)
конго ○
корейский ●
корейский (хангыль)
корсиканский
корякский
коса ○
кпелле ○
кроу ○
крымскотатарский ○
кумыкский ○
курдский ○
лакский
латинский ● ○
латышский ● ○
латышский готический
лезгинский
литовский ● ○
луба ○
лужицкий
майя ○
македонский
малагасийский ○
малайский (малазийский)
малинке ○
мальтийский
мансийский
маори ○
марийский
минангкабау ○
могавк ○
монгольский ○
мордовский ○
мяо ○
немецкий ● ○
немецкий (Люксембург) ○
немецкий (новая орфография) ● ○
ненецкий
нивхский ○
нидерландский ● ○
нидерландский (Бельгия) ● ○
ногайский ○
норвежский (букмол) ● ○
норвежский (нюнорск) ● ○
ньянджа ○
оджибве ○
осетинский
папьяменто ○
персидский
пиньинь
польский ● ○
португальский ● ○
португальский (Бразилия) ● ○
провансальский
ретороманский ○
руанда ○
румынский ● ○
румынский (Молдова) ○
рунди ○
русский ● ○
русский (старая орфография) ●
русский с ударениями
саамский ○
самоа ○
сапотек ○
свази ○
себуанский ○
селькупский ○
сербский (кириллица) ○
сербский (латиница) ○
словацкий ● ○
словенский ● ○
сомали ○
сото (Южный) ○
староанглийский ● ○
староиспанский ● ○
староитальянский ● ○
старонемецкий ● ○
старославянский
старофранцузский ● ○
суахили ○
сунданский
табасаранский
тагальский ○
таджикский ○
таити ○
тайский ●
татарский ●
ток-писин ○
тонга ○
тсвана ○
тувинский ○
турецкий ● ○
туркменский (Кириллица)
туркменский (Латиница) ○
удмуртский
узбекский (кириллица)
узбекский (латиница) ○
уйгурский (кириллица)
уйгурский (латиница) ○
украинский ● ○
фарерский
фиджи ○
финский ● ○
французский ● ○
фризский ○
фриульский ○
хакасский
хани ○
хантыйский
хауса
хорватский ● ○
цзинпо
цыганский
чаморро ○
чеченский
чешский ●
○
чувашский
чукотский
шведский ● ○
шона
эвенкийский ○
эвенский ○
эскимосский (кириллица)
эскимосский (латиница)
эстонский ● ○
якутский
японский ●
японский (современный)
Искусственные языки
идо ○
интерлингва ○
окциденталь
эсперанто
Цифры
Арабские цифры ○
Арабско-индийские цифры ○
русский
английский
Программные продукты компании Content AI поддерживают сканирующие устройства, которые корректно работают с драйверами стандартов TWAIN, WIA. Например, с популярными моделями сканеров и многофункциональных устройств следующих производителей: Avision, Brother, Canon, Epson, Fujitsu, HP, Kodak, Lexmark, Microtek, Mustek, Oki, Panasonic, Plustek, Ricoh, Visioneer, VuPoint, Xeroxи многих других.
Тем не менее, в общем случае компания Content AI не может гарантировать и не гарантирует работоспособность своих программ с любыми сканерами. В соответствии с этим компания Content AI не несет ответственности за возможный коммерческий ущерб, связанный с использованием вышеприведенной информации.
Если Вам не удается наладить работу вашего сканера или многофункционального устройства с программным продуктом компании Content, обратитесь в службу технической поддержки.
Система распознает следующие типы текстов:
EAN 13
EAN 8
Code 39
Code 39 without asterisk
Check Code 39
Interleaved 25
Check Interleaved 25
Code 128
Codabar
UPC-A
UPC-E
Code 93
UCC-128
PDF-417
IATA 25
Matrix 25
Industrial 25
PostNet
Patch code
Check CodaBar
Aztec
Datamatrix
QR code
(!) Для распознавания штрих-кодов с кириллической кодировкой нужно использовать штрих-код в формате Datamatrix, PDF417 или QRCode.
Форматы импорта
Документы могут быть не только отсканированы, но и загружены в систему из файлов изображений:
* - Для изображений в формате JPEG-2000 используется сжатие без потери качества.
Форматы экспорта
Возможности экспорта данных:
Форматы экспорта данных
Форматы экспорта изображений
ContentCapture®
Банк
ContentCapture® Банк — готовое решение, позволяющее автоматизировать ввод данных из платежных документов в банковские информационные системы. Решение разработано специально для банковской отрасли с учетом ее особенностей и позволяет упростить работу с самыми востребованными документами: платежными поручениями, платежными требованиями и инкассовыми поручениями.