ContentCapture®
ContentCapture включен в реестр российского ПО, работает на отечественных ОС и на Windows. Подходит для импортозамещения ABBYY Flexicapture, Kofax Capture, IBM Datacap.
Почему ContentCapture
Технологии ИИ
NEW!
Распознавание рукописного текста
Извлекайте из документов данные, написанные от руки с помощью специализированных ICR-технологий. Они позволяют автоматизировать обработку разнообразных документов: паспортов, анкет, заявлений и др.
Предобработка входящих изображений
Автоматически улучшайте изображения для оптимизации обработки информации. Функциональность особенно важна для работы с документами со сложным фоном: паспортов, водительских удостоверений, транспортных форм
Многоуровневая классификация документов
Используйте классификаторы для повышения эффективности обработки и маршрутизации документов. Благодаря применению передовых методов машинного обучения возможно определить любые типы документов и избавиться от необходимости их ручной сортировки и маркировкиНадежность
Все типы документов
С помощью продвинутого анализа документов ПО ContentCapture способно точно определить тип бумажных или электронных документов (таких как электронные таблицы, изображения, логотипы и другие), а также выделить различные области внутри документа, даже если текст на первый взгляд неразборчив. Решение может обрабатывать в одном потоке файлы в форматах Word, Excel, PDF, электронные сообщения, отсканированные изображения и другие цифровые документы
Схема работы
ContentCapture обрабатывает в едином потоке электронные письма и вложения, бумажные документы, электронные документы в офисных форматах, фотографии с камер и мобильных устройств
В систему достаточно ввести 10 образцов нового класса документа, и технология автоматически научится определять тип документа по внешнему виду или взаимному расположению элементов
Распознавание текста:
Решение также распознает линейные и двухмерные штрихкоды, различные метки
ContentCapture автоматически извлекает данные из структурированных и неструктурированных документов.
Автоматическая проверка данных:
Система сравнивает данные распознавания с отсканированным оригиналом документа и автоматически подсвечивает неуверенно распознанные данные, а также отображает информацию о непройденных проверках данных.
Способы проверки данных:
ContentCapture автоматически сохраняет результаты распознавания в файлы различных форматов, экспортирует их в базы данных, учетные и иные информационные системы:
Данные можно одновременно экспортировать в различные директории и преобразовать сразу в несколько форматов
ContentCapture включает в себя консоль администрирования и мониторинга на базе HTML5 для настройки различных вариантов отчетов:
Сценарии применения
и др.
Эффект от внедрения
Сокращение времени принятия решений
Быстрая и точная обработка данных ускоряет принятие управленческих решений
Снижение издержек
на обработку документов
Автоматическая классификация, распознавание и экспорт данных из любых источников и типов документов в ИС
Контроль на всех этапах и уровнях
Расширенные возможности мониторинга помогают управлять потоком документов и оптимизировать работу сотрудников
Спецификация
ContentCapture 14 Cross-platform
Процессор
Сервер Приложений: не менее 2 ГГц, рекомендуется использовать процессор с 2-мя и более ядрами
Остальные серверы: не менее 2 ГГц
Операционная система
Windows:
Linux:
Замечание. Для работы с локализованным интерфейсом операционная система должна обеспечивать необходимую языковую поддержку.
Оперативная память
Не менее 2 ГБ для каждого компонента
Замечание. Дополнительно 4 ГБ, если установлен Сервер Баз Данных.
Место на диске
Другие требования
Замечание. Для создания баз данных требуется также Microsoft SQL Server Native Client версии 2012 или выше.
Процессор
не менее 2 ГГц
Операционная система
Windows:
Замечание. Для работы с локализованным интерфейсом операционная система должна обеспечивать необходимую языковую поддержку.
Оперативная память
Станция Настройки Проекта, Станция Верификации, Станция Верификации Данных: 2 ГБ
Станция Обработки: не менее 2,5 ГБ на каждое ядро процессора
Станция Сканирования: 1 ГБ
Место на диске
Станция Сканирования: 1 ГБ (включая 200 МБ для установки и место для отсканированных изображений)
Остальные станции: 4 ГБ (включая 2 ГБ для установки)
Другие требования
Процессор
не менее 1,6 ГГц
Операционная система
Windows:
Замечание. Для работы с локализованным интерфейсом операционная система должна обеспечивать необходимую языковую поддержку.
Оперативная память
1 ГБ
Место на диске
Браузер
Замечание. Наилучшим браузером для работы с ContentCapture является Google Chrome либо другие браузеры на основе Chromium.
Другие требования
Видеокарта и дисплей с разрешением 1024×768
Работу комплекса поддерживают следующие виртуальные машины:
--Начало блока--
абхазский
аварский
агульский
адыгейский
азербайджанский (кириллица) ●○
азербайджанский (латиница)
аймара ○
албанский ○
алтайский
английский ●○
арабский (Саудовская Аравия) ●
армянский (восточный) ●
армянский (грабар) ●
армянский (западный) ●
африкаанс ○
ацтекский ○
баскский ○
башкирский ●
белорусский
бемба ○
бирманский
блэкфут ○
болгарский ●○
бретонскийx
буготу ○
бурятский ○
валлийский
венгерский ●
волоф ○
вьетнамский ●
гавайский ○
гагаузский
галисийский ○
ганда ○
греческий ●
грузинский
гуарани ○
гэлау ○
гаэльский (Шотландия) ○
дакота (сиу) ○
даргинский
датский ●
дун ○
дунганский
зулу
иврит ●
идиш
ингушский
индонезийский ●
ирландский ○
исландский
испанский ● ○
итальянский ● ○
кабардино-черкесский
казахский ○
калмыцкий
каракалпакский
карачаево-балкарский ○
каталанский ●
кашубский ○
кечуа (Боливия) ○
кикуйю
киргизский ○
китайский (традиционный)
китайский (упрощенный)
конго ○
корейский ●
корейский (хангыль)
корсиканский
корякский
коса ○
кпелле ○
кроу ○
крымскотатарский ○
кумыкский ○
курдский ○
лакский
латинский ● ○
латышский ● ○
латышский готический
лезгинский
литовский ● ○
луба ○
лужицкий
майя ○
македонский
малагасийский ○
малайский (малазийский)
малинке ○
мальтийский
мансийский
маори ○
марийский
минангкабау ○
могавк ○
монгольский ○
мордовский ○
мяо ○
немецкий ● ○
немецкий (Люксембург) ○
немецкий (новая орфография) ● ○
ненецкий
нивхский ○
нидерландский ● ○
нидерландский (Бельгия) ● ○
ногайский ○
норвежский (букмол) ● ○
норвежский (нюнорск) ● ○
ньянджа ○
оджибве ○
осетинский
папьяменто ○
персидский
пиньинь
польский ● ○
португальский ● ○
португальский (Бразилия) ● ○
провансальский
ретороманский ○
руанда ○
румынский ● ○
румынский (Молдова) ○
рунди ○
русский ● ○
русский (старая орфография) ●
русский с ударениями
саамский ○
самоа ○
сапотек ○
свази ○
себуанский ○
селькупский ○
сербский (кириллица) ○
сербский (латиница) ○
словацкий ● ○
словенский ● ○
сомали ○
сото (Южный) ○
староанглийский ● ○
староиспанский ● ○
староитальянский ● ○
старонемецкий ● ○
старославянский
старофранцузский ● ○
суахили ○
сунданский
табасаранский
тагальский ○
таджикский ○
таити ○
тайский ●
татарский ●
ток-писин ○
тонга ○
тсвана ○
тувинский ○
турецкий ● ○
туркменский (Кириллица)
туркменский (Латиница) ○
удмуртский
узбекский (кириллица)
узбекский (латиница) ○
уйгурский (кириллица)
уйгурский (латиница) ○
украинский ● ○
фарерский
фиджи ○
финский ● ○
французский ● ○
фризский ○
фриульский ○
хакасский
хани ○
хантыйский
хауса
хорватский ● ○
цзинпо
цыганский
чаморро ○
чеченский
чешский ● ○
чувашский
чукотский
шведский ● ○
шона
эвенкийский ○
эвенский ○
эскимосский (кириллица)
эскимосский (латиница)
эстонский ● ○
якутский
японский ●
японский (современный)
Искусственные языки
идо ○
интерлингва ○
окциденталь
эсперанто
Цифры
Арабские цифры ○
Арабско-индийские цифры ○
русский
английский
Программные продукты компании Content AI поддерживают сканирующие устройства, которые корректно работают с драйверами стандартов TWAIN, WIA. Например, с популярными моделями сканеров и многофункциональных устройств следующих производителей: Avision, Brother, Canon, Epson, Fujitsu, HP, Kodak, Lexmark, Microtek, Mustek, Oki, Panasonic, Plustek, Ricoh, Visioneer, VuPoint, Xerox и многих других.
Тем не менее, в общем случае компания Content AI не может гарантировать и не гарантирует работоспособность своих программ с любыми сканерами. В соответствии с этим компания Content AI не несет ответственности за возможный коммерческий ущерб, связанный с использованием вышеприведенной информации.
Если Вам не удается наладить работу вашего сканера или многофункционального устройства с программным продуктом компании Content AI, обратитесь в службу технической поддержки.
Система распознает следующие типы текстов:
EAN 13
EAN 8
Code 39
Code 39 without asterisk
Check Code 39
Interleaved 25
Check Interleaved 25
Code 128
Codabar
UPC-A
UPC-E
Code 93
UCC-128
PDF-417
IATA 25
Matrix 25
Industrial 25
PostNet
Patch code
Check CodaBar
Aztec
Datamatrix
QR code
(!) Для распознавания штрих-кодов с кириллической кодировкой нужно использовать штрих-код в формате Datamatrix, PDF417 или QRCode.
Форматы импорта
Документы могут быть не только отсканированы, но и загружены в систему из файлов изображений:
* - Для изображений в формате JPEG-2000 используется сжатие без потери качества.
Форматы экспорта
Возможности экспорта данных:
Форматы экспорта данных
Форматы экспорта изображений