ContentReader® Server. Серверное решение
для распознавания и конвертации документов
Входит в реестр отечественного ПО
ContentReader® Server
Корпоративное серверное решение для распознавания и преобразования файлов в PDF и другие электронные редактируемые форматы, которое работает на Windows и на Linux.
Решение быстро и точно распознает изображения и переводит их в PDF, PDF/A, Microsoft Word или другие типы файлов, удобные для поиска, просмотра, обмена и хранения.
Оптимизация документооборота
Хранение и передача оцифрованных документов в различные специализированные системы, а также возможность обмена данными внутри группы
Быстрый старт проекта
Единообразие форматов
Простота использования
Оптимизация работы сотрудников
Быстрый поиск документов
Файлы хранятся в структурированном цифровом архиве с возможностью легкого и удобного поиска по ключевым словам
Соблюдение государственных и корпоративных стандартов путем преобразования больших объемов документов в легкодоступные цифровые архивы
ContentReader Server работает для всех сотрудников организации, не требуя от них специальной подготовки
ContentReader Server легко интегрируется с SharePoint и автоматически конвертирует вновь добавленные в библиотеки файлы, при необходимости оставляя оригиналы
ContentReader Server упростит процесс ежедневной регистрации входящих документов в канцелярии. Удобный интерфейс станций сканирования и индексирования позволяет сканировать документы и регистрировать их в системе, просто выделяя необходимые атрибуты документа (номер входящего документа, дата и т. д.) при помощи курсора
Преобразование исторических документов в доступные для поиска файлы PDF, XML или EPUB. Сохранение культурного наследия путем оцифровки рукописей, напечатанных историческими шрифтами, и их добавления в цифровые библиотеки для будущих поколений
Распознавание символов
Обеспечение быстрых и точных результатов на более чем 190 языках.
Поддержка 64-битной архитектуры
Серверная архитектура
Поддержка большого количества форматов
Интеграция с SharePoint
Конвертация документов из библиотек SharePoint в файлы PDF с возможностью поиска.
Гибкая технология при работе с PDF
Технология MRC-сжатия уменьшает размер PDF-файлов, при этом сохраняет оптимальное качество документа.
Распознавание штрихкодов
Распознавание штрихкодов 1D и 2D для разделения документов и/или добавления метаданных.
Определение формата данных
Автоматическое определение типов документов и атрибутов. При необходимости метаданные возможно задать вручную.
Распознавание исторических шрифтов
Интеграция в существующие системы
Легкая интеграция с цифровыми архивами и системами ECM через XML-описания, COM-совместимый API и API на базе веб-сервиса.
Разделение документов
Деление потока изображений на документы по количеству страниц, наличию пустых страниц, страниц со штрихкодами и/или с помощью скрипта с заданными правилами.
Интеллектуальная обработка PDF
Получение документов
ContentReader Server получает изображения документов со сканеров, из сетевых папок, писем электронной почты и библиотек Microsoft SharePoint.
Сканирование документов
Одной из компонент ContentReader Server является Станция сканирования, которая предназначена для потокового сканирования документов. Например, пользователи могут использовать скрипт для разделения страниц на документы и/или изменения порядка страниц после двустороннего сканирования.
Инструменты программы позволяют предварительно
просмотреть и улучшить изображение (исправить искажения, повернуть документ), вручную отредактировать, например, удалить конфиденциальные документы и др.
Импорт документов
ContentReader Server может автоматически получать отсканированные изображения из библиотек и файлов,
отправленных вложением к электронному письму. Импортировать документы можно:
• с сетевых сканеров (через интерфейсы TWAIN, WIA, ISIS) и МФУ,
• из горячих папок (FTP или локальная сеть),
• из папок со сложной структурой (с вложенными подпапками),
• из сетевых папок и библиотек SharePoint,
• из почтовых программ (Microsoft Exchange, POP3, IMAP),
• с помощью API,
• с факса и др
Распознавание
Распознавание происходит автоматически на Станции обработки. Решение также предоставляет инструменты для повышения точности результатов распознавания, такие как:
• Предобработка изображений (например, разделение сдвоенных страниц для отсканированных книг или удаление шумов);
• Поддержка распознавания разных типов текста: нормальный текст, машинописный, матричный, MICR (E13B), OCR-A, OCR-B, готические шрифты;
• Определение языка (автоматическое распознавание более 190 языков и исторических текстов).
Для некоторых задач, например, для оцифровки книг, необходима верификация данных. В ContentReader Server встроена Станция верификации, которая позволяет корректировать результаты распознавания как для всех документов, так и для отдельных документов, которые не прошли порог качества на основе допустимого количества неуверенно распознанных символов на страницу.
Пользователь может вручную задать атрибуты для документов в интерфейсе Станции индексирования, либо настроить скрипт для автоматической индексации. Список атрибутов можно импортировать и синхронизировать со сторонними системами.
Формирование комплекта документов
Обработанные страницы собираются в документы. Комплекты страниц могут быть собраны 3 способами:
• По пустым листам или разделительному штрихкоду;
• По фиксированному количеству страниц;
• По более сложным правилам, определенным через скрипт.
ContentReader Server поддерживает экспорт файлов сразу в нескольких выходных форматах. Упорядоченные
документы можно отправить по целевому назначению — в сетевые папки, библиотеки SharePoint, на адреса почтовых ящиков или в другие приложения через API.
ContentReader Server для Linux
Аппаратное обеспечение:
Оперативная память:
Свободное место на диске:
ContentReader Server для Windows
- обработка документов, хранящихся в Microsoft SharePoint,
- экспорт результатов обработки в Microsoft SharePoint,
- работа с веб-интерфейсом прикладного программирования ContentReader Server
* Примечание. Место на жестком диске, необходимое для работы программы, может быть больше в зависимости от сложности, качества и количества изображений.
HKEY_CLASSES_ROOT
HKEY_LOCAL_MACHINE\Software\
HKEY_CURRENT_USER\Software\
обработка документов, хранящихся в Microsoft SharePoint,
экспорт результатов обработки в Microsoft SharePoint,
работа с веб-интерфейсом прикладного программирования ContentReader Server
* Примечание. Место на жестком диске, необходимое для работы программы, может быть больше в зависимости от сложности, качества и количества изображений.
* Примечание. Место на жестком диске, необходимое для работы программы, может быть больше в зависимости от сложности, качества и количества изображений.
* Примечание. Место на жестком диске, необходимое для работы программы, может быть больше в зависимости от сложности, качества и количества изображений.
* Примечание. Место на жестком диске, необходимое для работы программы, может быть больше в зависимости от сложности, качества и количества изображений.
ContentReader Server поддерживает более 190 языков распознавания во всех комбинациях. 49 языков включают поддержку словаря (отмечены значком - ●)
--Начало блока--
абхазский
аварский
агульский
адыгейский
азербайджанский (кириллица) ●
азербайджанский (латиница)
аймара
албанский
алтайский
английский ●
арабский (Саудовская Аравия) ●
армянский (восточный) ●
армянский (грабар) ●
армянский (западный) ●
африкаанс
ацтекский
баскский
башкирский ●
белорусский
бемба
бирманский
блэкфут
болгарский ●
бретонскийx
буготу
бурятский
валлийский
венгерский ●
волоф
вьетнамский ●
гавайский
гагаузский
галисийский
ганда
греческий ●
грузинский
гуарани
гэлау
гаэльский (Шотландия)
дакота (сиу)
даргинский
датский ●
дун
дунганский
зулу
иврит ●
идиш
ингушский
индонезийский ●
ирландский
исландский
испанский ●
итальянский ●
кабардино-черкесский
казахский
калмыцкий
каракалпакский
карачаево-балкарский
каталанский ●
кашубский
кечуа (Боливия)
кикуйю
киргизский
китайский (традиционный)
китайский (упрощенный)
конго
корейский ●
корейский (хангыль)
корсиканский
корякский
коса
кпелле
кроу
крымскотатарский
кумыкский
курдский
лакский
латинский ●
латышский ●
латышский готический
лезгинский
литовский ●
луба
лужицкий
майя
македонский
малагасийский
малайский (малазийский)
малинке
мальтийский
мансийский
маори
марийский
минангкабау
могавк
монгольский
мордовский
мяо
немецкий ●
немецкий (Люксембург)
немецкий (новая орфография) ●
ненецкий
нивхский
нидерландский ●
нидерландский (Бельгия) ●
ногайский
норвежский (букмол) ●
норвежский (нюнорск) ●
ньянджа
оджибве
осетинский
папьяменто
персидский
пиньинь
польский ●
португальский ●
португальский (Бразилия) ●
провансальский
ретороманский
руанда
румынский ●
румынский (Молдова)
рунди
русский ●
русский (старая орфография) ●
русский с ударениями
саамский
самоа
сапотек
свази
себуанский
селькупский
сербский (кириллица)
сербский (латиница)
словацкий ●
словенский ●
сомали
сото (Южный)
староанглийский ●
староиспанский ●
староитальянский ●
старонемецкий ●
старославянский
старофранцузский ●
суахили
сунданский
табасаранский
тагальский
таджикский
таити
тайский ●
татарский ●
ток-писин
тонга
тсвана
тувинский
турецкий ●
туркменский (Кириллица)
туркменский (Латиница)
удмуртский
узбекский (кириллица)
узбекский (латиница)
уйгурский (кириллица)
уйгурский (латиница)
украинский ●
фарерский
фиджи
финский ●
французский ●
фризский
фриульский
хакасский
хани
хантыйский
хауса
хорватский ●
цзинпо
цыганский
чаморро
чеченский
чешский ●
чувашский
чукотский
шведский ●
шона
эвенкийский
эвенский
эскимосский (кириллица)
эскимосский (латиница)
эстонский ●
якутский
японский ●
японский (современный)
Искусственные языки
идо
интерлингва
окциденталь
эсперанто
Цифры
Арабские цифры
Арабско-индийские цифры
--Начало блока--
Русский
Английский
Китайский
Французский
Чешский
Венгерский
Корейский
Немецкий
Японский
Испанский
Польский
Португальский
--Начало блока--
Check Code 39
Check Interleaved 2 of 5
Code 128
Code 32
Code 39
Code 39 without asterisk
Code 39: Full ASCII Mode
EAN 13
EAN 8
Interleaved 2 of 5
CODABAR (without checksum)
UCC-128
Code 2 of 5 (Industrial, Interleaved, IATA, Matrix)
Code 93
UPC-A
Postal: Australia 4-State
Postal: KIX (Dutch)
Postal: Royal Mail 4-State (RM4SCC)
UPC-E
Patch Code and Postnet
USPS-4CB (Intelligent Mail Barcode)
PDF 417
Aztec
Data Matrix
QR Code
2D: Maxi Code
Входные форматы
Файлы изображений:
Офисные документы:
Email:
Кастомизация
Выходные форматы