Поддержка

Партнеры

Компания

Решение для обработки документов, удостоверяющих личность

Для разработчиков

Сравнение документов ContentReader^® Engine

Автоматическое сравнение документов для снижения рисков подписания некорректных версий

Многофункциональный OCR SDK для разработчиков

ContentReader^® Engine

Intelligent Search

Для бизнеса

Серверное решение для распознавания и конвертации документов

ContentReader^® Server

ContentCapture^®

Удобный инструмент для просмотра PDF-документов

ContentReader^®PDF Lite

Для персонального использования

Многофункциональный редактор PDF

ИИ-ассистенты на основе поисковых технологий

PassportReader 2.0

ContentReader^® PDF для офиса

ContentReader^® PDF для дома

Распознавание документов и роботизация процессов в единой платформе

Редактор PDF-документов с ИИ-ассистентом и функцией сравнения и автораспознавания

Для ритейла

Оптимизация операционных процессов с помощью автоматической обработки документов

Оптимизация затрат на операционную деятельность: обработка показаний приборов, другое

Для энергетики

Кросс-индустриальные

Автоматизация ключевых бизнес-процессов: обработка первичных документов, извлечение данных из документов

Автоматизация обработки различных документов на промышленных предприятиях

Для промышленности

Для банков

Автоматизация обработки основных финансовых документов: открытие счета, обработка кредитных заявок, другое

Оптимизация оцифровки, электронные архивы, обработка бланков и анкет, другое

Для госсектора

Истории успеха

Клиенты

О нас

О компании Content AI

Центр компетенций

Онлайн-курсы от экспертов Content AI

Пресс-релизы и интервью, информация для СМИ

Новости

Наша команда

Руководство и менеджмент

Вакансии в Content AI

Карьера

Российские вендоры ПО

Технологическое сотрудничество

Партнерский портал

Перейти во внутренний портал для наших партнеров. Стать партнером

Наши партнеры

Дистрибьюторы, партнеры по массовым и корпоративным продуктам

Справочная информация о продуктах Content AI

Онлайн-справка

База знаний

Ответы на частые вопросы пользователей

Техническая поддержка

Отправить запрос в техническую поддержку

Магазин

Консультация

Content AI — российский разработчик решений в области интеллектуальной обработки информации.

Имеет статус программного продукта, относящегося к сфере искусственного интеллекта в Реестре отечественного ПО

Реестровая запись №20814 от 26.12.2023

Консультация

Запросить пробную версию

Серверное решение для распознавания и конвертации больших объемов документов

ContentReader^® Server

Главная / ContentReader^® Server

Linux

Windows

Центр компетенций Content AI

Онлайн-курс «Основы ИИ для бизнеса»

Первый бесплатный курс для нетехнических пользователей о применении искусственного интеллекта в бизнесе.

Записаться на курс

ContentReader^® Server

Корпоративное серверное решение для полнотекстового распознавания и преобразования файлов в PDF и другие электронные редактируемые форматы, которое работает на Windows и на Linux.

Решение быстро и точно распознает изображения и переводит их в PDF, PDF/A, Microsoft^® Word или другие типы файлов, удобные для поиска, просмотра, обмена и хранения.

Оптимизация документооборота
Старт проект за 30 минут
Интеграция через API (Программный интерфейс приложений)
Оптимизация работы сотрудников
Простота использования
Возможность поиска

Сценарии использования

Ввод входящих документов в режиме «Канцелярия»

ContentReader^® Server упростит процесс ежедневной регистрации входящих документов в канцелярии. Удобный интерфейс станций сканирования и индексирования позволяет сканировать документы и регистрировать их в системе, просто выделяя необходимые атрибуты документа (номер входящего документа, дата и т. д.) при помощи курсора.
Создание цифровых библиотек и сохранение культурного наследия

Преобразование исторических документов в доступные для поиска файлы PDF, XML или EPUB. Сохранение культурного наследия путём оцифровки рукописей, напечатанных историческими шрифтами, и их добавления в цифровые библиотеки для будущих поколений.
Эффективное наполнение и помощь в нормализации единого электронного архива

Удаление дубликатов, стандартизация форматов и устранение несогласованностей.

Производительность за 24 часа

Возможности

Ключевые возможности ContentReader Server.

Распознавание символов

Обеспечение быстрых и точных результатов на более чем 190 языках.
Поддержка 64-битной архитектуры

Быстрая конвертация больших объемов документов за короткий промежуток времени.
Серверная архитектура

Наиболее эффективное распределение нагрузки на оборудование.
Поддержка большого количества форматов

Конвертация в PDF, JPEG, TIFF, Word, Excel, OpenDocument Text, PowerPoint, HTML и другие форматы.
Интеграция с DocTrix

Конвертация документов из библиотек DocTrix в файлы PDF с возможностью поиска.
Гибкая технология при работе с PDF

Технология MRC-сжатия (сжатие смешанного растрового содержимого) уменьшает размер PDF-файлов, при этом сохраняет оптимальное качество документа.
Распознавание штрихкодов

Распознавание штрихкодов 1D и 2D для разделения документов и/или добавления метаданных.
Определение формата данных

Автоматическое определение типов документов и атрибутов. При необходимости метаданные возможно задать вручную.
Распознавание исторических шрифтов

Распознавание старопечатных символов и готических шрифтов на английском, немецком, французском, итальянском и испанском языках.
Интеграция в существующие системы

Легкая интеграция с цифровыми архивами и системами ECM (система управления корпоративным контентом) через XML-описания, совместимый по стандартам независимой от платформы распределенной объектно-ориентированной системы (COM) API (программный интерфейс приложений) и API на базе веб-сервиса.
Разделение документов

Деление потока изображений на документы по количеству страниц, наличию пустых страниц, страниц со штрихкодами и/или с помощью скрипта с заданными правилами.
Интеллектуальная обработка PDF

Решение позволяет работать с PDF: улучшать текст низкого качества, сохранять закладки из оригиналов документов, обрабатывать файлы с цифровой подписью и другое.

Как это работает

Итоговые данные

Сетевая папка

Enterprise Contetnt Management

Цифровой архив

E-mail

DocTrix

Обработка

Автоматизированное распознавание и конвертация документов

Опционально:

Верификация и исправление

Индексирование

Импорт документов

Локальная/сетевая папка

Сканирование

Информационная система

E-mail

DocTrix

XML, PDF, PDF/A и т.д.

PDF, TIFF, JPG, PNG и т.д.

01. Получение документов

ContentReader^® Server получает изображения документов со сканеров, из сетевых папок, писем электронной почты и библиотек Microsoft SharePoint.

Сканирование документов
Одной из компонент ContentReader^® Server является Станция сканирования, которая предназначена для потокового сканирования документов. Например, пользователи могут использовать скрипт для разделения страниц на документы и/или изменения порядка страниц после двустороннего сканирования. Инструменты программы позволяют предварительно просмотреть и улучшить изображение (исправить искажения, повернуть документ), вручную отредактировать, например, удалить конфиденциальные документы и др.

Импорт документов
ContentReader^® Server может автоматически получать отсканированные изображения из библиотек и файлов, отправленных вложением к электронному письму. Импортировать документы можно:
с сетевых сканеров (через интерфейсы TWAIN, WIA, ISIS) и МФУ,
из горячих папок (FTP или локальная сеть),
из папок со сложной структурой (с вложенными подпапками),
из сетевых папок и библиотек SharePoint,
из почтовых программ (Microsoft Exchange, POP3, IMAP),
с помощью API,
с факса и др.

02. Распознавание
Распознавание происходит автоматически на Станции обработки. Решение также предоставляет инструменты для повышения точности результатов распознавания, такие как:
- Предобработка изображений (например, разделение сдвоенных страниц для отсканированных книг или удаление шумов);
- Поддержка распознавания разных типов текста: нормальный текст, машинописный, матричный, MICR (E13B), OCR-A, OCR-B, готические шрифты;
- Определение языка (автоматическое распознавание более 190 языков и исторических текстов).
03. Верификация (опционально)

Для некоторых задач, например, для оцифровки книг, необходима верификация данных. В ContentReader^® Server встроена Станция верификации, которая позволяет корректировать результаты распознавания как для всех документов, так и для отдельных документов, которые не прошли порог качества на основе допустимого количества неуверенно распознанных символов на страницу.
04. Индексирование (опционально)

Пользователь может вручную задать атрибуты для документов в интерфейсе Станции индексирования, либо настроить скрипт для автоматической индексации. Список атрибутов можно импортировать и синхронизировать со сторонними системами.
05. Формирование комплекта документов

Обработанные страницы собираются в документы. Комплекты страниц могут быть собраны 3 способами:
• По пустым листам или разделительному штрихкоду;
• По фиксированному количеству страниц;
• По более сложным правилам, определенным через скрипт.
06. Экспорт документов

ContentReader^® Server поддерживает экспорт файлов сразу в нескольких выходных форматах. Упорядоченные документы можно отправить по целевому назначению — в сетевые папки, библиотеки SharePoint, на адреса почтовых ящиков или в другие приложения через API.

Заказчики

Истории успеха

Сибур

«СИБУР» реализовал проект по централизации учетных функций с помощью ContentReader^® Server.

Читать кейс

FESCO

Content AI поставила решение для серверной обработки документов Транспортной группе FESCO.

Читать кейс

Ридан

Компания «Ридан» выбрала ContentReader^® Server для импортозамещения.

Читать кейс

«Хроники Приангарья»

Content AI оцифровала материалы проекта «Хроники Приангарья» для электронной краеведческой библиотеки Иркутской области.

Читать кейс

Новости

Спецификация

ContentReader^® Server для Linux

ContentReader^® Server для Windows

ПК с процессором семейств Intel® Pentium®/Celeron®/Xeon™/Core™, AMD K6/Athlon™/Duron™/Sempron™/Opteron™ или совместимым с ними процессором, тактовая частота которого составляет не менее 2 GHz, с числом ядер 2 или больше.
Microsoft® Windows® 11, Windows® 10, Windows® 8.1, Windows Server® 2022, Windows Server® 2019, Windows Server® 2016, Windows Server® 2012 R2, Windows Server® 2012, включая развертывание на виртуальных машинах Microsoft Azure
Оперативная память: 4 GB. Дополнительно 512 MB для каждого процесса распознавания.
Свободное место на диске: до 7 ГБ в зависимости от установленных компонентов и 2 GB для работы программы. *
Microsoft .NET Framework 4.5 необходим для решения следующих задач:

- обработка документов, хранящихся в Microsoft SharePoint,
- экспорт результатов обработки в Microsoft SharePoint,
- работа с веб-интерфейсом прикладного программирования ContentReader Server

Microsoft Outlook 2010 или более поздний требуется для обработки и отправки электронных писем через Microsoft Exchange Server и протокол MAPI
Сканер с поддержкой TWAIN, WIA или ISIS
Дополнительное программное обеспечение: для работы требуется MSXML6

* Примечание. Место на жестком диске, необходимое для работы программы, может быть больше в зависимости от сложности, качества и количества изображений.

ПК с процессором семейств Intel® Pentium®/Celeron®/Xeon™/Core™, AMD K6/Athlon™/Duron™/Sempron™/Opteron™ или совместимым с ними процессором, тактовая частота которого составляет не менее 2 GHz, с числом ядер 2 или больше.
Microsoft® Windows® 11, Windows® 10, Windows® 8.1, Windows Server® 2022, Windows Server® 2019, Windows Server® 2016, Windows Server® 2012 R2, Windows Server® 2012, включая развертывание на виртуальных машинах Microsoft Azure
Оперативная память: 4 GB.
Свободное место на диске: до 5 ГБ в зависимости от установленных компонентов и 2 GB для работы программы. *
Учетная запись пользователя, под которой запущен сервер, должна иметь права на чтение и запись к следующим ветвям реестра:

HKEY_CLASSES_ROOT
HKEY_LOCAL_MACHINE\Software\

HKEY_CURRENT_USER\Software\

Microsoft .NET Framework 4.5 необходим для решения следующих задач:

обработка документов, хранящихся в Microsoft SharePoint,
экспорт результатов обработки в Microsoft SharePoint,
работа с веб-интерфейсом прикладного программирования ContentReader Server

Microsoft Outlook 2010 или более поздний требуется для обработки и отправки электронных писем через Microsoft Exchange Server и протокол MAPI.

Форматы и языки

Информация о стоимости решения

Право использования продукта предоставляется на основании лицензионного договора. Стоимость лицензии рассчитывается индивидуально в зависимости от объемов обрабатываемой информации и других параметров решения, и предоставляется после консультации.