Доступные, упорядоченные
и удобные для поиска файлы

ContentReader Server. Серверное решение

для распознавания и конвертации документов

ContentReader Server



Корпоративное серверное решение для распознавания, хранения и преобразования файлов в PDF и другие электронные редактируемые форматы. Решение быстро и точно распознает текстовые изображения и переводит их в PDF, PDF/A, Microsoft Word или другие типы файлов, удобные для поиска, просмотра, обмена и хранения.

  • Оптимизация документооборота

    Хранение и передача оцифрованных документов в различные специализированные системы, а также возможность обмена данными внутри группы.

  • Быстрый старт проекта

    Простота в установке и обслуживании позволит компаниям реализовать проект за короткое время и сократить затраты на внедрение решения.
  • Единообразие форматов

    Обеспечивает хранение документов в едином формате.
  • Простота использования

    Интуитивно понятный интерфейс, не требующий от сотрудников специальной технической подготовки.
  • Оптимизация работы сотрудников

    Обработка файлов происходит в фоновом режиме, может идти круглосуточно или в заданное пользователем время, чтобы уменьшить нагрузку на оборудование.
  • Быстрый поиск документов

    Файлы хранятся в структурированном цифровом архиве с возможностью легкого и удобного поиска по ключевым словам.

Сценарии использования

Электронный архив


Соблюдение государственных и корпоративных стандартов путем преобразования больших объемов документов в легкодоступные цифровые архивы. Подробнее


Централизованный сервис конвертации документов для сотрудников


ContentReader Server работает для всех сотрудников организации, не требуя от них специальной подготовки.


Библиотеки с возможностью поиска на базе MS SharePoint


ContentReader Server легко интегрируется с SharePoint, и автоматически конвертирует вновь добавленные в библиотеки файлы, при необходимости оставляя оригиналы.


Создание цифровых библиотек и сохранение культурного наследия


Преобразование исторических документов в доступные для поиска файлы PDF, XML или EPUB. Сохранение культурного наследия путем оцифровки рукописей, напечатанных историческими шрифтами, и их добавления в цифровые библиотеки для будущих поколений.


Ввод входящих документов в режиме «Канцелярия»


ContentReader Server упростит процесс ежедневной регистрации входящих документов в канцелярии. Удобный интерфейс станций сканирования и индексирования позволяет сканировать документы и регистрировать их в системе, просто выделяя необходимые атрибуты документа (номер входящего документа, дата и т. д.) при помощи курсора.




Возможности
Ключевые возможности ContentReader Server
  • Распознавание символов

    Обеспечение быстрых и точных результатов на более чем 190 языках.

  • Поддержка 64-битной архитектуры

    Быстрая конвертация больших объемов документов за короткий промежуток времени.
  • Серверная архитектура

    Наиболее эффективное распределение нагрузки на оборудование.
  • Поддержка большого количества форматов

    Конвертация в PDF, JPEG, TIFF, Word, Excel, OpenDocument Text, PowerPoint, HTML и другие форматы.
  • Интеграция с SharePoint

    Конвертация документов из библиотек SharePoint в файлы PDF с возможностью поиска.

  • Гибкая технология при работе с PDF

    Технология MRC-сжатия уменьшает размер PDF-файлов, при этом сохраняет оптимальное качество документа.

  • Распознавание штрих-кодов

    Распознавание штрих-кодов 1D и 2D для разделения документов и/или добавления метаданных.

  • Определение формата данных

    Автоматическое определение типов документов и атрибутов. При необходимости метаданные возможно задать вручную.

  • Распознавание исторических шрифтов

    Распознавание старопечатных символов и готических шрифтов на английском, немецком, французском, итальянском и испанском языках.
  • Интеграция в существующие системы

    Легкая интеграция с цифровыми архивами и системами ECM через XML-описания, COM-совместимый API и API на базе веб-сервиса.

  • Разделение документов

    Деление потока изображений на документы по количеству страниц, наличию пустых страниц, страниц со штрихкодами и/или с помощью скрипта с заданными правилами.

  • Интеллектуальная обработка PDF

    Решение позволяет работать с PDF: улучшать текст низкого качества, сохранять закладки из оригиналов документов, обрабатывать файлы с цифровой подписью и другое.
Как это работает

ContentReader Server получает изображения из сетевых папок, со сканеров, почтовых ящиков и Microsoft® SharePoint® и, используя технологии распознавания, автоматически конвертирует их в цифровые форматы с возможностью поиска. Также возможна интеграция с любым источником через API.

При необходимости пользователь может вручную скорректировать текстовую информацию в документе и/или добавить метаданные. Результаты обработки можно сохранить в любые хранилища данных и/или отправить в другие приложения.



1

Получение документов

ContentReader Server получает изображения документов

со сканеров, из сетевых папок, писем электронной почты и библиотек Microsoft SharePoint.


Сканирование документов

Одной из компонент ContentReader Server является Станция сканирования, которая предназначена для потокового сканирования документов. Например, пользователи могут использовать скрипт для разделения страниц на документы и/или изменения порядка страниц после двустороннего сканирования.

Инструменты программы позволяют предварительно

просмотреть и улучшить изображение (исправить искажения, повернуть документ), вручную отредактировать, например, удалить конфиденциальные документы и др.


Импорт документов

ContentReader Server может автоматически получать

отсканированные изображения из библиотек и файлов,

отправленных вложением к электронному письму.

Импортировать документы можно:

• с сетевых сканеров (через интерфейсы TWAIN, WIA, ISIS) и МФУ,

• из горячих папок (FTP или локальная сеть),

• из папок со сложной структурой (с вложенными подпапками),

• из сетевых папок и библиотек SharePoint,

• из почтовых программ (Microsoft Exchange, POP3, IMAP),

• с помощью API,

• с факса и др

2

Распознавание

Распознавание происходит автоматически на Станции обработки. Решение также предоставляет инструменты для повышения точности результатов распознавания, такие как:

• Предобработка изображений (например, разделение сдвоенных страниц для отсканированных книг или удаление шумов);

• Поддержка распознавания разных типов текста: нормальный текст, машинописный, матричный, MICR (E13B), OCR-A, OCR-B, готические шрифты;

• Определение языка (автоматическое распознавание более 190 языков и исторических текстов).

3
Верификация (опционально)

Для некоторых задач, например, для оцифровки книг, необходима верификация данных. В ContentReader Server встроена Станция верификации, которая позволяет корректировать результаты распознавания как для всех документов, так и для отдельных документов, которые не прошли порог качества на основе допустимого количества неуверенно распознанных символов на страницу.

4
Индексирование (опционально)

Пользователь может вручную задать атрибуты для документов в интерфейсе Станции индексирования, либо настроить скрипт для автоматической индексации. Список атрибутов можно импортировать и синхронизировать со сторонними системами.

5

Сборка и экспорт

документов

Формирование комплекта документов

Обработанные страницы собираются в документы. Комплекты страниц могут быть собраны 3

способами:

• По пустым листам или разделительному штрих-коду;

• По фиксированному количеству страниц;

• По более сложным правилам, определенным через скрипт.


Экспорт документов

ContentReader Server поддерживает экспорт файлов

сразу в нескольких выходных форматах. Упорядоченные

документы можно отправить по целевому назначению – в сетевые папки, библиотеки SharePoint, на адреса почтовых ящиков или в другие приложения через API.

Спецификация

ContentReader Server

Форматы и языки
Закажите эффективное решение
Заполните форму и получите консультацию, как наиболее эффективно использовать наши решения.

С апреля 2022 года техническую поддержу продуктов ABBYY на территории России оказывает компания Content AI (ООО «Контент ИИ»).