Доступные, упорядоченные
и удобные для поиска файлы

ContentReader® Server. Серверное решение

для распознавания и конвертации документов

ContentReader® Server

Корпоративное серверное решение для распознавания и преобразования файлов в PDF и другие электронные редактируемые форматы. Решение быстро и точно распознает изображения и переводит их в PDF, PDF/A, Microsoft Word или другие типы файлов, удобные для поиска, просмотра, обмена и хранения.

  • Оптимизация документооборота

    Хранение и передача оцифрованных документов в различные специализированные системы, а также возможность обмена данными внутри группы.

  • Быстрый старт проекта

    Простота в установке и обслуживании позволит компаниям реализовать проект за короткое время и сократить затраты на внедрение решения.
  • Единообразие форматов

    Обеспечивает хранение документов в едином формате.
  • Простота использования

    Интуитивно понятный интерфейс, не требующий от сотрудников специальной технической подготовки.
  • Оптимизация работы сотрудников

    Обработка файлов происходит в фоновом режиме, может идти круглосуточно или в заданное пользователем время, чтобы уменьшить нагрузку на оборудование.
  • Быстрый поиск документов

    Файлы хранятся в структурированном цифровом архиве с возможностью легкого и удобного поиска по ключевым словам.

Сценарии использования

  • Электронный архив
    Соблюдение государственных и корпоративных стандартов путем преобразования больших объемов документов в легкодоступные цифровые архивы. Подробнее
  • Централизованный сервис конвертации документов для сотрудников
    ContentReader® Server работает для всех сотрудников организации, не требуя от них специальной подготовки.
  • Создание цифровых библиотек и сохранение культурного наследия
    Преобразование исторических документов в доступные для поиска файлы PDF, XML или EPUB. Сохранение культурного наследия путем оцифровки рукописей, напечатанных историческими шрифтами, и их добавления в цифровые библиотеки для будущих поколений.
  • Библиотеки с возможностью поиска на базе MS SharePoint
    ContentReader® Server легко интегрируется с SharePoint, и автоматически конвертирует вновь добавленные в библиотеки файлы, при необходимости оставляя оригиналы.
  • Ввод входящих документов в режиме «Канцелярия»
    ContentReader® Server упростит процесс ежедневной регистрации входящих документов в канцелярии. Удобный интерфейс станций сканирования и индексирования позволяет сканировать документы и регистрировать их в системе, просто выделяя необходимые атрибуты документа (номер входящего документа, дата и т. д.) при помощи курсора.
Возможности
Ключевые возможности ContentReader® Server

Распознавание символов

Обеспечение быстрых и точных результатов на более чем 190 языках.

Поддержка 64-битной архитектуры

Быстрая конвертация больших объемов документов за короткий промежуток времени.

Серверная архитектура

Наиболее эффективное распределение нагрузки на оборудование.

Поддержка большого количества форматов

Конвертация в PDF, JPEG, TIFF, Word, Excel, OpenDocument Text, PowerPoint, HTML и другие форматы.

Интеграция с SharePoint

Конвертация документов из библиотек SharePoint в файлы PDF с возможностью поиска.

Гибкая технология при работе с PDF

Технология MRC-сжатия уменьшает размер PDF-файлов, при этом сохраняет оптимальное качество документа.

Распознавание штрихкодов

Распознавание штрихкодов 1D и 2D для разделения документов и/или добавления метаданных.

Определение формата данных

Автоматическое определение типов документов и атрибутов. При необходимости метаданные возможно задать вручную.

Распознавание исторических шрифтов

Распознавание старопечатных символов и готических шрифтов на английском, немецком, французском, итальянском и испанском языках.

Интеграция в существующие системы

Легкая интеграция с цифровыми архивами и системами ECM через XML-описания, COM-совместимый API и API на базе веб-сервиса.

Разделение документов

Деление потока изображений на документы по количеству страниц, наличию пустых страниц, страниц со штрихкодами и/или с помощью скрипта с заданными правилами.

Интеллектуальная обработка PDF

Решение позволяет работать с PDF: улучшать текст низкого качества, сохранять закладки из оригиналов документов, обрабатывать файлы с цифровой подписью и другое.

Как это работает

ContentReader® Server получает изображения из сетевых папок, со сканеров, почтовых ящиков и Microsoft® SharePoint® и, используя технологии распознавания, автоматически конвертирует их в цифровые форматы с возможностью поиска. Также возможна интеграция с любым источником через API.
При необходимости пользователь может вручную скорректировать текстовую информацию в документе и/или добавить метаданные. Результаты обработки можно сохранить в любые хранилища данных и/или отправить в другие приложения.
1

Получение документов

ContentReader® Server получает изображения документов

со сканеров, из сетевых папок, писем электронной почты и библиотек Microsoft SharePoint.


Сканирование документов

Одной из компонент ContentReader® Server является Станция сканирования, которая предназначена для потокового сканирования документов. Например, пользователи могут использовать скрипт для разделения страниц на документы и/или изменения порядка страниц после двустороннего сканирования.

Инструменты программы позволяют предварительно

просмотреть и улучшить изображение (исправить искажения, повернуть документ), вручную отредактировать, например, удалить конфиденциальные документы и др.


Импорт документов

ContentReader® Server может автоматически получать

отсканированные изображения из библиотек и файлов,

отправленных вложением к электронному письму.

Импортировать документы можно:

• с сетевых сканеров (через интерфейсы TWAIN, WIA, ISIS) и МФУ,

• из горячих папок (FTP или локальная сеть),

• из папок со сложной структурой (с вложенными подпапками),

• из сетевых папок и библиотек SharePoint,

• из почтовых программ (Microsoft Exchange, POP3, IMAP),

• с помощью API,

• с факса и др

2

Распознавание

Распознавание происходит автоматически на Станции обработки. Решение также предоставляет инструменты для повышения точности результатов распознавания, такие как:

• Предобработка изображений (например, разделение сдвоенных страниц для отсканированных книг или удаление шумов);

• Поддержка распознавания разных типов текста: нормальный текст, машинописный, матричный, MICR (E13B), OCR-A, OCR-B, готические шрифты;

• Определение языка (автоматическое распознавание более 190 языков и исторических текстов).

3
Верификация (опционально)

Для некоторых задач, например, для оцифровки книг, необходима верификация данных. В ContentReader® Server встроена Станция верификации, которая позволяет корректировать результаты распознавания как для всех документов, так и для отдельных документов, которые не прошли порог качества на основе допустимого количества неуверенно распознанных символов на страницу.

4
Индексирование (опционально)

Пользователь может вручную задать атрибуты для документов в интерфейсе Станции индексирования, либо настроить скрипт для автоматической индексации. Список атрибутов можно импортировать и синхронизировать со сторонними системами.

5

Сборка и экспорт

документов

Формирование комплекта документов

Обработанные страницы собираются в документы. Комплекты страниц могут быть собраны 3 способами:

• По пустым листам или разделительному штрихкоду;

• По фиксированному количеству страниц;

• По более сложным правилам, определенным через скрипт.


Экспорт документов

ContentReader® Server поддерживает экспорт файлов

сразу в нескольких выходных форматах. Упорядоченные

документы можно отправить по целевому назначению — в сетевые папки, библиотеки SharePoint, на адреса почтовых ящиков или в другие приложения через API.


Заказчики

unipro_energy-logo
unipro_energy-logo
unipro_energy-logo
unipro_energy-logo
open-logo

Спецификация

ContentReader® Server

Форматы и языки

Закажите эффективное решение

Заполните форму и получите консультацию, как наиболее эффективно использовать наши решения.