Блог компании Content AI

Как минимизировать риски ошибок и обрабатывать документы ночью: две суперфункции ContentReader PDF Corporate

ContentReader PDF — многофункциональный интеллектуальный редактор. Он облегчает оцифровку, конвертирование, редактирование, обмен документами и оптимизирует совместную работу над различными типами файлов.

У ContentReader PDF есть две версии: Business и Corporate. У них одинаковый базовый набор инструментов, однако только версия Corporate включает две полезные фичи, способные существенно упростить жизнь специалистам, которые работают с большим количеством документов.

Ниже разберемся с функциональностью каждой из них и расскажем, кому и как они помогают оптимизировать работу с документами.

Сценарии использования ContentReader PDF Corporate

Сравнение документов

ContentReader PDF Corporate позволяет в несколько кликов найти отличия между двумя версиями документов. Чаще всего опцией сравнения пользуются юристы, кредитные менеджеры, специалисты по документообороту и др.

Один из наиболее распространенных сценариев применения функции сравнения ContentReader PDF Corporate, когда компания получила на подпись бумажный контракт, и нужно убедиться, что контрагент не изменил в договоре важные пункты. Это необходимо для снижения финансовых и юридических рисков.

Еще один популярный сценарий применения ContentReader PDF Corporate — сравнение технической документации, которую производители сложной техники или автомобилей присылают дилерам и дистрибьюторам. Производственные компании нередко забывают подготовить для партнеров перечень доработок выпускаемого продукта, и чтобы торговым представителям не вылавливать по тексту новые технические характеристики вручную, они используют ContentReader PDF Corporate.

Оркестрация задач по обработке документов

Благодаря утилите Hot Folder в ContentReader PDF Corporate можно настроить регулярную конвертацию и распознавание до 5 тыс страниц документов в месяц. Например, фича помогает автоматизировать обработку бланков анкет или заявлений: программа будет по определенному расписанию конвертировать сканы в Word, и сотрудники быстрее начнут обрабатывать персональные данные.

Если компания столкнулась с пугающим ростом входящей корреспонденции, и даже уже сисадмины намекают, что места на диске много не бывает, то Hot Folder поможет и с этой задачей. Вот один из реальных кейсов.

Входящая корреспонденция поступала в компанию в абсолютно разных форматах и разного объема. Когда количество документов стало увеличиваться в геометрической прогрессии, и размера дискового пространства оказалось недостаточно, закономерно встала задача по созданию электронного архива. Но простой перевод бумажных документов в цифру не решил проблему. Ведь еще важен и правильный выбор формата конвертации. Задача закрылась благодаря Hot Folder: фича помогла компании унифицировать форматы хранения данных — перевести все документы в PDF, которые занимают на диске значительно меньше места по сравнению с другими форматами.

Функция сравнения документов

Можно бесконечно полагаться на свою внимательность, но все же никто не застрахован от ситуации, когда денежные средства по ошибке ушли мошенникам. Поэтому функция сравнения — прикладная фича, которая поможет сразу раскусить аферистов.

Ниже наглядно расскажем, как ContentReader PDF Corporate минимизирует риски возникновения ошибок в договорах и защищает от мошенничества со стороны недобросовестных контрагентов.

Выбор языков

Как правило, многие бесплатные продукты, заточенные на сравнение документов, работают с текстами только на русском или английском языках. В то время как ContentReader PDF под силу распознать и сопоставить тексты на 35 языках.

Поддерживаемые форматы

Большинство из доступных российским пользователям бесплатных онлайн-сервисов для сравнения документов имеют ограниченный набор форматов. Как правило, они работают только с PDF и Word.

ContentReader PDF Corporate умеет сравнивать гораздо больше текстовых и графических форматов. Вот только малая часть:
  • текстовые документы: Word, RTF, ODT, HTML, TXT и пр.;
  • PDF;
  • презентации в PowerPoint;
  • таблицы или отчеты в Excel;
  • графические изображения: TIFF, GIF, JPEG, XPS, PNG и пр.

Безопасность данных

Когда пользуешься онлайн-сервисами, никогда не знаешь, где хранятся загруженные документы и кто ими может воспользоваться. ContentReader PDF, как и остальные продукты компании Content AI, работает исключительно в контуре предприятия, поэтому конфиденциальность данных гарантирована.

Варианты группировки исправлений

Все нестыковки, которые ContentReader PDF Corporate нашел в обеих версиях документа, отображаются и на боковой панели, и подсвечиваются отдельно в тексте. Кроме того, еще до запуска процесса сравнения можно отключить поиск опечаток или различий в пунктуации. Таким образом, появляется возможность сконцентрироваться только на важных несоответствиях в сопоставляемых документах, не отвлекаясь на несущественные правки.
Пример с результатами анализа текста договора в бесплатном сервисе, который не позволяет отключить поиск несущественных различий.
Пример с результатами сравнения в ContentReader PDF Corporate
ContentReader PDF Corporate группирует все найденные в тексте различия по степени значимости и подсвечивает три группы изменений: правки в основном тексте, колонтитулах и нумерации.

Внутри каждой группы правки маркируются тремя типами меток:
  • удаление;
  • добавление;
  • исправление.

По каждой правке пользователь принимает решение — принять или удалить. Например, можно оставить в одной из сравниваемых версий документа только спорные замечания, которые следует дополнительно обсудить с партнерами или коллегами.

Визуализация различий

В ContentReader PDF Corporate есть вертикальный и горизонтальный скроллинг окна с результатами сравнения. А чтобы было еще быстрее и проще просматривать различия между двумя версиями документа, разработчики предусмотрели в продукте режим синхронной прокрутки страниц.

Выгрузка результатов сравнения

ContentReader PDF Corporate предлагает несколько вариантов действий по итогам анализа правок. Во-первых, можно сформировать отдельный отчет в Word с наглядной визуализацией отличий. Во-вторых, сохранить только финальную версию текста в Word (в режиме «отслеживания изменений»). В-третьих, выгрузить в PDF нужную версию текста, выделив в нем комментарии со спорными изменениями.
Примеры выгрузки результатов сравнения документа
Подробную видеоинструкцию функции сравнения в ContentReader PDF Corporate можно посмотреть на сайте компании Content AI.

Умный оркестратор задач

Вторая изюминка ContentReader PDF Corporate — умный оркестратор Hot Folder. Он берет на себя выполнение рутинных задач по обработке документации — автоматизация обработки поступающей корреспонденции, формирование электронного архива и пр.

Когда компании необходимо распознавать поток документов объемом не более 5 тыс. страниц в месяц без нагрузки на сервер, то в ContentReader PDF Corporate можно автоматизировать эту задачу, выбрав оптимальное время для обработки: раннее утро или ночь. Таким образом можно не только освободить сотрудников от рутины, но и оптимизировать работу ИТ-систем.

Алгоритм настройки планировщика

Утилита обрабатывает изображения из локальных и сетевых папок или из электронной почты. Последний сценарий удобно использовать при сканировании, когда документы сразу отправляются адресату.

Чтобы настроить работу Hot Folder, достаточно выполнить несколько простых действий:
  • задать путь к исходным файлам;
  • выбрать режим проверки папки: однократно или по графику;
  • указать периодичность выполнения задачи. В частности, установить наиболее удобное время и выбрать частоту запуска обработки документов: раз в минуту, ежедневно, каждую неделю или раз в месяц;
  • определить пошаговый сценарий обработки. Например, указать параметры открытия и распознавания изображения и место, куда программа будет сохранять результаты работы.
Запуск новой задачи в папке Hot Folder
Hot Folder отображает в стартовом окне все созданные задачи. Для каждой из них система указывает полный путь к обрабатываемой папке, текущий статус и время следующего сеанса обработки.
Пример стартового окна папки Hot Folder

Параметры обработки изображений

Чтобы улучшить качество скана, утилита производит его предобработку. Например, удаляет искажения изображения, осветляет фон, регулирует яркость, разделяет разворот книги и пр.
Базовые настройки распознавания и предобработки изображений
Кроме распознавания и предобработки, у ContentReader PDF Corporate есть опция анализа изображений. Редактор изучает загруженную страницу и определяет, из каких элементов она состоит: текст, картинка, таблица и т. д. Далее в OCR-редакторе можно уточнить границы распознанных элементов. Например, если при первичной обработке система не точно определила, где начинается и заканчивается текст, то возможно расширить границы данной области и повторно распознать документ.

Если большинство документов, требующих обработки, имеют одинаковую структуру (формы, анкеты, заявки), то для оптимизации процесса распознавания разработчики ContentReader PDF Corporate придумали лайфхак: детально проанализируйте один из типовых документов и сохраните полученную разметку как шаблон областей. Полученный макет можно использовать для типовых документов, чтобы ускорить их обработку.

Подробную видеоинструкцию работы утилиты Hot Folder можно посмотреть на сайте Content AI.
Полезное Для бизнеса