FineReader Engine SDK
Многофункциональный инструментарий разработчика, который позволяет встраивать в приложения интеллектуальные технологии распознавания данных. С помощью OCR на основе технологий искусственного интеллекта вы можете создавать приложения с функциями качественного распознавания информации из документов, изображений, фотографий, скриншотов, мониторов и дисплеев, определения типа документа, конвертации сканированных документов в файлы форматов Word, Excel и PDF с возможностью поиска.
Быстрый вывод продуктов на рынок
Новые возможности ваших приложений
Добавляйте новые возможности при помощи FineReader Engine, например, конвертацию TIFF-файлов в PDF, PDF/A, Word и другие форматы и максимально точно распознавайте информацию из определенных областей документа. Инструменты подходят для разработки приложений на Windows, Linux или Mac OS для развертывания в облаке и на виртуальных машинах.
Сценарии применения
Организация электронного архива, СЭД, сервисы по обработке информации
Конвертируйте документы в сжатые PDF или PDF/А с возможностью поиска, чтобы пользователи могли быстро и удобно находить нужную информацию.
Предотвращение утечек данных
Расширьте возможности DLP за счет автоматического распознавания сканов документов, фотографий и изображений, чтобы выявлять возможные случаи нарушений политики информационной безопасности.
Машинное зрение и автоматическое тестирование
Расширьте возможности системы машинного зрения. Распознавайте тексты на фотографиях, экранах, дисплеях, сенсорных устройствах и в информационно-развлекательных системах. Автоматизируйте тестирование и контроль качества.
Поиск, электронное обнаружение информации eDiscovery и анализ данных
Конвертируйте документы в электронные файлы с возможностью поиска и находите нужную информацию с помощью инструментов анализа данных.
Технологии для людей с ограниченнымивозможностями
Помогите людям с нарушением зрения и детям с трудностями в обучении находить информацию в документах, листовках, учебниках или на экранах при помощи функции зачитывания текста с устройства.
* Некоторые возможности могут быть недоступны в зависимости от операционной системы.
Оптическое распознавание символов проходит в несколько этапов — от импортирования изображений до получения результатов распознавания.
Изображения можно загружать в OCR SDK из различных источников. Тексты в виде изображений в форматах TIFF, JPEG, и документы в формате PDF и т. д. можно импортировать, а сфотографированный текст или отсканированные документы могут быть обработаны прямо из памяти.
Предварительная обработка
На этапе предварительной обработки происходит улучшение изображения. Для повышения качества распознавания OCR SDK применяет ряд функций, среди которых поворот, бинаризация, выравнивание и многие другие.
В OCR SDK используются алгоритмы на основе искусственного интеллекта и технологии адаптивного распознавания документов ADRT®, что позволяет анализировать оформление каждой страницы и структуру документа в целом. В ходе этого процесса определяются блоки для распознавания текста, а информация об оформлении и форматировании отправляется на итоговую стадию воссоздания документа.
FlexiCapture автоматически извлекает данные из структурированных и неструктурированных документов.
FineReader Engine максимально точно распознает печатный (OCR) и рукопечатный текст (ICR), метки (OMR) и штрихкоды (OBR). Дополнительно повысить точность распознавания разных языков, нетипичных символов и шрифтов можно за счет создания словарей и шаблонов.
OCR SDK предлагает разные уровни воссоздания документа и различные способы экспорта результатов распознавания. Благодаря OCR SDK вы можете сохранять документы в следующих форматах: текстовый, XML, PDF и PDF/A, документы Microsoft® Office с возможностью редактирования и многих других.
FineReader Engine 12 доступен в трех версиях:
для Windows, для Linux и для Mac
Системные требования
ПК с x86-совместимым процессором (с тактовой частотой 1 ГГц и выше).
Решение FineReader Engine было протестировано на следующих наборах разработчика Java:
для 32-битных операционных систем:
для 64-битных операционных систем:
ABBYY FineReader Engine также может использоваться в Docker-контейнерах на поддерживаемых платформах.
ABBYY SDK 12 Licensing Service (системные требования)
ПК с x86-совместимым процессором (с тактовой частотой 1 ГГц и выше).
Поддерживаемые среды разработки
ABBYY FineReader Engine для Windows предоставляет API, который соответствует COM-стандарту и может легко использоваться из C/C++, Visual Basic, .NET, Delphi, Java, а также из любых других средах разработки с поддержкой компонент COM. Engine может быть адаптирован для использования со скриптовыми языками, например, VBS, JS, или Perl.
FineReader Engine требует наличия библиотеки glibc версии 2.11 и выше. Если необходим ABBYY FineReader Engine для более ранних версий glibc, свяжитесь с офисом Content AI.
Для использования динамической библиотеки FineReader Engine необходимы стандартные библиотеки libstdc++.so.6, libgcc_s.so.1 и libgomp.so.1
ПК с x86-совместимым процессором (с тактовой частотой 1 ГГц и выше) и с поддержкой SSE и SSE 2.
Операционная системаКомпания Content AI также предоставляет услугу профессиональной адаптации ПО для других платформ.
FineReader Engine также может использоваться в Docker-контейнерах на поддерживаемых платформах.
FineReader Engine Java wrapper был протестирован в следующих Java Development Kits:
2150 МБ для установки библиотек и 100 МБ для работы программы, а также дополнительно 15 МБ для каждой обрабатываемой страницы многостраничного документа.
Поддерживаемые среды разработки
ABBYY FineReader Engine для Linux предоставляет нативный C/C++ API и Java-обертку для него, поэтому приложения должны быть написаны на C/C++ или Java.
ПК с x86-совместимым процессором (с тактовой частотой 1 ГГц и выше).
Операционная система2500 МБ для установки библиотек и 100 МБ для работы программы, а также дополнительно 15 МБ для каждой обрабатываемой страницы многостраничного документа.
Для правильного детектирования содержащихся в документах шрифтов, они должны быть установлены на компьютере.
Поддерживаемые среды разработки
FineReader Engine для Mac предоставляет только нативный C/C++ API, поэтому приложения должны быть написаны на C/C++.
Заголовки и тексты диалогов, сообщения об ошибках и другие сообщения программы могут выводиться на английском, болгарском, чешском, китайском (КНР и Тайвань), датском, голландском, эстонском, французском, немецком, греческом, венгерском, итальянском, японском, корейском, польском, португальском (Бразилия), русском, словацком, испанском, шведском, турецком, и украинском.
ПОДДЕРЖИВАЕТ ОТКРЫТИЕ
ПОДДЕРЖИВАЕТ СОХРАНЕНИЕ
ABBYY FineReader Engine позволяет определить и извлечь данные на изображении паспортно-визовых документов из машиночитаемой зоны, выполненной в соответствии со стандартами ICAO 9303.
FineReader Engine обрабатывает информацию из машиночитаемой зоны нескольких типов:
FineReader Engine позволяет извлечь дополнительную информацию из паспортно-визовых документов:
С помощью ABBYY FineReader Engine можно извлечь контрольные суммы для каждого значения. Для повышения качества данных в документе в продукте используется логический тип данных, который проверяет соответствие финальной контрольной суммы индивидуальным значениям контрольных сумм.
ABBYY FineReader Engine распознает следующие типы штрихкодов:
ПОДДЕРЖИВАЕТ ОТКРЫТИЕ:
BMP
BMP
DCX
DjVu (только для Windows)
GIF
JBIG2
JPEG
JPEG 2000
PCX
Изображение PDF (скан PDF)
Созданный в цифровом виде PDF (Версия 1.7 или ранее)
PNG
TIFF
TIFF
WDP (только для Windows)
WIC-compatible (только для Windows)
ПОДДЕРЖИВАЕТ СОХРАНЕНИЕ
BMP
DCX
JBIG2
JPEG
JPEG 2000
PCX
Изображение PDF (скан PDF)
Созданный в цифровом виде PDF (Версия 1.7 или ранее)
PNG
TIFF
Распознавание меток (OMR)
В FineReader Engine поддержано распознавание одиночных меток и групп меток. При распознавании корректно обрабатываются как ошибочно выбранные метки, так и полностью закрашенные метки в самых различных вариациях: