Используйте интеллектуальные технологии для работы с данными прямо в ваших приложениях

FlexiCapture SDK. Технологии потокового ввода данных в ваших решениях
Описание
Возможности
Спецификация

FlexiCapture SDK

Инструментарий разработчика, который позволяет встраивать технологии интеллектуальной обработки информации в Windows-приложения.

С помощью SDK компании могут быстрее проводить транзакции, сократить количество ошибок в обработанных данных, улучшить клиентское обслуживание, уменьшить расходы и ускорить процесс принятия решений.

Преимущества FlexiCapture SDK

Высокая точность извлеченных данных

Извлекайте данные из документов с высокой точностью, используя передовые технологии распознавания, интеллектуальную классификацию и машинное обучение.

Расширение возможностей вашего приложения

Бесшовно интегрируйте технологии потокового ввода в приложения и контролируйте обработку документов и извлечение данных.

Комплексная обработка документов

Применяйте широкий набор инструментов для обработки форм и документов (структурированных и неструктурированных), включая интеллектуальную классификацию документов, механизмы автообучения извлечения полей и экспорта нужной информации для дальнейшей обработки.

Поддерживаемые среды разработки

Используйте FlexiCapture SDK API, который соответствует COM-стандарту и может легко использоваться из C/C++, Visual Basic, Java, а также из любых других сред разработки с поддержкой компонент COM.

Сценарии использования

Извлечение данных из любых внутренних форм

Настройте автоматическое извлечение данных из любых типов документов, включая неструктурированные, в вашу АБС, ERP, CRM или другую платформу.


Автоматизируйте работу с бухгалтерской документацией

Решение позволяет упростить работу с самыми востребованными финансовыми документами: счет, счет-фактура, акт, ТОРГ12 и другие.


Расширение возможностей RPA

Научите ваших роботов определять типы документов и извлекать из них данные.
Возможности
Высокое качество распознавания

В SDK используются технологии распознавания нового поколения. Благодаря им вы сможете быстрее и качественнее обрабатывать тексты на 210 языках, в том числе на арабском, китайском, японском и корейском.

Высокая точность извлеченных данных

SDK позволяет извлекать необходимые вам данные из документов. Благодаря автообучению, решение позволяет точнее определять расположение полей и повторяющихся групп полей на структурированных или слабоструктурированных документах и в результате повышать точность извлечения данных.

Обработка любых документов

SDK позволяет извлекать данные как из структурированных документов (анкеты, экзаменационные листы, страховые формы), так и из слабоструктурированных (счета, транспортные накладные) и неструктурированных (договоры, акты). SDK помогает быстро определить поля с важной информацией, извлечь ее и сохранить в нужном формате.



Настройка с использованием API

SDK позволяет создавать проекты с использованием графического интерфейса и через API. Это необходимо разработчикам ECM-систем, чтобы изменить набор извлекаемых атрибутов и сделать их доступными для каждого документа. А BPO-компании смогут автоматически настроить извлечение специфических полей без настройки для каждого отдельного проекта.

Верификация

FlexiCapture SDK предоставляет интерфейсы API для верификации данных и дает возможность сравнить результаты распознавания с изображением любой части документа. Результаты верификации можно использовать для обучения технологии, чтобы повысить точность извлечения информации и классификации документов.

Пакет разработчика

Чтобы быстрее настроить обработку документов, вместе с дистрибутивом разработчик получает Пакет разработчика. В него входят станция настройки проектов FlexiCapture и FlexiLayout Studio. Пакет разработчика может быть использован для настройки проектов FlexiCapture, которые потом будут использованы в SDK.

Извлечение данных из любых типов документов

FlexiCapture SDK помогает извлекать данные как из структурированных документов (анкеты, экзаменационные листы, страховые формы, налоговые декларации), так и из слабоструктурированных (счета-фактуры, транспортные накладные) и неструктурированных (договоры, акты). SDK позволяет быстро определить поля с важной информацией, извлечь ее и сохранить в нужном формате.

Обработка цифровых документов

FlexiCapture SDK обрабатывает офисные документы во всех популярных форматах. Документы можно обработать в едином потоке, без необходимости разделять изображения и текстовые форматы. SDK поддерживает обработку текстовых документов в форматах DOC, DOCX, RTF, HTML, TXT и ODT; XLS, XLSX и ODS (таблицы); PPT, PPTX и ODP (презентации).

Гибкие параметры экспорта

SDK позволяет сократить объем памяти для хранения документов. Благодаря новым параметрам экспорта можно управлять размером и качеством файлов для эффективного хранения данных.

Вы можете сохранять все нужные данные и конвертировать документы в PDF с возможностью поиска или PDF/A. Продукт экспортирует данные в структурированные форматы (например, XML или CSV) или в хранилища данных.

Поддерживаемые среды разработки

FlexiCapture SDK поддерживает все современные среды разработки, в том числе работу на виртуальных машинах, в контейнерах (включая docker-контейнеры) и публичных облачных сервисах. Это позволяет создавать легко масштабируемые решения, например, облачные веб-сервисы, оснащенные оркестраторами контейнеров.

Спецификация

Системные требования

Требования к FlexiCapture 12 SDK
Компьютер

ПК с архитектурой процессора х86 с тактовой частотой не менее 1 ГГц.


Операцион­ная система
  • Windows Server 2016, 2012, 2008 R2
  • Windows 10, 8.1, 8, 7
Протестиро­ванные платформы облачных вычислений и виртуальные среды

Платформы облачных вычислений:

  • Azure Service Fabric
  • Azure Virtual Machines
  • Amazon EC2

Виртуальные среды:

  • Microsoft Hyper-V Server 2008, 2008 R2 SP1, 2012, 2012 R2, 2016
  • Oracle VM VirtualBox 5.2
  • Parallels Desktop for Mac 13.0.1
  • VMware: ESXi 6.5, Workstation Player 12.5, Workstation Pro 14.0.0

FlexiCapture SDK также может использоваться в Docker-контейнерах на поддерживаемых платформах.

Java Development Kit:

  • Oracle Java SE Development Kit 12.0.1, 11.0.3, 8u212, 8u211
Память
  • для обработки одностраничных документов: минимум 400 МБ ОЗУ, рекомендуется 1 ГБ;
  • для обработки многостраничных документов: минимум 1 ГБ ОЗУ, рекомендуется 1,5 ГБ.
Место на жестком диске

1400 МБ для установки библиотек (дополнительно 2 ГБ для модуля OfficeConverters) и 100 МБ для работы программы, а также дополнительно 15 МБ для каждой обрабатываемой страницы многостраничного документа.


Другие требования

Полностью TWAIN-совместимый сканер, цифровая фотокамера или факс-модем – только для функции сканирования. Клавиатура, мышь или иное устройство ввода. Пользователь должен иметь доступ к следующим разделам системного реестра:

  • "HKEY_CURRENT_USER\Software\ABBYY\SDK\12\FlexiCapture SDK" – полный контроль
  • "HKEY_CURRENT_USER\Software\ABBYY\SDK\12" – полный контроль на установку
  • "HKEY_LOCAL_MACHINE\Software\ABBYY\SDK\12" - полный контроль на установку
  • Пользователь должен иметь доступ к следующим папкам:
  • Папка с бинарными файлами ABBYY FlexiCapture SDK — права на чтение
  • Папка %TEMP% — полный контроль доступа
  • %ProgramData%\ABBYY\SDK\12\FlexiCapture Engine — полный контроль доступа
  • Папка %ProgramData%\ABBYY\FCSDK\12\FlexiCapture SDK — полный контроль доступа
  • Папка %ProgramData%\ABBYY\FCSDK\12\Licenses — полный контроль доступа
  • Обязательна установка следующих компонентов:
  • Интернет-браузер Microsoft Internet Explorer 8.0 или более поздняя версия
  • NET Framework 4.5
License Server
Компьютер

ПК с архитектурой процессора х86 с тактовой частотой не менее 1 ГГц.

Операцион­ная система
  • Windows Server 2016, 2012, 2008 R2
  • Windows 10, 8.1, 8, 7
Протестиро­ванные виртуальные среды

Виртуальные среды:

  • Microsoft Hyper-V Server 2008, 2008 R2 SP1, 2012, 2012 R2, 2016
  • Oracle VM VirtualBox 5.2
  • Parallels Desktop for Mac 13.0.1
  • VMware: ESXi 6.5, Workstation Player 12.5, Workstation Pro 14.0.0

FlexiCapture SDK также может использоваться в Docker-контейнерах на поддерживаемых платформах.


Место на жестком диске

Свободное пространство на жёстком диске: 25 МБ


Другие требования
  • Папка %ProgramData%\ABBYY\FCSDK\12\Licenses — полный контроль доступа
  • Для активации/деактивации Лицензии:
  • домен: *.abbyy.com
  • порт: 80 (кроме онлайн лицензий), 443
  • протокол: http
  • При использовании прокси-сервера, VPN- или модемного соединения необходимо установить следующие настройки браузера Internet Explorer: Инструменты > Настройки браузера > Соединения
Совместимость, форматы и языки
Совместимость

FlexiCapture 12 SDK работает с проектами, созданными в FlexiCapture 12, Build 12.0.3.2462, или более ранними. Проекты, сохраненные в текущем релизе FlexiCapture 12 SDK, могут быть использованы в FlexiCapture 12, Build 12.0.3.2462, или более поздними.

Поддерживаемые среды разработки

FlexiCapture SDK предоставляет API, который соответствует COM-стандарту и может легко использоваться из C/C++, Visual Basic, .NET, а также из любых других сред разработки с поддержкой компонент COM. FlexiCapture можно адаптировать для использования со скриптовыми языками, например, VBS, JS или Perl.

Языки распознавания
FlexiCapture 12 SDK распознает документы на 209 языках, включая 56 языков (отмечены ×) со словарной поддержкой, и предоставляет технологию распознавания рукопечатных символов для 127 языков (отмечены ×).


Кроме того, SDK подерживает обработку документов XVII-XIX столетий на английском, испанском, итальянском, немецком и французском языках, текстов на искусственных языках (эсперанто, интерлингва, идо и окциденталь), а также позволяет распознавать языки программирования (Basic, C/C++, COBOL, Fortran, JAVA и Pascal), простые химические формулы и цифры. В общей сложности, в FineReader Engine поддержано 210 OCR, включая 56 языков со словарной поддержкой (●) и 126 ICR языков (○)

Абхазский
Аварский
Агульский
Адыгейский
Азербайджанский (кириллица)
Азербайджанский (латиница)○
Аймара○
Албанский○
Алтайский
Английский●○
Арабский (Саудовская Аравия)*●○
Армянский (восточный)●
Армянский (грабарь)●
Армянский (западный)●
Африкаанс○
Базовый язык программирования
Баскский○
Башкирский●
Белорусский
Бемба○
Бирманский (технический превью)
Блэкфут○
Болгарский●○
Бретонский○
Буготу○
Бурятский○
Валлийский
Венгерский●○
Волоф○
Вьетнамский●
Гавайский○
Гагаузский
Галисийский○
Ганда○
Голландский (Бельгия)●○
Голландский (Нидерланды)●○
Греческий●○
Грузинский
Гуарани○
Дакота (сиу)○
Даргинский
Датский●○
Дунганский
Зулу
Иврит●
Идиш
Идо○
Ингушский
Индонезийский●○
Интерлингва○
Ирландский○
Исландский
Испанский●○
Итальянский●○
Кабардинский
Казахский○
Калмыцкий
Каракалпакский
Карачаево-балкарский○
Каталонский●
Кашубский○
Кечуа○
Кикуйю
Киргизский○
Китайский традиционный
Китайский упрощенный
Конго○
Корейский (хангыль)●
Корейский●
Корсиканский○
Корякский Коса○
Кпелле○
Кроу○
Крымскотатарский○
Кумыкский○
Курдский○
Лакский
Латинский●○
Латышский●○
Латышский отический
Лезгинский
Литовский●○
Луба○
Лужицкий
Майя○
Македонский
Малагасийский○
Малайский (малазийский)
Малинке○
Мальтийский
Мансийский
Маори○
Марийский
Минангкабау○
Могавк○
Монгольский○
Мордовский○
Мяо○
Науатль○ Немецкий (Люксембург)○
Немецкий (новая орфография)●○
Немецкий●○
Ненецкий○
Нивхский○
Ногайский○
Норвежский (букмол)●○
Норвежский (нюнорск)●○
Норвежский●○
Ньянджа○
Оджибве○
Окциденталь
Осетинский
Папьяменто○
Польский●○
Португальский (Бразилия)●○
Португальский (Португалия)●○
Провансальский
Простые математические формулы
Простые химические формулы
Ретороманский○
Руанда○
Румынский (Молдавия)○
Румынский●○
Рунди○
Русский (старая орфография)●
Русский●○
Русский (с ударениями)●
Саамский○
Самоа○
Сапотекский○
Свази○
Себуанский○
Селькупский○
Сербский (кириллица)○
Сербский (латинский)○
Сесото○
Словацкий●○
Словенский●○
Сомалийский○
Староанглийский●○
Староиспанский●○
Староитальянский●○
Старонемецкий●○
Старославянский
Старофранцузский●○
Суахили○
Сунданский
Табасаранский
Тагальский○
Таджикский○
Таитянский○
Тайский●
Татарский●
Текст типа ocr-a
Текст типа ocr-b
Ток писин○
Тонга○
Тсвана○
Тувинский○
Тунисский○
Турецкий●○
Туркменский
Туркменский (латинский)○
Удмуртский
Узбекский (кириллица)
Узбекский (латинский)○
Уйгурский (кириллица)
Уйгурский (латинский)○
Украинский●○
Фарерский Фарси●
Фиджийский○
Финский●○
Французский●○
Фризский○
Фриульский○
Хакасский
Хани○
Хантыйский
Хауса
Хорватский●○
Цзинпо
Цыганский○
Чаморро○
Чеченский
Чешский●○
Числовые символы○
Чувашский
Чукотский
Шведский●○
Шона
Шотландский гэльский○
Шрифт micr (cmc-7)
Шрифт micr (e-13b)
Эвенкийский○
Эвенский○
Эскимосский (кириллица)
Эскимосский (латинский)
Эсперанто
Эстонский●○
Язык программирования c / c ++
Язык программирования Cobol
Язык программирования Fortran
Язык программирования Java
Язык программирования Kawa○
Язык программирования Pascal
Якутский
Японский (современный)●
Японский●

* Арабский ICR не поддерживается. Но распознаются арабские цифры, отпечатанные вручную.
Поддерживаемые типы штрих-кодов

FlexiCapture SDK позволяет распознавать следующие типы штрих-кодов:

Australia Post

Aztec

Codabar

Codabar (с контрольной суммой)

Code 128

Code 32

Code 39

Code 93

DataMatrix

EAN 13

EAN 8

IATA 2 of 5

Industrial 2 of 5

Intelligent Mail

Interleaved 2 of 5

Interleaved 2 of 5 (с контрольной суммой)

Matrix 2 of 5

Patch

PDF417

Postnet

QR Code

UCC-128

UPC-Az

UPC-E
Поддерживаемые форматы изображений

ПОДДЕРЖИВАЕТ ИМПОРТ:


PDF: файлы PDF формата (версия 1.7 или более ранние), включая архивный формат PDF/A


BMP

  • несжатые чёрно-белый,
  • серый,
  • цветной

JPEG

  • серый, цветной

DCX, PCX:

  • 4- и 8-битные — серые полноцветные
  • 2-битные — черно-белые

PNG:

  • черно-белые,
  • серые,
  • цветные

JPEG 2000:

серый, 8-битный

цветной, RGB или YCC, 8-битный

цветной, кодировка 8-битный RGB

JPEG:

серый, цветной

TIFF:

ч/б – несжатый, CCITT4, Packbits, ZIP, LZW;

серый – несжатый, Packbits, JPEG, ZIP, LZW;

полноцветный – несжатый, JPEG, ZIP, LZW;

Палитра – несжатый, Packbits, ZIP раздвоенные изображения TIFF


DjVu (только для Windows)

  • чёрно-белый, серый, цветной

GIF

  • ч/б – LZW-сжатие
  • серый – LZW-сжатие
  • цветной – LZW-сжатие

JBIG2

WDP



ПОДДЕРЖИВАЕТ ЭКСПОРТ


PDF: файлы PDF формата (версия 1.7 или более ранние), включая архивный формат PDF/A

JPEG

  • серый, цветной

DCX, PCX:

  • 4- и 8-битные — серые полноцветные
  • 2-битные — черно-белые

PNG:

  • черно-белые,
  • серые,
  • цветные

JPEG 2000:

серый, 8-битный

цветной, RGB или YCC, 8-битный

цветной, кодировка 8-битный RGB

JPEG:

серый, цветной

TIFF:

ч/б – несжатый, CCITT4, Packbits, ZIP, LZW;

серый – несжатый, Packbits, JPEG, ZIP, LZW;

полноцветный – несжатый, JPEG, ZIP, LZW;

Палитра – несжатый, Packbits, ZIP раздвоенные изображения TIFF

Поддерживаемые форматы цифровых документов

FlexiCapture 12 SDK поддерживает следующие форматы цифровых документов:

  • текстовые документы: DOC, DOCX, RTF, HTML, TXT, ODT
  • таблицы: XLS, XLSX, ODS
  • презентации: PPT, PPTX, ODP

Форматы сохранения документов

FlexiCapture SDK позволяет экспортировать распознанные данные в следующих форматах:

  • Microsoft Office Excel Workbook (*.XLS)
  • DBase file (*.DBF)
  • Comma Separated Values File (*.CSV)
  • Simple text (*.TXT)
  • XML Document (*.XML)
Закажите эффективное решение
Заполните форму и получите консультацию, как наиболее эффективно использовать наши решения для задач вашего бизнеса.

С апреля 2022 года работу со всеми клиентами и партнерами ABBYY Россия продолжит компания Content AI (ООО «Контент ИИ»).