ContentReader Engine 12 поддерживает самое большое количество языков распознавания на рынке. С его помощью можно распознавать языки, в письменности которых используются латиница, кириллица, греческие и армянские символы, а также арабский, бирманский (техническое превью), персидский (фарси), иврит, китайский, японский, корейский, русский языки и много других. Также доступна встроенная утилита для создания пользовательских словарей и шаблонов, что позволяет улучшить распознавания необычных слов или нетипичных шрифтов.
Кроме того, SDK подерживает обработку документов XVII-XIX столетий на английском, испанском, итальянском, немецком и французском языках, текстов на искусственных языках (эсперанто, интерлингва, идо и окциденталь), а также позволяет распознавать языки программирования (Basic, C/C++, COBOL, Fortran, JAVA и Pascal), простые химические формулы и цифры. В общей сложности, в ContentReader Engine поддержано 210 OCR, для Windows и Linux 126 ICR языков (●) и 55 со словарной поддержкой (○) (* Арабский ICR не поддерживается. Но распознаются арабские цифры, отпечатанные вручную):
Абхазский
Аварский
Агульский
Адыгейский
Азербайджанский (кириллица)
Азербайджанский (латиница)●
Аймара●
Албанский●
Алтайский
Английский●○
Арабский (Саудовская Аравия)*●○
Армянский (восточный)○
Армянский (грабарь)○
Армянский (западный)○
Африкаанс●
Базовый язык программирования
Баскский●
Башкирский○
Белорусский
Бемба●
Бирманский (технический превью)
Блэкфут●
Показать ещё