ContentReader Engine 12 поддерживает самое большое количество языков распознавания на рынке. С его помощью можно распознавать языки, в письменности которых используются латиница, кириллица, греческие и армянские символы, а также арабский, бирманский (техническое превью), персидский (фарси), иврит, китайский, японский, корейский, русский языки и много других. Также доступна встроенная утилита для создания пользовательских словарей и шаблонов, что позволяет улучшить распознавания необычных слов или нетипичных шрифтов.
Кроме того, SDK подерживает обработку документов XVII-XIX столетий на английском, испанском, итальянском, немецком и французском языках, текстов на искусственных языках (эсперанто, интерлингва, идо и окциденталь), а также позволяет распознавать языки программирования (Basic, C/C++, COBOL, Fortran, JAVA и Pascal), простые химические формулы и цифры. В общей сложности, в ContentReader Engine поддержано 210 OCR (●), для Windows и Linux 126 ICR языков (○) и 28 с BCR поддержкой (▲)
Абхазский
Аварский
Агульский
Адыгейский
Азербайджанский (кириллица)
Азербайджанский (латиница)○
Аймара○
Албанский○
Алтайский
Английский●○▲
Арабский (Саудовская Аравия)*●○
Армянский (восточный)●
Армянский (грабарь)●
Армянский (западный)●
Африкаанс○
Базовый язык программирования
Баскский○
Башкирский●
Белорусский
Бемба○
Бирманский (технический превью)
Блэкфут○
Болгарский●○
Бретонский○
Буготу○
Бурятский○
Валлийский
Венгерский●○▲
Волоф○
Вьетнамский●
Гавайский○
Гагаузский
Галисийский○
Ганда○
Голландский (Бельгия)●○
Голландский (Нидерланды)●○▲
Греческий●○▲
Грузинский
Гуарани○
Дакота (сиу)○
Даргинский
Датский●○▲
Дунганский
Зулу
Иврит●
Идиш
Идо○
Ингушский
Индонезийский●○▲
Интерлингва○
Ирландский○
Исландский
Испанский●○▲
Итальянский●○▲
Кабардинский
Казахский○
Калмыцкий
Каракалпакский
Карачаево-балкарский○
Каталонский●
Кашубский○
Кечуа○
Кикуйю
Киргизский○
Китайский традиционный▲
Китайский упрощенный▲
Конго○
Корейский (хангыль)●
Корейский●▲
Корсиканский○
Корякский Коса○
Кпелле○
Кроу○
Крымскотатарский○
Кумыкский○
Курдский○
Лакский
Латинский●○
Латышский●○
Латышский отический
Лезгинский
Литовский●○
Луба○
Лужицкий
Майя○
Македонский
Малагасийский○
Малайский (малазийский)
Малинке○
Мальтийский
Мансийский
Маори○
Марийский
Минангкабау○
Могавк○
Монгольский○
Мордовский○
Мяо○
Науатль○ Немецкий (Люксембург)○
Немецкий (новая орфография)●○
Немецкий●○▲
Ненецкий○
Нивхский○
Ногайский○
Норвежский (букмол)●○▲
Норвежский (нюнорск)●○▲
Норвежский●○▲
Ньянджа○
Оджибве○
Окциденталь
Осетинский
Папьяменто○
Польский●○▲
Португальский (Бразилия)●○▲
Португальский (Португалия)●○▲
Провансальский
Простые математические формулы
Простые химические формулы
Ретороманский○
Руанда○
Румынский (Молдавия)○
Румынский●○
Рунди○
Русский (старая орфография)●
Русский●○▲
Русский (с ударениями)● Саамский○
Самоа○
Сапотекский○
Свази○
Себуанский○
Селькупский○
Сербский (кириллица)○
Сербский (латинский)○
Сесото○
Словацкий●○
Словенский●○
Сомалийский○
Староанглийский●○
Староиспанский●○
Староитальянский●○
Старонемецкий●○
Старославянский
Старофранцузский●○
Суахили○
Сунданский
Табасаранский
Тагальский○
Таджикский○
Таитянский○
Тайский●
Татарский●
Текст типа ocr-a
Текст типа ocr-b
Ток писин○
Тонга○
Тсвана○
Тувинский○
Тунисский○
Турецкий●○▲
Туркменский
Туркменский (латинский)○
Удмуртский
Узбекский (кириллица)
Узбекский (латинский)○
Уйгурский (кириллица)
Уйгурский (латинский)○
Украинский●○▲
Фарерский Фарси●
Фиджийский○
Финский●○▲
Французский●○▲
Фризский○
Фриульский○
Хакасский
Хани○
Хантыйский
Хауса
Хорватский●○
Цзинпо
Цыганский○
Чаморро○
Чеченский
Чешский●○▲
Числовые символы○
Чувашский
Чукотский
Шведский●○▲
Шона
Шотландский гэльский○
Шрифт micr (cmc-7)
Шрифт micr (e-13b)
Эвенкийский○
Эвенский○
Эскимосский (кириллица)
Эскимосский (латинский)
Эсперанто
Эстонский●○▲
Язык программирования c / c ++
Язык программирования Cobol
Язык программирования Fortran
Язык программирования Java
Язык программирования Kawa○
Язык программирования Pascal
Якутский
Японский (современный)●
Японский●▲
* Арабский ICR не поддерживается. Но распознаются арабские цифры, отпечатанные вручную.