Интервью с техническим директором

Подводим итоги: чем занималась разработка Content AI в 2023 году

Иван Волков
technical-director-image
Интервью с техническим директором
Подводим итоги: чем занималась разработка Content AI в 2023 году
В уходящем году перед командой Content AI стояло много вызовов: включить флагманские продукты в реестр отечественного ПО, разработать их кросс-платформенные версии, создавать собственные технологии и развивать текущие продукты.

Технический директор Content AI Иван Волков поделился результатами работы R&D отдела, рассказал, по каким направлениям будут развиваться продукты компании, и предположил, какие ИТ-тренды будут прослеживаться в 2024 году.

— Расскажи, как прошел первый полноценный год для Content AI с точки зрения разработки.
— Несмотря на то что год был довольно напряженный и перед нами стояло много вызовов и нестандартных задач, команда Content AI справилась достойно.

С конца прошлого года мы занимались модификацией продуктов для включения их в реестр отечественного ПО, а также разработкой собственной технологии по распознаванию русского рукописного текста. Кроме того, выпустили промежуточный релиз платформы для извлечения данных и потоковой обработки информации ContentCapture, в который включили новую разработку.

Во второй половине года мы параллельно вели несколько проектов: работали над выпуском кросс-платформенных версий многофункционального редактора ContentReader PDF и платформы ContentCapture. Здесь команде R&D также пришлось приложить немало усилий и решить не одну сотню задач, за что коллегам огромное спасибо.

Вместе с тем, весь 2023 год мы работали над менеджментом внутри команды: выявляли недостающие компетенции с учетом планов разработки продуктов и существенно расширяли штат, проводили работу над ошибками с точки зрения планирования новых выпусков и вносили изменения в организацию работы.
— Уточни, почему разработку технологий решили начать именно с распознавания русского рукописного текста? Какие планы по ее развитию?
— Мы видели запрос от бизнеса о необходимости внедрения такого типа распознавания, поскольку русский рукописный текст до сих пор встречается в различных документах: данные в паспортах, трудовых книжках и военных билетах, заполненные от руки номера документов и в полях в анкет. И с помощью нашей технологии теперь обрабатывать такие типы документов в автоматическом режиме стало проще и быстрее.

Кстати, уже есть и первые отзывы от пользователей — технология получилась настолько качественной, что некоторые заказчики не могли поверить, что на российском рынке наконец-то появился достойный инструмент, который может справиться с такой задачей.

Безусловно, на следующий год есть планы по развитию этой разработки. Во-первых, добавим в нее детектор печатного текста, чтобы технология работала на документах, где одни и те же части могут быть как рукописными, так и печатными. Во-вторых, технология начнет поддерживать распознавание многострочных полей. Также мы рассматриваем возможность добавить распознавание рукописного текста в режим полнотекстового распознавания. Обновленная технология будет работать в двух наших продуктах — ContentCapture и ContentReader Engine.
— Можешь поделиться планами, какая следующая ИИ-разработка Content AI появится на рынке?

— В начале следующего года в ContentCapture появится технология добавления новых типов документов для извлечения нужных полей на основе разметки. Но поскольку этим сейчас уже никого не удивишь, мы решили пойти дальше — научить ContentCapture извлекать данные из новых типов документов без предварительного обучения.

Это очень амбициозная и большая задача, которой мы будем заниматься в течение всего следующего года.
— В этом году ContentCapture стала поддерживать Linux. Что это значит для пользователей? Какое видишь дальнейшее развитие продукта?
— Концептуально продукт ContentCapture стал кросс-платформенным. Это означает, что новый выпуск собирается под каждую ОС без потери качества или функциональности. То же касается и изменений в продукте. Так, например, к концу года мы добавим новую технологию — детекцию подписи и печати. И она сразу станет доступна для пользователей обеих ОС.

Что касается развития, как я уже упомянул, продукт научится извлекать данные из незнакомых документов. В продукте появится удобный no-code редактор процесса обработки документов. Существенно расширятся возможности веб-станций, что сделает возможным эксплуатацию только через браузер, без предварительной установки клиентских приложений. Также улучшим качество распознавания удостоверяющих личность документов, добавим валидацию подписей — ContentCapture сможет сравнивать подписи и выдавать заключение об их схожести. И упростим процесс извлечения данных из неструктурированных документов. В целом продукт станет проще во внедрении и использовании, при этом его функциональные возможности вырастут.
— Похожая история случилась и с ContentReader PDF. Расскажи подробности.
— В этом году мы выпустили новую версию редактора ContentReader PDF в редакции Lite. Это значительно переработанная версия продукта, использующая кросс-платформенный стек, в который входит новый для нас подход для построения графического интерфейса.

Сейчас это простое кросс-платформенное приложение, которое позволит упростить самые распространенные задачи, связанные с PDF-документами: просмотр, поиск, печать, комментирование, заполнение форм, проверка и добавление ЭЦП.

На российском рынке ContentReader PDF в редакции Lite призван заменить Adobe Acrobat Reader — распространенный просмотрщик PDF. Вместе с тем, относительно западной программы наша новая версия дает пользователям ряд преимуществ. Во-первых, мы работаем и на Linux. Во-вторых, предлагаем ряд уникальных функциональных возможностей, например, поворот отдельных страниц документа. В-третьих, для корпоративных заказчиков мы поддерживаем удобное лицензирование, включающее сетевые и конкурирующие лицензии, пулом которых удобно управлять.

Следующие этапы в развитии приложения знаменуются движением в сторону предоставления схожих с ContentReader PDF 15 возможностей в новом и удобном кросс-платформенном исполнении. Эта задача станет для нашей команды основным фокусом на 2024 год.
— Расскажи, как менялись остальные флагманские продукты компании в течение года и какие у команды планы по их развитию в 2024 году.
— Content AI Intelligent Search — наш первый продукт, который заработал под Linux еще в 2022 году. Поэтому в текущем году велась активная работа по поддержке заказчиков, которые применяют решение для новых сценариях.

К примеру, для X5 Group мы реализовали новый сценарий в области экономической безопасности, в рамках которого была поддержана возможность поиска по почтовым архивам. Здесь решение помогает эффективнее выявлять и предотвращать злоупотребления, а также минимизировать финансовый и репутационный ущерб компании.

Вместе с тем, команда продолжила расширять список поддерживаемых источников данных в продукте. В этом году к ним добавились Azure DevOps Server (ex. TFS) и Битрикс24. В следующем году планируется поддержка поиска по почтовым серверам и отечественным СЭД.

Также с этого года пользователи могут выполнять поиск нужной информации не только через сайт, но и через чат-бот. В следующем году планируем добавить в продукт новые функции на базе ИИ-технологий, включающие классификацию, извлечение сущностей, интеграцию с GPT-моделями и т. п.

Что касается ContentReader Engine, то в этом году продукт был добавлен в реестр отечественного ПО, выдержал испытание «первыми» клиентами и стал основанием для кросс-платформенного ContentReader Server.

Во второй половине года команда начала серьезную модификацию продукта с целью добавления в него API для сценариев захвата данных, базовых для станции обработки ContentCapture, и поддержки сканирования под Linux в формате, привычном для наших пользователей под Windows.

В будущем году планируем завершить начатую модификацию, подготовить продукт к сертификации на уровне Минобороны, создав документацию на русском языке, и продолжить расширять функциональность по запросам наших клиентов, например: добавить детектор печатей и подписей, устранить недочеты в поддержке .NET и Java, подготовиться к поддержке отечественных микропроцессорных архитектур.
— Как оцениваешь успехи компании в части импортозамещения для поддержки отечественного бизнеса?

— Оцениваю высоко. Практически все, что Content AI делает с момента своего основания, направлено на поддержку отечественного бизнеса — вносим продукты в реестр отечественного ПО, создаем высококлассные кросс-платформенные решения, которые упрощают отечественному бизнесу переход с Windows на Linux, разрабатываем технологии, которые помогают автоматизировать рутинные процессы.

Нашими кросс-платформенными решениями мы помогаем российским компаниям сформировать новый внутренний ИТ-ландшафт, снимаем часть рисков, затрат и стресса, которые вызваны переходом на новую ОС. Когда пользователь находит на Linux привычную, зарекомендовавшую себя годами программу, ему не нужно переучиваться работать с ней, он уверен в ее качестве, а также может переиспользовать настройки, ранее установленные специально под его бизнес-процессы.
— Обозначь ИТ-тренды на 2024 год. Будут ли они существенно отличаться от текущих?
— Думаю, что в следующем году мы будем видеть взросление и прагматизацию трендов 2023 года, большая часть которых связана с машинным обучением в целом и большими лингвистическими моделями в частности. В этом году их применение все еще можно в значительном числе случаев охарактеризовать как некое баловство и метод проб и ошибок, хотя и реально прорывные применения тоже случались.

В следующем году мы увидим больше прикладных результатов применения тех же генеративных трансформеров. И со временем останутся те модели и сценарии, которые приносят реальную пользу, они будут внедряться в существующие продукты и создавать на своей базе новые.

Еще один ново-старый тренд — переход на Linux. Да, этот процесс уже идет больше года, но в 2024 году наступит фаза, когда компании окончательно определятся с решениями, проведут закупку и начнут активно их разворачивать и использовать.

Также в ИТ-сообществе с 2022 года активно обсуждаются вопросы информационной безопасности. По моему мнению, к следующему году паника окончательно пройдет и наступит волна прагматичной работы в этом направлении.
18.12.2023