Корпоративный поиск
по всем источникам данных
Intelligent Search. Найдет нужные данные для вашего бизнеса
Описание
Возможности
Как это работает
Спецификация

Intelligent Search

Intelligent Search – это готовое решение для быстрого поиска данных и документов в любых корпоративных источниках. Интеллектуальный поиск ускоряет и упрощает доступ к информации, необходимой для работы, независимо от того, где она находится.

Преимущества поиска
NEW! Кроссплатформенность 
Решение поддерживает операционные системы Windows и Linux. Поиск может работать на отечественных операционных системах, таких как AltLinux, AstraLinux, RedOS и других.
Единый доступ к корпоративным системам
Поиск по всем корпоративным источникам, без необходимости переключаться между системами.
Высокое качество поиска
Встроенные технологии ИИ: NLP, классификация и OCR позволяют достичь наиболее релевантных результатов поиска.
Сокращение случаев дублирования работы
Сотрудникам не придется заново создавать документы, если они не знают, в какой корпоративной системе находятся нужные им файлы.
Широкие возможности платформы
Решение легко масштабируется, позволяет гибко интегрироваться в ИТ-ландшафт организации, разграничивает поисковую выдачу в зависимости от прав доступа сотрудников и многое другое.
Заказчики об Intelligent Search
«Мы используем Intelligent Search для поиска по множеству корпоративных источников. Достоинства решения – качественный поиск на русском языке, в том числе по смыслу, а также возможность полнотекстового поиска по сканированным документам.

Intelligent Search является важной частью корпоративной электронной экспертной среды системы управления знаниями, ключевыми пользователями которой являются сотрудники конструкторского бюро, занимающиеся проектированием самолетов.

С помощью поисковика можно быстро находить нужные методики, отчеты о научно-технической деятельности, статьи из отраслевых журналов и другие документы, даже если они рассредоточены по нескольким корпоративным системам.

Также Intelligent Search применяется для поиска нужных экспертов, информация о компетенциях которых организована в виде документов. Таким образом, сотрудники могут оперативно найти не только нужный документ, но и полезный для решения задачи контакт».

Антон Елисеев,
начальник отдела управления знаниями АО «Компания «Сухой».

Как это работает
Intelligent Search – это готовое решение для быстрого поиска данных и документов в любых корпоративных источниках. Интеллектуальный поиск ускоряет и упрощает доступ к информации, необходимой для работы, независимо от того, где она находится.


1

1. Источники данных

Источниками данных для поиска могут служить библиотека SharePoint, файловая система Microsoft, вики Confluence, системы CRM, ERP, СЭД и другие.

2

2. Полнотекстовая индексация

После загрузки данных в Intelligent Search, выполняется построение полнотекстового индекса. Из документов извлекается текст, мета-данные, при необходимости выполняется OCR. После этого документы становятся доступными для поиска по ключевым словам.


Классификация документа по типу


На этом же этапе происходит классификация документов по типу (договоры, чертежи, письма и т.д.) которая в дальнейшем используется в качестве фильтров по результатам поиска.

3

3. Обогащение семантической информацией

Семантическое обогащение обеспечивает поиск документов по смыслу и происходит в фоновом режиме. Таким образом изначально можно построить полнотекстовый индекс и начать с ним работать, при этом документы параллельно будут обогащаться семантической информацией.


Извлечение сущностей с помощью онтомоделей


Предметная онтомодель позволяет выявлять сущности (названия организаций, предмет договора и его стороны, суммы по договору и т.д.) для построения фильтров и углубленной аналитики. Подключение пользовательских сущностей также происходит в фоновом режиме наряду с семантическим обогащением.

4

4. Пользователи и приложения

Построенный индекс доступен пользователям через сайт или через REST API.

Возможности
Ключевые возможности Intelligent Search

NEW! Кросс-платформенность 

Решение одинаково эффективно работает на Windows Linux-based операционных системах.

NEW! Новый административный

веб-интерфейс

В административном веб-интерфейсе решения отображается сводная информация по продукту и поисковым индексам, фоновым процессам и статистике поисковых запросов.

NEW! Готовые коннекторы

Обеспечивают загрузку и индексацию документов с портала MS Sharepoint, файловой системы MS Windows, вики Confluence и портала zakupki.gov.ru. В следующей версии будет поддержан поиск по содержимому баз данных (Postgres, MySQL), задачам в Yandex Tracker и Jira и каталоге пользователей Active Directory. Коннекторы поставляются с открытым исходным кодом, позволяя его модифицировать для разработки собственных коннекторов.

Семантический поиск

Благодаря технологиям обработки естественного языка, Intelligent Search обеспечивает поиск информации по смыслу запроса, а не только по точному совпадению. Например, если ввести в поисковую строку запрос «возмещение затрат», в результаты поиска выпадут не только документы, содержащие именно эти слова, но и документы с фразами вида «компенсировались затраты», «покрытие издержек » и т.д. Использование семантического поиска обеспечивает повышение точности поиска на 20%, а полноты на 30% по сравнению с полнотекстовым поиском.*


*По результатам внутреннего тестирования на 9 тестовых коллекциях и 500 запросах. Сравнение производилось с системой полнотекстового поиска MS SP 2016.

Автоматическая классификация документов по категориям

Для более удобной работы решение позволяет предварительно классифицировать документы по их типам или различным тематикам. Присвоенные категории также можно использовать для фильтрации найденных документов. Например, сотрудник может искать нужную информацию только по справкам, приказам, договорам и т.д.

Фильтрация результатов по мета-данным и извлеченным сущностям

Решение позволяет пользователю сузить результаты поиска с помощью фильтров. Можно отфильтровать файлы не только по метаданным (автору документа, дате создания, формату и т.д.), но по извлеченным из текста сущностям (персонам, названиям компаний, заказчику, сумме сделки, сторонам договора и т.д.).

Фильтрация

дублей

Позволяет настроить поисковую выдачу так, чтобы разные редакции одного и того же файла объединялись в одну группу документов и пользователю показывался документ в последней, наиболее актуальной редакции. Другими примерами дубликатов могут быть полные копии из разных папок, один и тот же документ в разных форматах, документ с подписью и печатью и без них, и т.п.

Поиск похожих

документов

Поддержана возможность поиска документов, похожих по смыслу на заданный. Таким образом поиск похожих документов осуществляется не только по тексту, но и по смыслу содержащейся внутри информации.

Поддержка пользовательских словарей синонимов

В решении можно обозначить слова и понятия, синонимичные для конкретной предметной области или организации, вплоть до аббревиатур и профессионального сленга.

Поисковые подсказки

Система отображает под поисковой строкой варианты наиболее частых запросов, которые начинаются так же, как и запрос пользователя.

Поддержка SSO

Благодаря системе единого входа, пользователю не требуется прибегать к повторному вводу пароля при входе в Intelligent Search.

Автоматическое исправление опечаток в запросах

Если запрос был введен с ошибками или опечатками, они будут автоматически исправлены.

Отображение документов, связанных с найденным

При просмотре найденного документа можно настроить отображение заголовков других документов, с ним связанных. Например, первичные бухгалтерские документы по найденному договору, другие договоры с тем же поставщиком или заключенные в том же квартале и т.п.

Поддержка кластерной конфигурации

Повышает отказоустойчивость за счет автоматического переключения между узлами поискового кластера, тем самым обеспечивая работу системы без сбоев. Повышает производительность поиска и процесса индексации за счет добавления новых узлов в кластер.

Закрепленные результаты поиска

Для ряда запросов можно настроить в верхней строке поисковой выдачи отображение конкретных результатов. Это могут быть ссылки на популярные корпоративные ресурсы – базу знаний, разделы на внутреннем портале и т.д. Например, по запросу “отпуск” первым результатом поиска может всегда быть страница с графиком отпусков и контактами HR.

Кастомизация дизайна сайта

Позволяет настроить сайт Intelligent Search под корпоративный стиль, включая цвета, изображения и текстовые надписи.

Разграничение прав доступа

В результате поисковой выдачи сотрудники получают только те документы, к которым у них есть доступ.

Создание резервных копий

Intelligent Search обеспечивает надежность системы за счет регулярного автоматического резервного копирования поисковых индексов.

Документация решения

Удобная и понятная документация, поставляемая с продуктом, включает в себя руководства по установке и настройке Intelligent Search для администраторов и инженеров, руководство по интеграции решения в корпоративную информационную систему и руководство по созданию коннекторов для разработчиков.

Открытое Java API для разработки коннекторов к произвольным источникам

Для индексации содержимого произвольного источника достаточно разработать коннектор на языке Java, который будет выполнять подключение к источнику и получение данных. Готовые коннекторы включены в дистрибутив с открытым кодом, как пример реализации.

REST API и интеграция в сторонние системы

Для интеграции с произвольной внешней системой поддерживается REST API. В частности, сайт Intelligent Search полностью реализован через REST API. На его примере можно создать интерфейс поиска в произвольной внешней системе.

Спецификация

Требования к программному и аппаратному обеспечению

Требования к программному и аппаратному обеспечению

Аппаратное обеспечение
  • 64-разрядный (x64) процессор с тактовой частотой 2 ГГц или выше. Примечание. Рекомендуется использовать процессоры с большим количеством ядер, если ожидается высокая нагрузка (одновременная работа большого количества пользователей).
  • Оперативная память: минимум 8 ГБ. Примечание. Для обеспечения максимальной производительности рекомендуется, чтобы объем оперативной памяти превышал размер создаваемого индекса.
  • Внимание! Во избежание падения производительности не рекомендуется использовать виртуальную память.
  • ·Жесткий диск: HDD, с объемом не менее 100 ГБ. Примечание. - Для увеличения производительности системы рекомендуется использование SSD. - При использовании реплик свободного места на диске может потребоваться больше.
Программное обеспечение

  • Операционная система Windows:

- Microsoft® Windows® 8.1 (x64),

- Microsoft® Windows® 10 (x64),

- Microsoft® Windows Server® 2008 R2,

- Microsoft® Windows Server® 2012,

- Microsoft® Windows Server® 2012 R2,

- Microsoft® Windows Server® 2016,

- Microsoft® Windows Server® 2019.


  • Операционная система Linux:
- Ubuntu 20.04;
- RED OS 7.3 Murom;
- Astra Linux 2.12.42 (Orel, Common Edition);
- ALT Server 9.1


Внимание! Если поисковые компоненты Intelligent Search

устанавливаются в кластерной конфигурации с использованием Network Load

Balancing (NLB), на каждом узле кластера допускается использование только

серверных операционных систем из вышеперечисленных.


  • Для работы с сайтом на ПК пользователей должен быть установлен браузер Internet Explorer версии 11.0 и выше или Google Chrome версии 60.0 и выше.
  • Для просмотра и редактирования оригиналов найденных документов сразу в соответствующем редакторе (без необходимости сохранения локальных копий документов) необходим установленный пакет Microsoft Office.
  • · Для реализации пользовательского коннектора требуется Java™ SE Development Kit 8 (JDK 8).

Поддерживаемые языки анализа и поиска данных

Английский

Русский

Языки интерфейса

Английский

Русский

Поддерживаемые форматы

  • Текст в формате RTF (*.rtf)
  • Документ Microsoft Word 97-2003 (*.doc)
  • Документ Microsoft Word (*.docx)
  • Шаблон документа Microsoft Word (*.dotx)
  • Документ Microsoft Word с поддержкой макросов (*.docm)
  • XML-документ (*.xml)
  • Текстовые документы (*.txt) Во избежание проблем с кодировкой файлы рекомендуется сохранять в формате Unicode или UTF-8 c BOM.
  • Веб-страница (*.html, *.htm)
  • Презентация Microsoft PowerPoint 97-2003 (*.ppt, *.pps)
  • Презентация Microsoft PowerPoint (*.pptx, *.ppsx)
  • Презентация Microsoft PowerPoint с поддержкой макросов (*.pptm, *.ppsm)
  • Книга Microsoft Excel 97-2003 (*.xls)
  • Книга Microsoft Excel (*.xlsx)
  • Книга Microsoft Excel с поддержкой макросов (*.xlsm)
  • Документ Adobe InDesign Markup (IDML) (*.idml)
  • Текст OpenDocument (*.odt)
  • Презентация OpenDocument (*.odp)
  • Электронная таблица OpenDocument (*.ods)
  • Документ Adobe FrameMaker (*.mif)
  • Графические файлы (*.pdf, *.jpeg, *.jpg, *.bmp, *.gif, *.tif, *.tiff, *.png, *.dcx, *.dib, *.jb2, *.jp2, *.j2k, *.jpf, *.jpx, *.pcx, *.wdp).
  • Архив, содержащий файлы поддерживаемых форматов (*.zip, *.rar, *.tar, *.tar.gz, *.7z).
Запросить пробную версию
Заполните форму и получите консультацию, как наиболее эффективно использовать наши решения для задач вашего бизнеса.

С апреля 2022 года работу со всеми клиентами и партнерами ABBYY Россия продолжит компания Content AI (ООО «Контент ИИ»).
Close