Средства корпоративного поиска — уже давно не новинка на софтверном рынке; тема регулярно обсуждается в профессиональных СМИ, как минимум с начала нынешнего столетия, но все же данное направление до сих пор находится в состоянии как-то затянувшегося процесса формирования. И сегодня вряд ли можно уверенно сказать, когда оно выйдет на уровень достаточно зрелого самостоятельного рынка.

В целом, актуальность поиска для ИТ-пользователей не вызывает сомнений, именно этот механизм является ключевым в плане обеспечения доступа к нужной им информации. Правда, надо сразу сделать важное замечание: под поиском имеется в виду такая его разновидность, которая в полном варианте называется “полнотекстовый поиск”, то есть поиск на основе самого содержимого документов, а не их атрибутов. Если посмотреть на историю вопроса, то можно увидеть, что в “доэлектронные” времена при работе с бумажными (и другого рода материальными) документами основным способом был атрибутивный поиск (каталоги, ключевые слова и пр.). Нахождение нужного документа с помощью изучения его содержимого было реальным только при работе с относительно небольшими объемами информации (в том числе отобранной с применением атрибутивного поиска). Переход же к электронно-цифровым методам, возможность быстрого анализа именно содержания документов радикально изменили соотношение этих двух методов.

Собственно, проблема поиска нужной информации встала во весь рост в середине 1990-х в связи с увеличением объема ресурсов Интернета и быстрым ростом популярности Web-технологий. Задача эта решалась двумя конкурирующими методами — атрибутивного поиска (службы каталогов и пр.) и полнотекстового. Первый вариант подразумевал достаточно серьезный предварительный анализ документов (в том числе содержимого) для формирования системы атрибутов, по которой потом выполнялся поиск. Второй ограничивался созданием индекса информационных массивов, обрабатываемого более детально уже в процессе собственно поиска.

Дальнейший ход истории довольно четко показал, что для электронно-цифровых методов работы с информацией наиболее эффективным является полнотекстовый вариант, его преимущества становятся все ощутимей по мере роста объемов информации. Эта победа была фактически зафиксирована в ИТ-терминологии: в понятии “поиск” определение “полнотекстовый” стало подразумеваться по умолчанию.

Однако известный парадокс заключается в том, что уже давно поиск широко и успешно применяется при работе в открытом и почти бесконечном пространстве Интернета, но при этом многие ИТ-пользователи (это подтверждают различные исследования и просто житейский опыт) испытывают значительные трудности в деле нахождения нужной информации в рамках своей корпоративной системы и даже на отдельном собственном ПК. И это при том, что на рынке вроде бы есть довольно широкий спектр предложений по решению задач поиска, от приложения локального уровня до систем масштаба предприятия.

Почему же так происходит? Этот вопрос обсуждался в течение последнего года в рамках ряда мероприятий по тематике корпоративного поиска. В том числе интересная дискуссия на сей счет прошла на одном из круглых столов на майском DOCFLOW 2011. Причины, обуславливающие сложность поиска, довольно разнообразны, но все их можно объединить в три основные группы: технологические, финансовые и психологические.

Одной из главных технических проблем является существенная гетерогенность корпоративной ИТ-среды, которая включает порой десятки различных разнородных систем и хранилищ данных (в отличие от Интернета с достаточно однородной Web-средой). Неоднородность эта проявляется также в необходимости учета профессиональных ролей сотрудников-пользователей и в решении вопросов управления правами доступа к документам (чего нет в случае Интернета). При этом каждое отдельное ИТ-решение, как правило, имеет свои собственные внутренние средства поиска. Создание же интегрированного поискового решения становится довольно сложной задачей, и отсюда вытекает финансовый аспект: приобретение, внедрение и поддержка серьезного поискового решения корпоративного уровня требует весьма значительных денежных и интеллектуальных затрат. И тут возникает важный психологический аспект: заказчики, давно привыкшие к бесплатности интернет-поиска, порой просто не понимают, почему они должны платить деньги, причем немалые, за “то же самое”.

В своих проповедях о пользе поисковых решений продавцы и их эксперты часто корят пользователей за косность и непонимание выгод от применения предлагаемых средств, но надо все же признать, что на рынке главенствует принцип “покупатель всегда прав”. Значит, эффективность и окупаемость поисковых средств являются совсем не очевидными для потребителей.

Так или иначе, но направление средств корпоративного поиска, о формировании которого аналитики начали говорить еще в середине первого десятилетия нынешнего столетия, до сих пор явно носит какой-то нишевый характер и не может выйти на уровень популярности, сравнимой с такими технологиями, как бизнес-аналитика или поддержка мобильности. Об этом, в частности, свидетельствуют, на наш взгляд, и уже многолетняя история исследований компанией Gartner рынка корпоративного поиска. Например, весьма показательным фактом стало то, что свой очередной ежегодный отчет по этой тематике она представила не в виде традиционного “магического квадранта”, а в сокращенном формате MarketScope — “Видение рынка”. Причина такой замены понятна чисто визуально: динамика изменения графика расстановки сил поставщиков показывает не развитие, а скорее некоторую деградацию данного рынка. На это указывает и тот факт, что в погоню за парой лидеров — Google и Microsoft — никто из крупных платформенных игроков, кажется, решил не устремляться*. Отметим, что прогноз Gartner двухлетней давности о возрастании роли таких компаний, как IBM и Oracle, явно не оправдался.

Опубликованный в конце прошлого года очередной отчет Gartner MarketScope for Enterprise Search 2011 в целом подтверждает эту тенденцию. Хотя авторы исследования подчеркивают, что на сей раз они несколько изменили критерии оценки поставщиков, но все же изменение в расстановке игроков является достаточно характерным: большинство вендров понизило свой рейтинг. Так, например, Endeca покинула группу лидеров, IBM перешла в разряд “подающих надежды”, а Oracle и вовсе выпала из поля зрения исследования. Комментируя эти изменения, авторы отчета, в частности, отмечают, что такие компании, как OpenText и Oracle, используют встроенные средства поиска в своих продуктах, но не продают такое ПО в виде отдельных решений. Характерно и то, что, говоря об объемах данного рынка, Gartner сейчас просто повторяет оценки, данные еще в 2008 г.: среднегодовой рост с 2007 по 2013 гг. равен 11,7% с перспективой роста до 1,89 млрд. долл. в 2013-м. Исходя из такого прогноза получается, что в 2011 г. продажи составили 1,38 млрд. долл.

Ведущие позиции Google и Microsoft на рынке корпоративного поиска выглядят вроде бы вполне естественными с учетом того, что именно эти компании лидируют в сфере интернет-поиска. Однако более внимательный анализ положения дел как раз показывает, насколько значительны различия этих двух областей поиска в плане как технологий, так и маркетинга.

Microsoft много лет создавала средства корпоративного поиска в рамках своей платформы SharePoint, однако признанным лидером стала только после приобретения в начале 2008 г. норвежской компании FAST Search & Transfer (FST) с ее одноименным продуктом. В целом считается, что сегодня этот инструмент является самым универсальным и самым мощным на рынке. Он представлен в двух вариантах — для SharePoint и произвольных Web-порталов. Кроме того, Microsoft продолжает развитие собственного поискового движка, реализуемого в виде бесплатной версии Express и встроенного средства SharePoint. Отметим, что FST реализован в том числе и в версии для Linux, но пока ее поддержка обещана лишь до 2019 г. В качестве достоинств этого продукта эксперты Gartner называют возможность поиска в социальных сетях, поддержку федеративной модели, высокий уровень релевантности результатов поисковых запросов. Традиционный для Microsoft минус — ориентация компании на работу лишь со своими платформами, в данном случае имеет место фокусировка FST на SharePoint. Это проявляется, в частности, в довольно сложной схеме подсчета стоимости продукта при его работе вне среды SharePoint.

Google уже давно является почти синонимом самого понятия интернет-поиска, а вот путь на рынок корпоративного поиска оказался для компании намного более тяжелым и долгим. Свое программно-аппаратное (отдельный физический сервер с предустановленным ПО, что само по себе не очень обычно) решение Google Search Appliance (GSA) она представила еще в 2002 г., но лишь в конце 2010-го Gartner включила ее в состав лидеров рынка.

По мнению экспертов, GSA продолжает наращивать свою функциональность и все шире используется в разнообразных проектах, но все же пока не очень подходит для реализации крупных поисковых проектов. Хотя нельзя не отметить, что относительно низкая цена и легкость развертывания данного решения способствует росту его популярности. Сейчас Google делает ставку на расширение партнерских программ, в том числе с независимыми разработчиками, по созданию дополнений к GSA. Интероперабельность решения поддерживается за счет использования достаточно простого (хотя не очень мощного) протокола OneBox. Среди недостатков данного решения Gartner отмечает ограничения по настройкам, а также непростую схему ценообразования для больших проектов внедрения.

Таблица. Ситуация на рынке корпоративного поиска (Gartner)
Компания Рейтинг по итогам 2010 и 2011 гг

Подающие надежды Положительные возможности Лидеры
Autonomy 2010
Endeca 2011 2010
Exalead 20102010+2011
Expert System 2010+2011
Fabasoft
Google 2010+2011
IBM 2011 2010
ISYS 2010
Microsoft 2010+2011
Oracle 2010
Polyspo 2010
Sinequa 2010
Vivisimo 2011

*Одним из главных признаков зрелого рынка является наличие четко выраженной группы лидеров числом не менее трех-четырех с непременным участием в ней крупных мультивендров.