ПОИСК

Компания "СофтИнформ" (www.searchinform.com) представила новое решение SearchInform, предназначенное для поиска информации, а также набор связанных с ним интернет-сервисов.

Главным достоинством новинки, по мнению директора компании Льва Матвеева, является запатентованная технология поиска похожих документов. Система использует все множество словоформ встречающихся слов, а также словарь синонимов, специфический для данной предметной области. По словам разработчиков, благодаря этой технологии правильно отыскиваются даже такие документы, в которых, к примеру, было удалено или переставлено местами несколько абзацев, делались изменения самого текста и т. п. Это позволяет находить различные версии одного и того же документа, в том числе размещенные на разных ПК в локальной сети предприятия, что, в свою очередь, дает возможность избавиться от лишних "дублей", избежать путаницы, упростить консолидацию информации по одной тематике из разных источников. Весьма оригинальное применение новая технология может найти в сфере образования: с большой долей вероятности SearchInform сумеет "отловить" реферат или курсовую работу, скачанную из Интернета и лишь косметически переделанную нерадивым студентом.

По этому же принципу в SearchInform реализован и фразовый поиск: система способна автоматически находить нужные материалы не только по введенным словам, но и по их синонимам, извлеченным из словаря, что увеличивает релевантность и снижает потребность в подборе правильной формы запроса.

Среди других достоинств системы - высокая скорость индексирования (до 30 Гб/ч), небольшой объем индекса, обычно составляющий 15-20% от объема исходной текстовой информации, поддержка более полусотни форматов файлов, в том числе различных видов текстовых документов, почтовых сообщений Microsoft Outlook и The Bat!, тегов mp3 и avi, протоколов программ мгновенного обмена сообщениями ICQ и Microsoft Messenger и др., а также возможность обработки информации, получаемой от других программ (СУБД и информационных систем).

SearchInform сумеет "отловить" реферат или курсовую работу, скачанную из Интернета и лишь косметически переделанную нерадивым студентом.

            

Как было сказано выше, технология SearchInform умеет работать и в Интернете. Однако в этой области можно выделить две основные проблемы: низкое качество поиска и недостаточно оперативную индексацию источников. Причина первой проблемы кроется в универсальности таких поисковых систем, как Google или Yandex, а не в недостатках их поисковых машин: не зная точно, что нужно пользователю, они вынуждены выполнять "буквальный" поиск и, естественно, выдают массу ссылок, не имеющих к искомой тематике никакого отношения. Вторая проблема вызвана гигантскими и непрерывно увеличивающимися объемами информации, уже накопленными в Интернете. Даже самые мощные поисковые системы просто не в состоянии оперативно индексировать ее всю, а универсальный характер поисковых машин вынуждает в первую очередь отслеживать изменения на наиболее востребованных среднестатистическим пользователем сайтах. Например, новостные сайты мировых информационных агентств типа CNN или BBC могут просматриваться поисковой машиной каждый час, а то и чаще, а небольшие пользовательские форумы - раз в две недели и реже.

С помощью SearchInform крупная компания может организовать собственный "мини-Интернет", выполняя поиск по заданным сайтам, которые индексируются машиной с указанной периодичностью. Однако для того чтобы подобный поисковик работал, необходимы "широкий" канал во Всемирную паутину и возможность оплачивать большие объемы трафика, а это далеко не всем по карману. Поэтому компания "СофтИнформ" предлагает несколько интернет-сервисов разного уровня - Site Indexer, Personal Internet и Topical Search. Суть их сводится к тому, что пользователю за определенную плату предоставляется виртуальная поисковая машина, функционирующая на серверах "СофтИнформа" и осуществляющая индексацию интересующих заказчика сайтов с указанной им периодичностью. Эти сервисы опираются на один и тот же функционал SearchInform и различаются стоимостью и набором предлагаемых услуг.

Помимо продажи коробочных решений и выполнения заказных проектов для предприятий, а также предоставления интернет-сервисов "СофтИнформ" сотрудничает с независимыми разработчиками ПО, желающими встроить поисковую систему SearchInform в свои решения. Например, компания Hummingbird внедрила этот поисковик в свою систему управления документооборотом, а фирма "Лоция Софт" встроила его в систему управления проектной документацией Lotsia PDM Plus.

В планах на будущий год, по словам инвестора проекта SearchInform Ратмира Тимашева, - "агрессивное вторжение на западный рынок", хотя и отечественные заказчики не будут обделены вниманием. В России усилия планируется сосредоточить в первую очередь на поставке заказных решений различным компаниям (самостоятельно и через системных интеграторов); на Западе приоритетом станет интернет-поиск. Конечно, будет развиваться и сотрудничество с разработчиками ПО: по мнению г-на Тимашева, скорость и качество поиска SearchInform вкупе с простотой его интерфейса делают эту систему более привлекательной для интеграции с другими системами, чем аналогичные предложения конкурентов, так что, "...имея под рукой такое совершенное средство поиска, было бы глупо не урвать кусок рынка даже у Google".