РАЗВЕДКА

В учебном центре компании "Мегапьютер" на семинаре "Интеллектуальные технологии поиска, мониторинга и анализа маркетинговой информации. Конкурентная разведка в Интернете" были представлены программные решения на основе технологии Avalanche российского консорциума Inforus.org (www.inforus.org), помогающие аналитикам в ежедневном целевом поиске информации в сети.

Первое программное решение на базе данной технологии появилось в прошлом году как результат работы над заказным зарубежным проектом. Существовавшие в мире поисковые продукты в тот момент (да и сейчас тоже) не решали комплексно такие задачи, как отсечение дублирующейся информации при повторном поиске (т. е. ссылок, которые пользователь уже видел), фильтрование ненужной информации (скажем, упоминаний продуктов в прайс-листах), соблюдение анонимности ищущего, определение тона изложения материала (позитив - негатив), а также не позволяли отличать краткую новость от статьи и т. д. Продукты на базе Avalanche были созданы для ликвидации этой бреши и предназначены для профессионального периодического целевого поиска информации во Всемирной паутине по некоторым смысловым шаблонам, формируемым пользователем (например, поиск информации о клонировании племенных скакунов, опубликованной за последние два месяца в периодических изданиях Великобритании).

Технология Avalanche базируется на трех "китах": концепции "умных папок" (Smart Folders), автономном интеллектуальном поисковом роботе ("пауке") и встроенной базе данных, допускающей преобразование в "персональную энциклопедию".

"Умные папки" - это своего рода рубрикатор с расширенными возможностями, не только отображающий документы, найденные в Интернете, но и хранящий дополнительную информацию, конкретизирующую смысловой шаблон (по сути, папки представляют собой модель предметной области в том виде, в котором она существует в голове ищущего). Работа с "умными папками" напоминает обычную работу с каталогами в проводнике Microsoft Windows. Однако "умные папки" позволяют отсортировать найденные документы по словам, по стоп-словам, по датам, по выражению и по подобию.

Поисковый робот предназначен для поиска в Сети информации по заранее заданному расписанию, прохода по нескольким уровням ссылок и оценки адекватности найденных ссылок, загрузки найденной информации на локальный компьютер пользователя.

С помощью Avalanche можно провести экспорт имеющейся базы данных в персональную HTML-энциклопедию, что позволяет в удобном виде представить и хранить информацию в форме персонального Интернет-сайта.

Главная особенность Avalanche - авторские алгоритмы семантической рубрикации, обеспечивающие автоматическую рубрикацию загруженной из Сети информации в соответствии со структурой "умных папок", хранение рубрицированной информации на локальном ПК, перерубрикацию хранимой информации (можно менять настройки папок и пересортировывать загруженную из Интернета информацию).

Возникнув как заказное решение, сегодня Avalanche превратилась в линейку тиражных программных продуктов:  Avalanche - стандартная версия интеллектуальной поисковой системы. Предназначена для облегчения рутинной работы по поиску информации для одного человека;  Avalanche pro - корпоративная версия. Включает в себя средства коллективной работы с общей базой данных;  Avalanche lite - компактная версия, в основе которой тоже лежат алгоритмы полнофункциональных версий. Однако она создавалась только для облегчения поиска и обновления новостных разделов Интернет-сайтов.

Для пользования продуктами на основе технологии Avalanche аналитик должен четко сформулировать свой запрос (может быть, в результате нескольких итераций) и настроить систему на поиск (по всему Интернету либо по отдельным сайтам или страницам). Этого достаточно, чтобы на персональном компьютере начала действовать персональная поисковая система, повышающая эффективность работы аналитиков, экспертов, обозревателей и других "исследователей" Сети, затрачивающих много времени на поиск нужной информации. Полезность Avalanche очевидна при анализе результатов PR- и предвыборных кампаний, при необходимости систематически отслеживать самую свежую информацию (возможно оперативное получение данных, не зависящее от цикла обновления информации в стандартных поисковиках Интернета).

К недостаткам существующих реализаций Avalanche, пожалуй, можно отнести требовательность к вычислительным ресурсам (для удобства одновременной работы с другими приложениями нужны весьма современные конфигурации) и отсутствие версий системы для платформ, отличных от Microsoft Windows.