Статья только в электронной версии журнала

Статья только в электронной версии журнала

Леонид Черняк

В фундаменте информационно-поисковой системы RetrievalWare компании Excalibur Technologies лежат:

- нечеткий (fuzzy) поиск;

- лингвистическая поддержка.

Родословная первого уходит корнями в исследование систем зрения примитивных животных, которое привело создателя компании Джима Дау (Jim Dowe) к нейронным сетям. Показательно, что основанная им в 1980 г. компания строила тогда и продолжает сегодня свою деятельность на принципах весьма высокой наукоемкой технологии APRP (Application Pattern Recognition Processing).

Excalibur Technologies специализируется на работе с текстами на естественных языках, поэтому совершенно логичным стал следующий шаг - слияние с компанией ConQuest. Последняя была “широко известна в узких кругах” специальных служб как одна из наиболее авторитетных в области прикладной лингвистики.

В результате RetrievalWare состоит из компонентов, называемых серверами, часть из которых является языково-зависимыми. Связанность с рабочим языком приводит к тому, что создание полноценной национальной версии этого продукта не имеет ничего общего с традиционным представлением о русификации программ. Русский язык с позиций разработчиков информационных систем намного сложнее других европейских языков. Русификация предполагает огромный труд по созданию тезауруса, решению проблемы многозначности и учету многих других особенностей языка.

Сообщение компании “ВЕСТЬ-Метатехнология” от 10 февраля о выпуске Русского семантического сервера для RetrievalWare свидетельствует не просто о появлении еще одной опции, а о завершении большой научной работы. Ее итоги - семантическая сеть, технология организации тезаурусов - позволят продолжить работу по созданию специализированных мини-тезаурусов для предметных областей знаний. Обретя русскоязычную поддержку, система RetrievalWare нашла вторую необходимую точку опоры.

Прежде чем выпустить продукт, “ВЕСТЬ-Метатехнология” провела полугодовое бета-тестирование в нескольких крупных организациях. Вот что говорят о Русском семантическом сервере его пользователи:

Руководитель группы разработчиков Федерального института промышленной собственности Виктор Олегович Беляев:

- Мы несколько лет применяем RetrievalWare при создании поисковой системы по патентным документам России с возможностью доступа через Интернет (http://www.fips.ru). Для нас чрезвычайно важна его способность к нечеткому поиску, который обеспечивает работу с документами, содержащими ошибки (в условиях, когда количество документов исчисляется сотнями тысяч, это неизбежно). Он не позволяет пропускать существенное, а для экспертного поиска это критично.

Русский семантический сервер - практически единственный продукт такого типа, поддерживающий русский язык, и для нас он чрезвычайно полезен. Благодаря ему в полном объеме используются поисковые возможности RetrievalWare на русском языке.

Начальник отдела Главного управления информационных ресурсов органов государственной власти РФ Владимир Сергеевич Чепур:

- Поток данных, который генерируется информационными агентствами, настолько велик, что его фильтрация стала существенной проблемой. Образно эту ситуацию можно сравнить с попыткой напиться из пожарного шланга. Создать фильтрующую систему на основе традиционных баз данных не удается, поскольку нужен подход с неограниченной схемой данных. Система RetrievalWare компании Excalibur Technologies в сочетании с Русским семантическим сервером способна удовлетворить наши требования.

“ВЕСТЬ-Метатехнология”: (095) 115-6001.

Версия для печати