С. Б.
Курт Хэлл, редактор электронного журнала Data Management Strategies, считает, что поисковые системы, применяемые в Интернете для поиска информации по ключевым словам, совершенно не используют возможности, предоставляемые средствами интеллектуального поиска данных (data mining), способными выявлять скрытые закономерности и интеллектуально, а не механически, перемалывать большие объемы данных. Причина кроется в том, что средства раскопки работают со структурированной информацией, а поисковые системы просто ранжируют тексты по ключевым словам, храня индексы в неструктурированных репозиториях. Хорошая поисковая программа должна уметь применять лексический и в идеале семантический анализ находимых фраз (например, когда слова привязываются к заложенным в репозиторий тематическим определениям) и позволять пользователю отбирать информацию по смыслу.
Работы в этой области ведутся очень активно, в том числе и в России, но реально пока ни одна из поисковых систем не способна толково ответить на бесхитростный запрос обычного пользователя, неискушенного в нюансах работы различных “искалок”. Вся борьба за этот рынок еще впереди.