Взгляд вглубь
Разные отрасли индустрии изучают методы извлечения информации
Когда в ноябре прошлого года доктор Джон Нерхос предпринял путешествие из Канберры (Австралия) в исследовательскую лабораторию имени Т. Д. Уотсона в Нью-Йорке, он не ожидал ничего особенного от сказок IBM о том, как технология извлечения необходимой информации из данных может помочь комиссии Health Insurance Commission (HIC) обрабатывать медицинскую документацию. Таская с собой десять кассет более чем с тремя гигабайтами лабораторных результатов, тестовой информации и записей о счетах, Нерхос был бы рад получить хотя бы пару полезных советов о том, как управлять его распухающим хранилищем данных.
То, что он получил через три дня после приезда в Нью-Йорк, было способом сохранять каждый год миллионы долларов австралийских налогоплательщиков. Инженеры IBM, используя ПО извлечения информации, смогли установить факт использования сомнительных финансовых документов, который иначе был бы погребен под массой данных HIC о счетах. "Я не знаю, смогли бы мы сами когда-нибудь с этим разобраться. У меня появилась возможность сразу же положить конец всему этому", - сказал Нерхос, главный менеджер отдела профессиональной проверки при HIC, австралийском государственном управлении, обрабатывающем всю медицинскую документацию.
HIC, подобно компаниям, работающим в таких различных отраслях, как авиация и космонавтика, разведка месторождений нефти, страхование, и даже Национальная баскетбольная ассоциация (NBA), приступает к активному использованию возможностей такой технологии. ПО извлечения информации просеивает множество с виду не связанных данных и выдает ориентировочную схему, которая может быть использована для принятия стратегических деловых решений. Для этой цели ПО использует алгоритмы выявления ассоциативных связей, сегментации, последовательностей и классификации.
"Нет такой сферы деятельности, которой не была бы полезна технология извлечения информации", - заявил Аарон Зорнес, исполнительный вице-президент и директор по исследованиям службы Application Delivery Strategies фирмы Meta Group (Берлингейм, шт. Калифорния).
IBM, естественно, делает ставку на это. Компания предлагает целый спектр продуктов такой технологии для мэйнфреймов, Unix и серверов среднего класса, и она же сделала известной эту технологию, показав ее в самом выгодном свете в широкой телевизионной рекламной кампании. "То, насколько эффективно способны компании использовать имеющуюся у них информацию о различных тенденциях развития и о том, что представляют собой их клиенты, будет в будущем определять их бизнес", - сказал Стив Миллс, генеральный менеджер отдела Software Solutions корпорации IBM (Сомерс, шт. Нью-Йорк). Другие компании, включая фирмы Pilot Software, Cross/Z International, корпорации DataMind, Thinking Machines, также вносят свой вклад в создание рынка технологии извлечения информации.
Снизить стоимость
Благодаря своей обширной деятельности HIC, по мнению аналитиков, является лучшим примером компании, которой могла бы принести пользу технология извлечения информации. В прошлом персонал, состоящий из 20 врачей, 30 фармацевтов, 35 исследователей и команды поддержки, считая, что медицинские услуги правильно записываются и оплачиваются, полагался на бумажные доклады. Но так как HIC вела более 300 миллионов дел и выплачивала врачам и больницам 8 миллиардов долларов каждый год, следить за всем этим было практически невозможно.
И вот появились новые возможности извлечения информации. "Система извлечения информации осуществляет контроль в сложных для нас областях, а мы можем делать все остальное", - говорит Нерхос. ПО извлечения информации корпорации IBM, позволило выявить финансовые махинации, состоящие в том, что больницы и врачи заказывали одни виды препаратов, а оплачивали другие, что стоило дополнительных $14 за каждый заказ.
Магистраль мэйнфреймов системы HIC состоит из двух ЭВМ IBM ES/9000 и одного IBM System/390, хранящих в общей сложности 1,3 терабайта данных. Необработанные данные, подробно описывающие каждую процедуру или визит врача, пересылаются с этих мэйнфреймов на IBM RS/6000, где информация может быть "нарезана ломтиками и кубиками" с помощью инструментария для извлечения информации Intelligent Miner корпорации IBM.
Используя эти инструменты, персонал HIC может следить за ранее недоступными областями. Например, обычные назначения различных врачей в сходных клинических ситуациях "были положены под микроскоп", чтобы те или иные виды лечения применялись наилучшим способом. Теперь, если врач прописывает необычно большие дозы определенного лекарства или лишние процедуры, он тут же "берется на заметку" системой извлечения информации HIC.
Система извлечения информации может быть полезной не только в системе здравоохранения. Так NBA изучает возможность применения еще одной системы, предлагаемой IBM, под названием Advanced Scout, специально разработанной для того, чтобы помочь тренерам NBA систематизировать и лучше обрабатывать статистические данные, собранные во время каждой игры. Анализируя такую информацию, как количество блокированных бросков или передач, успех определенных комбинаций и расстановок игроков, тренеры получают преимущество в период подготовки к следующим играм.
"Мы получаем возможность взглянуть на картину в целом, - говорит Том Стернер, помощник тренера Orlando Magic, использовавший в течение года Advanced Scout, систему, работающую под DOS, на IBM ThinkPad. - Мы можем наблюдать за тенденциями, о существовании которых мы даже не догадывались, выделять проблемы и решать их или использовать информацию для нашей пользы". В настоящее время 16 из 29 команд, входящих в NBA, проводят пробную эксплуатацию Advanced Scout.
Герберт Эдельштайн, президент корпорации Two Crows (Потомак, шт. Мэриленд), заявил, что, хотя удачная реализация технологии извлечения данных и вселяет большие надежды, она, возможно, не настолько проста, как в этом убеждает реклама IBM.
Выбор информации для ввода и обеспечение ее надежности определяют скорость извлечения информации. Еще одна важная деталь: знать, какие шаги надо предпринять, когда та или иная тенденция выявлена.
Несмотря на эти сложности, Эдельштайн заинтересован. "Возможности технологии неограниченны, в следующий раз мы увидим, как ее применят на скачках", - говорит он.
Эйлин Кроули