Андрей Колесов
На выставке SofTool’99 корпорация “Галактика” представила новый продукт под названием Galaktika-Zoom, предназначенный для аналитической обработки информации в крупных хранилищах текстовых данных. На фоне объявленных за последние два-три года довольно многочисленных информационно-поисковых систем, в том числе российских разработок, могло показаться, что “Галактика” несколько запоздала с выходом на этот сегмент рынка. Однако при ближайшем рассмотрении оказалось, что речь идет о программном комплексе, принципиально новом не только для линейки продуктов корпорации, но и для компьютерного рынка в целом.
Клиенты и поставщики (слева направо): Ирина Попова (НТВ), Елена Олейникова (“Вести”), Николай Красилов и Аревшад Варданян (“Галактика”)
Дело в том, что система Galaktika-Zoom появилась совсем не на пустом месте, она имеет большую и весьма любопытную историю, истоки которой уходят еще во времена советских разработок информационно-аналитических систем (вспомним о таких мощных организациях, как ВИМИ, ВИНИТИ и многочисленные отраслевые институты научно-технической информации).
Команда разработчиков под руководством Александра Антонова была сформирована в 1991 г. с целью создания одного из первых в нашей стране электронного полнотекстового архива СМИ в информационном агентстве “Постфактум”. Спустя два года к подобным решениям проявил интерес ряд экспертных центров, обеспечивавших информационно-аналитическую поддержку избирательных кампаний 1993-1996 гг. А три-четыре года назад такие системы стали брать на вооружение информационные службы ведущих российских телевизионных и радиоканалов, а также службы безопасности крупнейших российских банков.
Однако вскоре стало ясно, что бизнес-модель “независимой группы разработчиков” уже исчерпала себя: расширение круга клиентов потребовало превращения продукта из “полузаказного” в коммерческий. Для этого необходимо, с одной стороны, четкое разделение направлений собственно разработки и продвижения продукта (скорее даже второе направление нужно еще создать), а с другой - увеличение инвестиций в развитие системы. Логично, что для разрешения этой проблемы группа Антонова в начале 1999 г. влилась в корпорацию “Галактика” и к сентябрю представила новую версию своей системы с торговой маркой Galaktika-Zoom.
Продукт фактически содержит две составляющие: систему ведения архивов полнотекстовых документов и механизм информационно-аналитической обработки. В отличие от многих других архивных систем, которые имеют дело с документами, хранящимися в виде отдельных файлов, здесь имеется в виду именно единое хранилище данных, где документы находятся в упакованном внутреннем формате. Разработчики считают, что речь может идти о создании архивов текстовой информации объемом более 100 Гб. По мнению независимых экспертов, единых электронных архивов подобного объема в нашей стране пока просто не существует. В частности, одна из крупнейших российских поисковых машин Яndex оценивает объем российских информационных Internet-ресурсов, находящихся в ее “поле зрения”, величиной в 80 Гб (по состоянию на конец сентября 1999 г.).
Отличительной чертой комплекса обработки информации Galaktika-Zoom является наличие не только механизма прямого поиска информации, но и модуля лингвостатистического анализа, которые позволяют решать поисковые задачи принципиально нового класса (из разряда обратных задач). Это в какой-то степени напоминает традиционную загадку народных сказок: “Пойди туда, не знаю куда, найди то, не знаю что”, - когда, например, ставится задача не просто отслеживания данных по заданной теме, а поиска аномалий в потоке информации или определения полноты и достоверности данных. Этот механизм аналитической обработки может работать как с локальными, так и с распределенными источниками информации (в том числе в Internet).
Безусловно, наиболее сильное впечатление во время презентации Galaktika-Zoom произвело то, что на пресс-конференции, посвященной этому событию, журналисты могли услышать отзывы о продукте не только от самих разработчиков, но и от реальных пользователей, причем весьма авторитетных - телерадиокомпании РТР и телеканала НТВ. Их представители привели довольно много интересных примеров решения поисково-аналитических задач, которые уже давно стали нормой информационного обеспечения наших электронных СМИ.
Например, шеф-редактор информационно-справочной службы НТВ Ирина Попова сообщила некоторые технические параметры поддерживаемой базы текстовых данных: 5 млн. документов общим объемом 10 Гб при ежедневном входном потоке 10 Мб. Причем все это работает на весьма скромной технической основе - сервере на базе Pentium II с частотой 400 МГц.
В свою очередь, начальник информационного отдела телекомпании “Вести” Елена Олейникова и генеральный директор “Радио России” Игорь Амвросов, рассказывая о возможностях практического использования подобных систем, подчеркнули ключевую мысль: эффект от их применения зависит от уровня подготовки как руководителей предприятий (умения использовать информацию для управления), так и специалистов, обеспечивающих сопровождение электронных архивов.
Представляя новый продукт, президент корпорации “Галактика” Николай Красилов подчеркнул, что Galaktika-Zoom очень удачно дополняет реализованные ранее технологии управления предприятием. Информационно-аналитическая обработка необходима не только для быстро увеличивающихся объемов архивов внутренних документов, но и для восприятия внешних источников данных. Он выразил уверенность, что чем быстрее поймут это руководители предприятий, тем успешнее будет продвижение Galaktika-Zoom на рынке.
“Галактика”: (095) 158-0861.