Геннадий Сменцарев

 

Ограничения реляционной модели и построенных на ее основе СУБД

В наше время абсолютное большинство СУБД построено по принципу реляционных, которые в теоретическом и практическом плане получили очень большое развитие. Серверы БД известных фирм Oracle, Informix, Sybase, Borland и др. поддерживают язык запросов SQL, позволяющий создавать и работать с реляционными БД, а также формировать запросы на уровне как клиентской части приложения, так и серверной. Существуют инструментальные системы, ориентированные на создание СУБД, в том числе в клиент-серверной архитектуре с использованием современных технологий, включая визуально-компонентные. По оценкам специалистов, примерно 99% мирового рынка баз данных занимают ныне реляционные СУБД.

Вместе с тем в последние годы четко обозначилась тенденция развития СУБД в объектном направлении. Объектная модель данных, интегрируя все возможности реляционной модели, обладает рядом существенных преимуществ по сравнению с последней. Эти преимущества заключаются прежде всего в способности естественным образом интегрировать в рамках единого информационного массива разнородные данные. Среди других преимуществ можно выделить возможность создания имитационных моделей разнообразных трудноформализуемых предметных областей реального мира, а также существенного повышения аналитических возможностей банков данных, реализованных на основе объектной модели. Названные функции позволяют использовать эти банки данных в качестве хранилищ исходной информации в составе экспертных систем и систем поддержки принятия решений.

Учитывая преимущества объектной технологии, разработчики наделяют сейчас старые реляционные СУБД (Informix, DB2, Oracle) некоторыми объектными свойствами. Но объектно-ориентированные СУБД, если их создатели не хотят ставить своих клиентов перед необходимостью ломать все до основания и начинать заново, нередко имеют под собой реляционную машину данных и расписывают объекты по отношениям.    

Преимущества объектной формы представления данных

Объектная модель на основе прямых адресных отсылок в последнее время активно развивается и распространяется, тем более что, как отмечалось выше, она отнюдь не противоречит реляционной модели данных, а дополняет и развивает последнюю (точнее сказать - реляционная модель является частным случаем объектной формы представления данных). Механизмы конвертации данных дают возможность переводить информацию из реляционной структуры в объектную и наоборот, позволяя тем самым использовать в новой структуре созданные ранее массивы информации.

Основные преимущества объектной модели данных сводятся к следующему.

1. Возможность описывать в рамках единого информационного поля объекты, имеющие разнородную внутреннюю структуру и состав элементов.

2. Установление сложных многоуровневых отношений между информационными объектами, в том числе типа “один к одному”, “один ко многим”, “многие к одному” и “многие ко многим”.

3. “Вложение” объектов друг в друга, выделение общих свойств объектов на верхних уровнях и учет индивидуальных качеств и свойств объектов на нижних уровнях иерархии.

4. Возможность хранить в едином банке данных структурированную информацию и неформализованные данные.    

Информационная модель рынка телекоммуникаций. Состав и структура

Среди российских фирм активную работу в области объектных СУБД и инструментария для их разработки ведет фирма “Кронос”, занимающаяся данной проблемой с середины 80-х годов. Для ЗАО “Московская телекоммуникационная корпорация” была разработана информационная модель телекоммуникационного рынка, которая не только позволяет решать информационно-справочные задачи, но и проводить комплексные аналитические исследования. Эта модель реализована в АБД “Рынок связи и телекоммуникаций” (свидетельство РосАПО № 980019 от 17.09.98 г.), содержащей текущую событийную и справочную информацию о развитии рынка телекоммуникационных услуг, оборудования и программного обеспечения, а также о смежных с ним областях экономики и политики.    

Принципы , положенные в основу концептуальной модели телекоммуникационного рынка

Реальный мир представляет собой совокупность взаимодействующих и изменяющихся с течением времени разнородных объектов, наделенных определенными качествами и атрибутами.

Каждый объект имеет свою уникальную внутреннюю структуру и взаимосвязи, отличающие его от других объектов этого мира.

Все объекты находятся в состоянии непрерывного взаимодействия друг с другом.

Каждый объект телекоммуникационного рынка эволюционирует с течением времени, имеет свою историю и перспективы развития (в том числе и тогда, когда это развитие ведет к его регрессу и исчезновению).

Связи субъектов телекоммуникационного рынка между собой и с предметами этого рынка носят в общем случае многомерный характер, обладают определенными количественными и качественными характеристиками.

Каждый объект реального мира, а также свойства и качества этого объекта, характер связей и отношений между объектами могут быть описаны соответствующими им информационными моделями (будем называть их информационными объектами).

При описании информационных объектов используется метод формализации как способ выявления и уточнения содержания изучаемого субъекта или объекта телекоммуникационного рынка, явления или процесса через раскрытие и фиксацию его формы, а также оперирование этой формой. Подобный метод, будучи применен к такой трудно формализуемой сфере общественного бытия, как деятельность социальных сил (людей, компаний, государств), в сфере телекоммуникаций носит гуманитарный характер и по сути является социально-логическим.    

Событийный подход к отбору и накоплению информации

Событие, будучи одним из главных предметов анализа рынка телекоммуникаций, составляет элементарную клеточку жизни природы и общества. Причем масштаб события может быть различным: оно может быть связано с развитием глобальной телекоммуникационной системы, может относиться к отдельно взятому государству, региону или группе регионов, населенному пункту, компании либо конкретному лицу - сотруднику компании. Исходя из этого, событие рассматривается в качестве основной исходной информационной единицы.

Хронологическая привязка полученной информации к временному ряду позволяет изучать динамику изменения обстановки на рынке телекоммуникаций и составлять прогнозы развития объектов и субъектов этого рынка, отдельных его сегментов и географических регионов.

В графическом виде структура информационной модели представлена на рис. 1.

Рис.1. Графическое отображение информационной

модели АБД “Рынок связи и телекоммуникаций”

Основу модели составляют формализованные описания участников телекоммуникационного рынка и явлений этого рынка (далее будем называть их объектами и субъектами телекоммуникационного рынка), к числу которых относятся физические и юридические лица, сети передачи данных, документы, события и обзорные материалы. На рис. 1 они представлены в виде больших сфер красного цвета.

Каждый субъект и объект обладают набором уникальных, присущих только им атрибутов. При этом каждый тип атрибутов имеет единую внутреннюю структуру, но они различаются между собой как составом, так и структурой составляющих их элементов. Атрибуты непосредственным образом связаны с их обладателями (на рис. 1 они обозначены малыми сферами зеленого цвета). Для юридических лиц в качестве атрибутов могут выступать такие показатели, как уставный капитал, бухгалтерский баланс, юридический и фактический адрес и т. д. Атрибутами физических лиц могут быть фотографии, характеристики с мест работы, сведения об имеющихся государственных наградах и т. д. Кроме того, атрибуты субъектов и объектов телекоммуникационного рынка, в свою очередь, также могут обладать собственными качествами, которые будем называть атрибутами второго порядка (например, любое оборудование связи, программное обеспечение и услуги телекоммуникаций имеют стоимостные характеристики). На рис. 1 такие атрибуты отображены малыми сферами розового цвета.

Все объекты и субъекты телекоммуникационного рынка связаны и взаимодействуют друг с другом непосредственно или через свои атрибуты. На рис. 1 эти связи обозначены цилиндрами желтого цвета. Связи, так же как субъекты и объекты, имеют свою внутреннюю структуру и содержание, которое может быть структурировано и представлено в формализованном виде.

В реальной жизни деятельность участников телекоммуникационного рынка осуществляется в тесной взаимосвязи с окружающей средой, имеет территориальные и временные границы. В информационной модели рынка эти связи находят свое отображение через понятие “информационный фон”, который представляет собой совокупность баз данных, описывающих обстановку, на фоне которой разворачивается деятельность участников рынка. В информационной модели АБД “Рынок связи и телекоммуникаций” используются четыре “фоновые” базы данных: “Географический фон”, “Технологический фон”, “Ситуационный фон” и “Хронологический ряд”. Фоновые характеристики имеют определенную структурную иерархию, которая позволяет связывать их между собой, а также с участниками рынка непосредственно либо через атрибуты последних (на рис. 1 эти связи не отображены, чтобы не загромождать схему). Помимо отсылок и связей каждый информационный объект фоновой базы данных содержит описание количественных и качественных характеристик того или иного элемента “фона”, зачастую непосредственного отношения к телекоммуникационному рынку не имеющих, но необходимых для комплексного анализа обстановки на этом рынке, либо позволяющих аналитику глубже уяснить суть проблемы. Например, база данных “Географический фон” для каждого региона, помимо привязок к адресам организаций и событий, лицензиям и т. д., содержит описание уровня доходов населения и экономических показателей развития. Данная информация может представлять интерес для потенциальных инвесторов с точки зрения оценки сроков окупаемости финансируемых проектов.

Базы данных “Технологический фон” и “Ситуационный фон”, помимо информационных объектов, входящих в состав этих баз, содержат описание процессов, лежащих в основе той или иной технологии, результаты научно-исследовательских и опытно-конструкторских работ, методические материалы, относящиеся к тарифной политике, инвестиционной деятельности, маркетингу рынка или его отдельных сегментов, и т. д.

База данных “Хронологический ряд” привязывает даты публикаций, а также событий, происходящих на рынке телекоммуникаций, к временной оси. Деятельность участников рынка разворачивается во времени. С течением времени меняются качества и свойства объектов. Разрушаются старые, видоизменяются существующие и устанавливаются новые связи между объектами и субъектами рынка. Каждое новое состояние рынка в целом, его отдельных участников либо их атрибутов отображается в банке данных путем привязки к временной оси (хронологическому ряду). В совокупности с возможностью СУБД “Кронос” объединять одинаковую информацию, не тиражируя ее, это свойство модели рынка позволяет изучать динамику изменения обстановки, качеств и свойств объектов. Так, если количественные и качественные характеристики атрибута объекта с течением времени не изменяются, то в банке данных лишь увеличится число привязок атрибута к временной оси. Если же атрибут меняется динамично, то адекватно его изменениям в банке данных увеличивается число информационных объектов, описывающих его новые состояния.

Подобная организация информационной модели телекоммуникационного рынка позволяет изучать его состояние в различных временных срезах, а также проводить причинно-следственный анализ происходящих на нем событий, составлять “телекоммуникационные портреты” регионов, проводить инновационный анализ и прогнозировать тенденции и перспективы развития информационных технологий.

Разработанная информационная модель АБД “Рынок связи и телекоммуникаций” позволяет накапливать и хранить не только формализованные данные, но и неструктурированную информацию с привязкой ее к соответствующим участникам рынка, их атрибутам, а также фоновым характеристикам. Неформализованные данные образуют фонд полнотекстовых рефератов. Однако реферат в АБД не является точной копией обработанного документа (за исключением нормативных актов и некоторых других типов документов, где важно не только содержание, но и форма представления материала). Так как в системе принят событийный (а не документальный) принцип накопления информации, то в соответствии с ним осуществляется декомпозиция реферата на логически законченные фрагменты текста, каждый из которых относится к конкретному объекту (субъекту) рынка телекоммуникаций или его атрибуту. Фонд рефератов является “многослойной” структурой, так как позволяет хранить идентичную информацию на различных языках народов мира. Вместе с текстами могут храниться относящиеся к ним графические и (или) звуковые материалы.

Отыскать оригинал документа пользователь может по его атрибутам (наименование, дата, номер издания, название статьи, автор документа), обратившись к указателю на источник информации. Совокупность подобных указателей образует в рамках единого информационного пространства специализированную базу источников информации.    

Пример информационной модели

В качестве примера информационной модели рассмотрим ситуацию, когда два человека беседуют между собой по телефону, используя систему спутниковой связи (ИС) “Иридиум”. Графически такая модель в существенно упрощенном виде представлена на рис. 2.

Рис. 2. Пример описания информационной модели

В данном случае имеет место событие (СБ) связи по спутниковому телефону двух людей (ЛЦ1 и ЛЦ2), которые выступают в качестве субъектов события. Эти люди проживают (ПЖ1 и ПЖ2) в разных городах (АД1 и АД2), относящихся к различным географическим регионам (ТР1 и ТР2). Причем информация о месте их проживания привязана к некоторому моменту времени ИИ1. Для связи между собой ЛЦ1 и ЛЦ2 используют систему спутниковой связи “Иридиум” (ИС). Она в данном случае выступает в качестве объекта рассматриваемого события. Само событие в базе данных классифицировано путем привязки к определенному технологическому фону (ФО2), именуемому “спутниковая связь”, и ситуационному фону “деловые переговоры” (ФО3).

Вся правая часть схемы связана с описанием системы “Иридиум”. Из нее, в частности, следует, что система передачи данных “Иридиум” принадлежит (информационный объект ОИ, информация относится к дате ИИ) организации РГ1 и включает в свой состав совокупность спутников связи ЭП1, ЭП2, ЭП3 и ЭП4. Причем спутники ЭП1, ЭП2 и ЭП3 являются собственностью (соответственно ВП1, ВП2 и ВП3) организации РГ1 (информация привязана к дате, описываемой информационным объектом ИИ3). Относительно спутников известно также, что они входят в номенклатуру продукции (ТП), выпускаемую организацией РГ2, которая изготавливает (СЯ) эти спутники для организации РГ1. Номенклатура продукции ТП относится к классу оборудования, определенному с помощью ссылки на объект технологического фона ФО1.

Управление орбитальной группировкой спутников связи в организации РГ1 обеспечивает ее работник (ТД), который идентифицирован информационным объектом ЛЦ3.    

Организация справочной и информационно - аналитической работы с использованием объектной модели данных

Созданная программно-информационная система, включающая в себя объектно-ориентированное описание выбранной предметной области (в рассматриваемом случае - рынок телекоммуникаций), ее информационное наполнение, а также инструментальные возможности СУБД “Кронос” образуют основу для разработки систем поддержки принятия решений и экспертных систем.

Система служит информационной базой для проведения аналитических исследований. Она позволяет формулировать сложные критерии выборок, основанные на категориях не только сложносочиненных, но и сложноподчиненных предложений.

Все многообразие доступных критериев выборок и организуемых на основе полученных данных аналитических исследований можно классифицировать по следующим основным группам.

1. Объектный анализ. Проводится путем выборок информации, касающейся различных участников рынка (его субъектов), а также материальных и интеллектуальных ресурсов (объектов) рынка. Выборки могут относиться ко всему объему накопленной информации об объекте или субъекте рынка на всей временной оси (режим “досье”), а также по отдельным атрибутам на различных отрезках временного ряда (например, продукция, производимая организацией, или ее финансовые показатели за определенный промежуток времени, динамика изменения уставного капитала организации).

2. Анализ связей и отношений. Его суть заключается в изучении прямых и опосредованных связей субъектов рынка между собой, а также с различными предметами и явлениями реального мира. Проводится посредством построения следующих типов выборок:

- проверка наличия и типов связей между изучаемыми объектами реального мира с заданной глубиной выборки;

- построение цепочек последовательных и параллельных событий и анализ причинно-следственных связей;

- выборка информации, касающейся содержания конкретной связи между изучаемыми объектами реального мира на всей временной оси или на ее отдельных отрезках.

3. Географический анализ. Проводится путем выборок информации о развитии изучаемой предметной области в целом (например, вся информация, касающаяся телекоммуникаций) или ее отдельных фрагментов (например, только организации, предоставляющие услуги передачи данных) в заданном географическом регионе с привязкой ко всей временной оси (режим “досье”) или ее отдельным фрагментам (так называемая телекоммуникационная обстановка в регионе).

4. Технологический и ситуационный анализ. Связан с отбором и последующим анализом теоретических статей и конкретных фактов применения участниками рынка технологий и ситуаций в реальной жизни.

5. Хронологический анализ. Позволяет проследить динамику изменения обстановки на всем рынке, по его отдельным сегментам, участникам рынка или их связям. Проводится посредством выборки требуемой группы данных, относящейся к заданным временным интервалам.

6. Комбинированный частный анализ. Многочисленные его разновидности обеспечиваются выборками информации по различным участникам и (или) предметам рынка с необходимыми ограничениями на их атрибуты, фоновые характеристики и хронологическую привязку.

В качестве возможных критериев отбора информации можно привести следующие:

- отобрать все события, произошедшие до 01.05.98 г. в Москве и связанные с развитием сотовой связи, в которых участвовала компания КОМКОР;

- отобрать все организации, находящиеся на территории Украины и предоставляющие услуги сотовой телефонной связи в стандарте GSM;

- найти организацию, выпускающую спутники связи “Экспресс”, входящие в состав системы спутниковой связи “Интерспутник”;

- отобрать все организации, не находящиеся на территории Бурятии, но имеющие действующие лицензии Государственного комитета РФ по связи и информатизации на предоставление услуг передачи данных в этой республике.

Возможна как содержательная выборка данных, так и статистическая обработка отобранной информации с последующим ее представлением в виде диаграмм и графиков.    

Перспективы развития системы

Дальнейшее развитие системы связано с автоматизацией типовых аналитических операций, на базе которых могут быть построены алгоритмы или эвристики более сложных видов анализа, а также улучшением пользовательского интерфейса. По степени приоритетности и возрастанию сложности и трудоемкости работ разработчикам в ближайшем будущем предстоит.

1. Разработать механизм, обеспечивающий “многоязычность” системы.

2. Разработать сетевую версию банка данных, обеспечить доступ к накопленным в нем сведениям по сети Internet.

3. “Интеллектуализировать” системы, автоматизировать наиболее характерные и типовые алгоритмы и методики частного анализа информации.

4. Автоматизировать процедуры формализации, классификации и реферирования исходной информации.

Телефон и адреса фирм: КОМКОР - (095) 200-2538, smen@mtk.comcor.ru; “Кронос” - (095) 229-4695, www.sins.ru/cronos.

Версия для печати