Управление мегаполисом требует четкого взаимодействия всех органов законодательной и исполнительной власти. Обмен большими объемами информации обычно опирается на сложный инфраструктурный ИТ-комплекс городской администрации, который имеет разветвленную систему управления службами и подразделениями, обеспечивающими жизнедеятельность города. Поскольку в рамках городской целевой программы “Электронная Москва” столичное правительство создает мощный конгломерат информационных решений, взаимодействующих через широкополосную корпоративную мультисервисную сеть, такая система должна отвечать повышенным требованиям в области управления и архитектуры, оперативной доступности приложений и качества услуг. Решением, способным обеспечить контроль работоспособности сети, стала интеллектуальная система управления, которая позволяет вести мониторинг транспортных каналов и отдельных узлов, регулировать нагрузку на ИТ-инфраструктуру, а также отслеживать ее работоспособность. На роль интегратора была выбрана компания “Энвижн Груп”.
Необходимость изменений
При высоком уровне информатизации от надежного и бесперебойного функционирования сети передачи данных во многом зависит эффективность работы столичной исполнительной власти. Инфраструктура мультисервисной сети Правительства Москвы представляет собой территориально распределенную сеть, включающую большое количество современного оборудования (маршрутизаторы и коммутаторы производства Cisco Systems, серверы Sun Microsystems), высокоскоростные каналы передачи данных (от 1 Гбит/с), средства обеспечения (ИБП, системы контроля окружающей среды и т. д.). В сети одновременно существует трафик нескольких типов, причем требования к параметрам каждого из них существенно варьируются.
Для обеспечения необходимого уровня качества и предотвращения перегрузок в сети нужны специализированные средства. К примеру, одна из проблем, стоявшая перед Управления информатизации Правительства Москвы, — децентрализация информационных систем, разнесенных друг от друга на значительные расстояния. Как отмечают ИТ-специалисты, раньше в городе существовало несколько центров управления, что значительно усложняло работу системы: эти точки могли подавать совершенно разные, зачастую противоречащие друг другу сигналы. К началу 2006 года стала очевидна необходимость внедрения на сети средств централизованного управления. Именно в тот момент начались работы по внедрению системы мониторинга мультисервисной сети, охватывающей пять крупных площадок, в том числе здания мэрии на Тверской и на Новом Арбате.
Решение позволяет осуществлять мониторинг сети и ее отдельных узлов, отслеживать доступность сетевых устройств, анализировать загрузку каналов. В соответствии с техническим заданием система мониторинга должна осуществлять контроль инфраструктуры, содержащей не менее тысячи маршрутизаторов и коммутаторов второго и третьего уровней, поддерживать серверную инфраструктуру (как минимум 250 серверов), а также 250 источников бесперебойного питания.
Общая схема службы мониторинга для корпоративной мультисервисной сети Правительства Москвы
Система мониторинга корпоративной мультисервисной сети состоит из двух интегрированных систем — управления событиями в случае аварийных ситуаций и изменения состояния (система УС) и мониторинга производительности (система МП). По информации технического директора “Энвижн Груп” Александра Гольцова, отдельные подсистемы поддерживают многоуровневую архитектуру с возможностью интеграции данных от нескольких серверов в рамках одной системы для поддержки больших инфраструктур.
Отметим, что проект по мониторингу сетевой инфраструктуры Правительства Москвы является частью большой и сложной системы управления информационными ресурсами, в создании которой принимают участие генеральный подрядчик — компания Kraftway (используется Microsoft Operations Manager для мониторинга доступности и производительности серверов), департамент консалтинга Microsoft и отечественный производитель системы класса Service Desk фирма Naumen. Решение включает полнофункциональную систему контроля сетевых сбоев и систему управления качеством сервиса.
Состав решения
В качестве центрального элемента контроля сетевых сбоев, по информации г-на Гольцова, было использовано ПО класса OSS, разработанное компанией EMC Smarts.
Решение включает четыре основных модуля. Это, во-первых, Service Assurance Manager (SAM) — подсистема мониторинга сервиса, которая является центральным приложением для управления. Она объединяет всю имеющуюся информацию о типологии сети и о происходящих в системе событиях, чтобы консолидировать первопричины неблагоприятных ситуаций, выявленные разными менеджерами доменов. Кроме того, данное приложение импортирует информацию о бизнесе и услугах из внешних источников. Чтобы добиться этого, SAM предоставляет набор интерфейсов (SNMP, TIBCO, XML, Java и др.) к внешним системам для управления проблемами, создания отчетов и т. д. Во-вторых, Business Impact Manager (менеджер контроля воздействия на бизнес) — специальное приложение, которое использует информацию о сервисах и бизнес-процессах, импортированную в SAM, и вычисляет степень влияния возникающих в инфраструктуре проблем на бизнес-процессы и оказываемые клиентам услуги. Фактически это аналитический модуль с развитыми функциями прогнозирования. В-третьих, Domain Managers (менеджеры доменов) — серверы анализа, предоставляющие функции обнаружения, мониторинга и причинно-следственного анализа топологии, за которую они отвечают. Сюда входят такие продукты, как EMC Smarts IP Availability Manager (менеджер доступности), IP Performance Manager (менеджер производительности), MPLS Manager (менеджер MPLS-сетей), Network Protocol Manager (менеджер сетевых протоколов), ATM/FR Manager (менеджер сетей ATM/FR), Application Services Manager (менеджер сервисов приложений). И наконец в-четвертых — Adapters (адаптеры). Эта группа модулей позволяет импортировать информацию о состоянии сети из сторонних систем управления (менеджеров приложений, событий, элементов, производительности и т. д.) любым удобным способом.
При создании системы управления качеством сервиса и мониторинга производительности использовалось ПО компании InfoVista, позволяющее в реальном времени собирать данные от различных типов оборудования, систем и приложений, проводить мониторинг ключевых показателей производительности и контролировать выполнение соглашений об уровне обслуживания (SLA).
Обобщающие диаграммы ПО EMC Smarts
Систему мониторинга производительности можно функционально разделить на несколько основных элементов. Сюда входят агенты контроля состояния (они либо являются частью серверного оборудования “по умолчанию”, либо устанавливаются на серверы, коммутаторы, маршрутизаторы и т. п.), передающие в центр управления информацию о состоянии ресурсов объекта (памяти, ЦП, каналов), агенты измерения (устанавливаются на компоненты инфраструктуры или являются частью их ОС), основная задача которых заключается в генерации синтетических (искусственных) запросов различного типа и ответов на запросы других агентов, а также компонент сбора и хранения информации, опрашивающий агентов на предмет их состояния и собирающий результаты измерений (они сохраняются в БД либо в неизменном виде, либо в виде вычисленных метрик — характеристик качества). Кроме того, в решение входит компонент построения отчетов и связи с внешними приложениями, который отображает полученную информацию в необходимом пользователю виде и представляет собранные данные другим приложениям управления информационной инфраструктурой (например, системам управления сбоями).
В результате внедрения данного решения обеспечивается проактивное обнаружение проблем, связанных с производительностью сетевого и серверного оборудования, до того момента, когда они начнут оказывать пагубное влияние на критически важные информационные сервисы. К слову, при мониторинге производительности серверного оборудования обеспечивается динамическая привязка серверов и кластеров к приложениям, сервисам, подразделениям, географическому расположению, группам клиентов и т. д., что упрощает визуальное представление информации.
Особенности инсталляции
Внедрение системы мониторинга в телекоммуникационной сети Правительства Москвы осуществлялось с четко определенными приоритетами, в соответствии с которыми ключевым фактором являются не технологии, а услуги и требования к ним, причем проекту предшествовал аудит бизнес-процессов — в его ходе контролю подверглись действительно важные точки сети.
«Реализованное решение дает возможность контролировать и анализировать работу сетевой инфраструктуры в режиме реального времени, обнаруживать сбои в её работе и минимизировать негативные последствия этих событий. Поскольку проект корпоративной мультисервисной сети в масштабах мегаполиса является основной транспортной инфраструктурой для систем <Электронной Москвы>, крайне полезно, — отмечает Алексей Михайлов, руководитель Управления информатизации города Москвы, — иметь «на вооружении» механизм качественного контроля, который позволяет эффективно управлять сетью Правительства, обеспечивая надежность ее работы и возможность прогнозирования ее производительности с целью заблаговременного планирования ресурсов».
В целом в настоящий момент система позволяет правительству города эффективно управлять существующей сетевой инфраструктурой: специалисты единого центра управления сетью могут теперь аккумулировать данные по производительности различного оборудования, сохранять информацию и анализировать тенденции, координировать свою деятельность по развитию сетевой инфраструктуры, осуществлять контроль уровня сервиса.
Окончательно эффект использования внедренной системы мониторинга городских информационных ресурсов пока не оценен, однако аналитики из компании IDC подсчитали, что подобные решения позволяют повысить эффективность работы информационной инфраструктуры на 26%, снизить общие потери из-за недоступности информационных ресурсов на 31%, а само время недоступности приложений уменьшить на 33%.