ЦОД
В начале июня Владимир Филиппов, вице-президент по информационным технологиям компании "Вымпелком", объявил о завершении проекта резервного ЦОДа, выполнявшегося в сотрудничестве с системным интегратором "Инфосистемы Джет" и корпорацией Symantec. Катализатором преобразований стал пожар в офисе главного партнера "ВымпелКома" по системной интеграции - компании "Инфосистемы Джет", последствия которого наглядно продемонстрировали, насколько важна физическая защита данных и отказоустойчивость ИТ-инфраструктуры.
Владимир Филиппов отметил, что за два последних года число абонентов "ВымпелKома" увеличилось с 10 до 52 млн.; все это время московский главный вычислительный центр (ГВЦ) компании оставался единой точкой отказа, и потому существовала высокая вероятность, что в случае аварии в нем "ВымпелКом" может потерять контроль над бизнесом: длительный перерыв в предоставлении услуг мог вызвать отток клиентов и нанести ущерб репутации компании.
Владимир Филиппов: “Резервный
ЦОД, гарантируя непрерывность
предоставления ИТ-услуг клиентам,
способствует снижению уровня
рисков для бизнеса”
По его словам, резервный вычислительный центр (РВЦ), гарантируя непрерывность предоставления ИТ-услуг клиентам, способствует снижению уровня рисков для бизнеса и минимизации последствий аварий, уменьшению финансовых потерь в случае чрезвычайной ситуации и повышению катастрофоустойчивости и надежности ИТ-инфраструктуры.
На первом этапе проекта, начавшемся в 2003 г., было проведено обследование информационных систем "ВымпелКома" с точки зрения их влияния на бизнес, разработана общая стратегия восстановления ИТ-услуг после возможной аварии. Затем специалисты "Инфосистем Джет" спроектировали и внедрили технические решения, обеспечивающие реализацию стратегии восстановления ИТ-услуг: построили и оснастили резервный центр, за счет кластеризации обеспечили бесперебойность работы пятнадцати критически важных бизнес-приложений, с помощью синхронной репликации - высокую доступность данных, а с помощью удаленного резервного копирования - их сохранность. Консультанты из Symantec, также участвовавшие в проекте, разработали методики и планы постоянного предоставления ИТ-услуг в соответствии с мировым стандартом обеспечения непрерывности бизнеса PAS56.
В настоящее время в ГВЦ насчитывается около пятисот RISC-серверов Sun Microsystems, объединенных сетью хранения данных с дисковыми массивами. В этой среде емкостью более 300 Тб работает большинство основных приложений "ВымпелКома", включая такие критически важные, как системы самообслуживания клиентов, биллинга и CRM. РВЦ, насчитывающий примерно такое же число серверов, обеспечивает резервирование всех критичных для бизнеса систем и приложений.
В рамках проекта специалисты компании "Инфосистемы Джет" спроектировали и построили новую сеть хранения (SAN) ГВЦ с полным дублированием сетевого оборудования и магистралей (более 2000 портов), распределенную сеть хранения ГВЦ - РВЦ, распределенную систему резервного копирования на 500 с лишним серверов с общей емкостью копируемых данных свыше 1 Пб, высокоскоростную транспортную сеть между ГВЦ и РВЦ на основе технологии DWDM, обеспечивающую синхронную репликацию примерно 20 Тб данных; более десяти распределенных кластеров для бесперебойного функционирования самых критичных бизнес-приложений (биллинг, CRM и др.), инженерную и ИТ-инфраструктуру РВЦ.
В системе используются продукты Symantec Veritas: NetBackup Enterprise Edition, Storage Foundation for Oracle, Cluster Server и CommandCentral. С помощью Veritas NetBackup Enterprise Edition создаются резервные копии данных на магнитных лентах, которые хранятся в резервном ЦОДе. Система Veritas Storage Foundation for Oracle, в состав которой входит Veritas Cluster Server, обслуживает кластер серверов "активный - активный".
Сейчас внедряется система Veritas Command Central для учета предоставляемых услуг, для измерения уровней обслуживания и составления отчетов об использовании ресурсов, автоматизации процесса распределения ресурсов с помощью встроенного механизма управления потоками заданий, а также расчета стоимости используемых услуг.
Недавно из-за отказа брандмауэра в датацентре компании возникла проблема с доступом в Интернет, что могло бы лишить поддержки самообслуживания клиентов в Сети и кассовых терминалов партнеров по розничным продажам в разных регионах. В новой инфраструктуре проблема осталась незамеченной для пользователей: обслуживание было просто передано в резервный ЦОД.
В 2007-2008 гг. работы над совершенствованием системы планируется продолжить, поскольку приходится постоянно решать возникающие проблемы, связанные с масштабированием, обновлением оборудования и ПО, повышением уровня автоматизации. Владимир Филиппов уверен в том, что если приостановить модернизацию и совершенствование датацентра, то дальнейшее развитие компании и даже ее нормальное функционирование будут затруднены.