Непрерывность бизнеса имеет важнейшее значение как условие предоставления клиентам вашей компании услуг мирового класса. Поэтому необходимо знать существующие способы ее обеспечения. Независимо от того, какое решение вы в конечном счете примете — воспользуетесь вычислительным облаком или подключитесь к удаленному ЦОДу, понимание последствий вашего решения может быть важнее, чем конкретные технологии, которые вы применяете.
Многие менеджеры и руководители ИТ-подразделений понимают, что обеспечение непрерывной работоспособности представляет собой процесс постоянного совершенствования всех систем и выявления в них новых или пропущенных прежде слабых мест. Поэтому давайте повнимательнее присмотримся, о каких системах идет речь, какие шаги предпринимаются менеджерами и какие уроки они извлекают.
Конечно, еще предстоит проделать огромную работу. В выпущенном в этом году компанией Symantec пятом ежегодном докладе о восстановлении ИТ-операций после катастроф (Disaster Recovery, DR) отмечается, что в четверти случаев при проверке перехода на использование запасного ЦОДа возникли те или иными трудности.
Хорошая новость заключается в том, что количество руководителей высшего звена, участвующих в планировании DR (70% респондентов), удвоилось со времени проведения предыдущего исследования. Трудно сказать, чем это объясняется. То ли большими затратами на планирование DR, то ли тем фактом, что теперь планирование DR охватывает более широкий круг важнейших приложений и потенциальных клиентов. А может быть, CIO просто лучше изучили вопросы обеспечения непрерывности бизнеса и стали уделять им больше внимания.
Где размещать?
Приступая к составлению плана обеспечения непрерывности бизнеса, прежде всего следует решить, где будет размещаться резервный ЦОД. Можно остановиться на одном из четырех основных вариантов.
1. Превратить находящийся в штаб-квартире ЦОД во вспомогательный и соединить его широкополосным каналом с удаленным основным ЦОДом. Если вы последуете по этому пути, то, конечно, захотите, чтобы основные каналы Интернета вели в главный ЦОД.
Так поступила компания Oco (Уолтем, шт. Массачусетс), построившая ЦОД на расстоянии нескольких миль от своей штаб-квартиры. “Мы можем хоть завтра перенести штаб-квартиру в другое место, а клиенты даже не узнают об этом, поскольку сведения о них хранятся не здесь”, — говорит менеджер сетевых операций Джо Тэйлор.
2. Объединить ресурсы с одной из находящихся неподалеку организаций. Некоторые муниципальные ИТ-менеджеры договариваются о взаимном использовании ЦОДов друг друга для хранения резервных копий и регулярно пересылают туда данные в зашифрованном виде. Такое возможно только при аппаратной совместимости сетей хранения и при наличии необходимого уровня доверия между организациями.
Такой путь выбрали в Мэривиле, шт. Теннесси, заключивший соглашение с ИТ-департаментом близлежащего городка Алкоа и убедивший его продублировать свою систему хранения, созданную компанией Pillar Data Systems.
“У нас не было необходимости ограничивать период DR несколькими секундами, — рассказал Терри Мак-Кой, руководитель ИТ-службы Мэривила. — Наши партнеры из Алкоа рассуждали примерно так же. Поскольку нам нужно было увеличить объем дискового пространства, они купили нашу систему хранения, а мы приобрели более новую модель. При возникновении у нас аварийной ситуации мы переключимся на их ЦОД, а если авария произойдет у них, они смогут использовать наш ЦОД”.
Подобное сотрудничество стало хорошим решением для соседствующих школьных округов в Техасе — Альварадо и Глен Роуз. “Мне необходимо было более надежное решение, чем хранение резервных копий на магнитных лентах на удаленной площадке, — сказал Кайл Бергер, исполнительный директор по техническим услугам округа Альварадо. — Мы связались со школьным округом, удаленным от нас на 150 миль, и создали друг для друга площадки, на которых можно осуществлять восстановление после катастроф. Сейчас мы стремимся распространить нашу сеть и на другие округа штата”.
Каждый округ использует сети хранения производства Compellent. С их помощью производятся репликация данных и шифрование конфиденциальных сведений, например, об учащихся и по финансовым вопросам. “Необходим определенный уровень доверия, — отметил Бергер. — Но каждый участвующий в проекте округ обязан раз в квартал проверить свою сеть хранения и убедиться, что в ней используются самые свежие версии ПО и средств безопасности. Проверки проводит наш общий VAR-реселлер. Это обеспечивает их единообразие для всех”.
3. Использовать один из удаленных офисов компании в качестве резервного. Так поступил банк GreenBank из Гринвила, шт. Теннесси, у которого имеется два офиса. “Каждую ночь мы создаем резервную копию данных объемом 400 Гб и пересылаем ее с одной дисковой системы резервного копирования ExaGrid на другую такую же, расположенную на расстоянии 100 миль, — пояснил ИТ-менеджер Джейсон О’Делл. — Оба ЦОДа постоянно работают. Теперь мне не приходится полагаться на сетевого администратора, чтобы отследить резервную копию и надеяться, что он выбрал нужную магнитную ленту при восстановлении данных. Сотрудники службы технической поддержки могут восстановить данные с помощью всего нескольких щелчков мышкой”.
Верховный суд шт. Луизиана, находящийся в Новом Орлеане, пересмотрел свою стратегию резервного копирования после урагана “Катрина”. “«Катрина» стала для нас проверкой в боевых условиях, — сказал Питер Хаас, директор суда по техническим услугам. — Мы стали гораздо лучше понимать, что к чему. Мы приступили к поиску инструментов, позволяющих устранить единую точку отказа, но без увеличения накладных расходов или численности персонала”.
Суд завершил развертывание резервного ЦОДа в одном из своих офисов, отстоящем от основного на 250 миль. “При необходимости я могу послать туда кого-нибудь, и через 3 ч он будет на месте, — заявил Хаас. — В то же время это достаточно далеко, чтобы не оказаться на пути ураганов, которые нам угрожают. Осуществляется удаленный мониторинг всех событий. Мы можем в течение нескольких минут приступить к использованию резервных компонентов нашей инфраструктуры и не беспокоиться о том, сколько времени займут регулярные процедуры обслуживания”.
Суд использует различные продукты корпорации CA, включая ПО XOsoft High Availability для обеспечения высокой доступности и ARCserve для резервного копирования. “У нас был случай, когда вышла из строя система, обслуживающая почтовые ящики сервера Microsoft Exchange, — пояснил Хаас. — С помощью инструмента WAN sync мы переключились на удаленный ЦОД. Это позволило нам изменить конфигурацию сервера Exchange в основном ЦОДе и тем самым решить проблему. Мы даже совершали такие переключения с помощью ноутбука, подключенного к сети широкополосной сотовой связи Verizon 3G, и виртуальной частной сети (VPN). Это было очень просто”.
4. Использовать облако для создания резервного ЦОДа.
Ассоциации гольфа США (Фар-Хиллс, шт. Нью-Джерси) имеет смысл использовать облако для DR, поскольку это дополняет проводимые ассоциацией операции и служит еще одной гарантией сохранности данных, размещенных на важнейших серверах.
“Если бы я пошла по пути создания второго собственного ЦОДа для DR, его оборудование в основном простаивало бы, — отметила Джессика Кэрролл, ИТ-директор ассоциации. — Это бессмысленная трата денег. А поскольку за несколько месяцев системы устареют, такой план хранения резервных копий является далеко не самым эффективным. Облако обеспечивает разумную гибкость и выгодные условия восстановления данных”.
Другая ассоциация гольфа, Professional Golf Association Tour из Понте-Ведра, шт. Флорида, тоже пользуется облаком. До прошлого года она оплачивала годовую подписку на доступ к удаленному ЦОДу.
“Проблема с DR по подписке заключалась в том, что нам приходилось отправляться в ЦОД, загружать с магнитных лент данные и приложения, после чего наши специалисты получали к ним доступ, — рассказал CIO ассоциации Стив Эванс. — Ураганы не позволяют выслать наших людей самолетом до начала эвакуации. Так что при прежнем порядке нам потребовалось бы примерно четыре дня, чтобы все наладить”.
Поскольку ассоциация создавала новые приложения и расширяла свою систему управления ресурсами предприятия, она сочла подписку устаревшей и неудовлетворяющей ее требованиям моделью. Ассоциация выбрала площадку CDW в Мэдисоне, шт. Висконсин, для постоянной репликации там ключевых серверов с помощью вычислительного облака. “Благодаря новой системе мы можем возобновить работу всего через несколько часов после катастрофы. И новая система обладает гораздо большей гибкостью, позволяя нам тестировать поведение отдельных приложений при переходе на запасной вариант и упрощая планирование обновлений”, — считает Эванс.
Учиться на ошибках
Kelley Drye — международная юридическая фирма. Ее офисы на Манхэттене пострадали при взрыве паропровода в 2007 г. “Мы шесть дней не могли попасть на свои рабочие места. Тогда у нас не было толкового плана DR”, — рассказал ИТ-директор Том Нос.
С тех пор фирма стала пользоваться несколькими сервисами, обеспечивающими непрерывность бизнеса. Среди них — размещение серверов на удаленной площадке другой компании и функционирующая в облаке система электронной почты. “Мы планировали разместить свои серверы в ЦОДе Джерси-Сити, шт. Нью-Джерси, и на случай DR создать там же почтовую систему на основе вычислительного облака. В конечном счете мы перенесли все наши серверы в этот ЦОД, — заявил Нос. — Кроме того, мы используем сервисы управления электронной почтой корпорации Dell, чтобы в случае катастрофы восстановить почтовую систему для всей фирмы”.
Kelley Drye создает в облаке копию данных своего сервера Microsoft Exchange и передает их сервису Dell. В случае аварии пользователи могут получить доступ к своим электронным сообщениям, используя веб-браузер и защищенный URL-адрес. “Мне не придется заменять DNS-серверы, а мои пользователи могут сразу же приступать к исполнению своих обязанностей, предоставив мне достаточно времени для проведения невидимой миру работы по восстановлению сервисов”, — пояснил Нос.
При любом использовании облака для DR в первую очередь следует обращать внимание на качество технической поддержки со стороны провайдера. “Одна из причин, по которым мы решили использовать сервисы Dell, заключалась в том, что мы длительное время применяли оборудование производства этой корпорации и убедились в высоком качестве технической поддержки”, — сказал Нос.
Независимо от выбранной вами стратегии регулярно проверяйте, как осуществляется полный переход на использование резервного ЦОДа. Некоторый из этих тестов следует проводить при такой же нагрузке, которую испытывают ваши производственные системы. В противном случае вы не получите полной картины.
Компания Tidewater Marine из Нового Орлеана ежегодно тестирует свои DR-системы. Но когда резервный сайт был поставлен под нагрузку, обнаружилось, что его архитектура не позволяет справиться с таким объемом работы, заметил ИТ-директор Джон Чаффи. “Построенная нами резервная сеть хранения данных поначалу не в полной мере соответствовала спецификациям основной сети хранения”, — признался он.
Это можно считать еще одним уроком.