БЕЗОПАСНОСТЬ
Уроки 11 сентября глазами корпорации EMC2
Летчики и пожарные, шахтеры и подводники утверждают, что многие нормы и правила “пишутся кровью”. После 11 сентября в эти “кровавые скрижали” попали и инструкции по построению ИТ-инфраструктур компаний. Хотя в информационных технологиях цена ошибки, как правило, не столь высока, для многих организаций, чье успешное функционирование так или иначе зависит от целостности данных, надежность их информационной системы и особенно средств хранения данных является одним из основных факторов выживаемости в случае катастроф.
Вице-президент EMC Лео Миклас:
“Главным достоянием компании являются люди и информация.
Только защищая оба этих ресурса можно добиться успеха в бизнесе”
О том, как повели себя катастрофоустойчивые решения во Всемирном торговом центре Нью-Йорка и какие выводы сделали из этого руководители организаций и ИТ-служб, шла речь на совместной конференции “Катастрофоустойчивые информационные системы: архитектура, технологии, мировой и российский опыт”, которую провели компания “ТехноСерв А/С” (www.technoserv.ru) и корпорация EMC2 (www.emc.com). Среди участников конференции были представители МВД, Налоговой полиции, МПС, МГТС, Госкомстата, ГТК, Минатома, ЦБ РФ и коммерческих банков, АвтоВАЗа, “Лукойла”, “МТУ-Интел”, “Ростелекома”, “Русского Алюминия”, РАН и прочих организаций, которые обязаны продолжать работать, несмотря на все неприятности, возможные в наше непростое время.
На конференции представители EMC познакомили собравшихся с основными принципами и архитектурными решениями построения катастрофоустойчивых ИС масштаба предприятия, с продуктами и технологиями, на которых базируются подобные решения. О применении подобных технологий в России рассказал руководитель ИТ-департамента компании “Русский Алюминий Менеджемент” Олег Симаков. Он познакомил слушателей со структурой корпоративного ВЦ, обслуживающего 18 заводов компании, и с опытом его эксплуатации. За время существования ВЦ произошел один аварийный случай, когда отказала система кондиционирования серверной и пришлось перейти на резервную серверную, расположенную в соседнем здании. Практическим опытом создания катастрофоустойчивых решений поделилась компания “ТехноСерв А/С”. Но с наибольшим нетерпением слушатели ждали доклада директора по поддержке решений EMC в Европе Тома Бернста, осветившего события 11 сентября и рассказавшего, какие уроки извлекла из этой трагедии корпорация EMC.
Во Всемирном торговом центре располагалось 27 компьютерных центров. Большинство из них были и остаются клиентами корпорации EMC. Все заказчики, использовавшие технологию SRDF и имевшие резервные центры на севере Манхэттена или за рекой Нью-Джерси, восстановили свою работу, не потеряв ни одной транзакции. У одного из заказчиков резервный центр размещался в соседней башне+
Чему же научилась ЕМС?
До 11 сентября катастрофоустойчивые решения строились, как правило, в расчете на что-то не очень серьезное, ну, например, на прорыв трубы с горячей водой (как это случилось в Сити-банке). В таком случае полагалось остановить основной ВЦ, перевести работу на резервный, а после ликвидации аварии включить все снова. Нью-йоркская трагедия показала, что могут происходить события, не предусмотренные таким сценарием.
Раньше при планировании восстановления информации как-то не думали о том, кто же будет физически находиться в резервном центре обработки? Кто станет осуществлять процедуру восстановления? Подразумевалось, что те же самые люди, которые находились в основном центре, перейдут в резервный и займутся восстановлением информации. Но 11 сентября преподало ряд горьких уроков. Один из важнейших состоит в том, что в резервном центре обязательно должны находиться сотрудники, знающие, как его запустить в случае катастрофы, и что большая часть работы по восстановлению должна быть автоматизирована.
Второй урок - необходимо поддерживать хорошие отношения с поставщиками, дополнительно протестировать все бизнес-процессы и составить соответствующие соглашения на случай подобных катастроф.
Чем правило банальнее, тем труднее провести его в жизнь. Например, все прекрасно знают о необходимости резервного копирования; соглашаются с тем, что это совершенно необходимое действие. Известно, что большая часть важных данных хранится и обрабатывается на ПК пользователей. Многие ли делают резервные копии этой информации? Поэтому в план по восстановлению должны включаться данные, находящиеся как на серверах, так и на ПК.
Обычно считается, что после ликвидации аварии можно будет вернуться в основной центр данных, но 11 сентября показало, что это не так. Все заказчики ЕМС (кроме одного) смогли перенести обработку в резервный центр, который стал выступать в качестве основного, и они оказались в той же мере незащищенными, как и до внедрения катастрофоустойчивого решения. Поэтому о такой ситуации следует позаботиться заранее, чтобы в случае полной потери основного центра у вас были бы договоры или соглашения на создание альтернативного. Если у вас есть запасная площадка, куда можно быстро привезти оборудование и начать монтаж, то ваши поставщики и партнеры смогут незамедлительно оказать вам помощь?
Все ведущие поставщики - IBM, Sun, HP и EMC - помогли своим заказчикам пережить катастрофу. EMC безвозмездно поставила оборудования на много миллионов долларов для быстрого создания новых резервных центров.
Кое-кто считает, что материальная бумажная форма документа надежнее призрачной электронной. Это заблуждение с точки зрения восстановления после катастроф. Вспомните улицы Манхэттена после обрушения зданий, усеянные тоннами бумаг. Вероятность отыскать в этой куче нужный документ еще меньше, чем пресловутую иголку в стоге сена. Поэтому все бумажные носители должны иметь электронные копии. Некоторые комании, такие, как Cisco или Dell, не принимают бумажные носители ни в какой форме. Если кому-то захочется пригласить руководителя Cisco Systems Джона Чемберса на вечеринку, то придется послать ему письмо по электронной почте, на официальное бумажное приглашение он просто не ответит. Поэтому многие компании сканируют бумажные носители. В идеальном случае - все без исключения.
В заключение несколько коротких советов.
С точки зрения скорости восстановления бизнеса предпочтительно иметь зеркалированные центры. Сохранение информации на лентах значительно удлиняет время восстановления.
Чаще проверяйте свою готовность к нештатным ситуациям. Качественная, но плохо управляемая инфраструктура не многим лучше неграмотно спроектированной.
Как можно больше внимания обращайте на системы управления ресурсами и изменениями в ИТ-инфраструктуре. Тогда в случае катастрофы поставщики смогут восстановить актуальное состояние ВЦ.
Чаще тренируйтесь. Некоторые компании в качестве таких учений регулярно меняют ролями основной и резервный центры, так что для обслуживающего персонала переход на резервный центр становится рутинной работой.