Уроки прошлого позволяют минимизировать последствия аварий
Паула Мусич, Эван Кобленц
Уроки и выводы, извлеченные из результатов террористических атак 11 сентября 2001 г., сослужили ИТ неплохую службу во время августовской аварии сетей электроснабжения США и Канады. В итоге значительную потерю данных понесли лишь немногие компании.
Нью-Йорке у работающих телефонов собрались огромные очереди
Однако работа по общей оценке ущерба затянулась на целую неделю, и энергетический сбой, очевидно, преподал новую серию уроков, которые могут стимулировать интерес к проблемам готовности и резервирования систем, а также архивирования данных.
Как сообщили в IBM, ее службы поддержки непрерывности бизнеса и восстановления в составе IBM Global Services работали со своими клиентами в продолжение пяти минут после отключения электричества. Корпорация не раскрывает данных о количестве получивших помощь клиентов, однако известно, что ею были задействованы резервные ресурсы в Нью-Йорке, Торонто, Вашингтоне и Филадельфии, а также в штате Колорадо.
Работа прошла достаточно гладко, потому что после событий 11 сентября многие компании в своих планах по обеспечению непрерывности бизнеса стали предусматривать не только использование распределенных систем, но и разделение обязанностей людей. "Фирмам было известно, кто должен звонить, кто принимает решения, куда обращаться с вопросами о восстановлении", - сказал Пэт Коркоран, директор по развитию бизнеса служб IGS (Стерлинг-Форест, шт. Нью-Йорк).
Авария нарушила коммуникации |
От блэкаута-2003 пострадали коммуникации, так как многие новые, не имевшие зарезервированных ресурсов системы IP-телефонии пришли в бездействие и вышел из строя целый ряд беспроводных служб. И хотя кто-то из сотовых операторов пережил массовое отключение электроэнергии лучше других, всем пришлось осознать тот факт, что даже беспроводная технология зависит от электричества. Фирмы Sprint PCS Group, AT&T Wireless Services, T-Mobile USA и Cingular Wireless сообщили о серьезных проблемах, вызванных аварийным отключением вышек в сочетании с почти четырехкратным увеличением переговорного трафика. У Verizon Wireless (Бедминстер, шт. Нью-Джерси), по словам ее представителей, проблем было меньше, так как по сравнению с конкурентами компания запаслась резервными генераторами и батареями. В то время как большинство центров коммутации остались работоспособны, местные сотовые станции от отключения сильно пострадали. Руководители Sprint (Оверленд, шт. Канзас) рассказали, что после 11 сентября 2001 г. компания установила в центрах коммутации дополнительные крупные генераторы. Кроме того, атаки террористов побудили операторов в чрезвычайных ситуациях управлять очередностью соединений. Sprint пришлось заблокировать порядочное количество входящих звонков (конкретные цифры не сообщаются), чтобы оставить место для аварийных вызовов. Пострадавшие от аварии энергетической системы столкнулись также с проблемой истощения батареек сотовых трубок. Стефен Майер, управляющий компании Handshake Dynamics (Нью-Йорк), специализирующейся на консультациях по менеджменту, заплатил 10 долларов владельцу соседнего гастронома за перезарядку сотового телефона от его генератора. "Многие из моих друзей, - говорит он, - пользовались IP-телефонами или бесшнуровыми аппаратами обычной телефонной сети и тоже попали в неприятное положение". В отдельных случаях компании лишились соединений по линиям ISDN и T-1, хотя эти каналы связи не зависят от энергоснабжения клиентских площадок. Сразу после отключения энергии резко возросла интенсивность передачи мгновенных сообщений, на что, по-видимому, повлияло сужение возможностей корпоративной телефонии. По данным IM-провайдера Omnipod (Манхэттен), обслуживающего много нью-йоркских фирм, в первые часы отключения электричества его сетевой трафик вырос на 30-35%.
Кармен Нобель и Кэрон Карлсон |
По словам официальных лиц SunGard Availability Services (Уэйн, шт. Пенсильвания), их клиенты уже через несколько часов после аварии (более точные цифры зависят от сервисных контрактов) смогли вернуться к нормальному функционированию.
После 11 сентября в SunGard площади сервисных помещений в районе Нью-Йорка расширили на 9000 кв. м и наняли тысячу человек в штат восстановления. Восемь из 38 сервисных площадок SunGard смогли обслужить во время отключения электричества 66 компаний, насчитывающих более 2100 пользователей.
Системы большинства предприятий региона, особенно крупных компаний городских центров, укрепивших после 11 сентября свои инфраструктуры, неплохо выдержали испытание.
Некоторые пользователи из организаций, в которых ИБП (источники бесперебойного питания) защищали серверы, но не системы кондиционирования воздуха, все же столкнулись с потерей данных из-за перегрева жестких дисков. Многие администраторы отмечают, что отключение произошло, к счастью, днем, а не ночью, когда обычно производится архивирование на ленту.
По словам Ларри Лемье из Университета Райерсон в Торонто, значительно улучшилась финансовая поддержка со стороны начальства в таких вопросах, как покупка дизельных генераторов. Новая система бесперебойного питания, говорит Лемье (он работает помощником директора по вычислениям и коммуникациям), себя полностью оправдала. Университет испытал повторное отключение энергии в момент перезагрузки нескольких серверов, однако базы данных Oracle, обладающие возможностью самовосстановления, от этого не пострадали.
В то же время Эрик Шоу, возглавляющий консалтинговую фирму Assured Technologies (Минеола, шт. Нью-Йорк), чуть не попал в беду. Их клиент - средняя компания, обслуживающая водоканализационные сети и имеющая около 40 специализированных автомашин, - лишился доступа к дискам своего главного сервера. Была потеряна очень важная информация, что могло привести к краху бизнеса. Положение спасла фирма Kroll Ontrack (Эден-Прери, шт. Миннесота), специализирующаяся на восстановлении данных: по словам Шоу, за какие-то три-четыре тысячи долларов она помогла прочесть важную информацию, хранившуюся на дисках.