ТЕХНИЧЕСКИЙ ОБЗОР
Любому системному администратору, ответственному за бесперебойность и качество работы корпоративной сети, следует знать, как установить бесперебойный источник питания (БИП) и организовать резервное сохранение информации серверов и пользователей. Такие операции составляют неотъемлемую часть повседневной жизни.
Однако следующий уровень организации восстановления после сбоев и их предотвращения обычно требует больших умственных усилий.
Прежде всего нужно определить, какого типа сбои могут реально произойти в сети и сколько денег вы готовы потратить на проведение профилактических или восстановительных мероприятий.
Если ваша компания может пострадать от землетрясения, то план восстановления после аварии будет при необходимости более сложным, чем аналогичный план компенсации ущерба после пожара или наводнения. Однако во всех этих случаях полный план восстановления после аварий будет включать не только механизм восстановления данных.
ОСНОВЫ АРХИВНОГО СОХРАНЕНИЯ
Существующих стандартных методов архивного сохранения данных скорее всего достаточно при сравнительно простых сбоях, например, в случае отказа сервера.
Если необходимо поддерживать непрерывный технологический процесс или простой сервера серьезно сказывается на прибыли, то хорошо было бы применить одну из технологий "зеркального" сервера.
Для организаций, работающих в сети NetWare, где финансовые ограничения не слишком суровы, можно использовать пакет NetWare SFT III. Но это дорогое удовольствие, так как каждый защищаемый сервер должен иметь зеркальное отображение на таком же сервере и лицензию NetWare. Однако для среды NetWare не существует более простого и эффективного средства. Есть также ряд более дешевых по сравнению с NetWare SFT III продуктов для NetWare третьих фирм, но они не обладают той полнотой функций, которая позволяет SFT III обеспечивать практически непрерывное нормальное функционирование защищаемых им серверов.
Cоветы и хитрости
Например, пакет StandbyServer корпорации Vinca работает очень похоже на SFT III, но не может осуществить безопасное переключение на резервную аппаратуру. К другим альтернативам SFT III относятся продукты LANshadow фирмы Horizon Technology и NoStop Network фирмы Nonstop Networks.
Аналогичные возможности для серверов под Windows NT предоставляет пакет Octopus Real Time Data Protection фирмы Octopus Technologies.
Независимо от типа используемой сетевой ОС для предотвращения сбоев и обеспечения последующего восстановления работы системы следует предпринять весьма простые действия.
ПРИНЦИП ИЗБЫТОЧНОСТИ
Во-первых, всегда имейте в запасе элементы аппаратуры, часто выходящие из строя. Дисководы, источники питания, платы сетевого интерфейса и микросхемы памяти сравнительно недороги, и их целесообразно держать под рукой.
Во-вторых, точно помните, где хранятся установочные дискеты вашей сетевой ОС, а также всех важных сетевых и пользовательских приложений. Иногда файлы на носителях искажаются; кроме того, часто целые часы продуктивной работы (читай: дохода) пропадают из-за того, что ПО находится в неудачном месте. Помните, что если пользовательские приложения были установлены в сети либо для запуска с сервера, либо для последующей установки на машинах - клиентах сети, то они будут потеряны, если сеть недоступна.
В-третьих, храните резервные копии конфигураций клиентов. Если вам удалось стандартизовать пользовательские конфигурации, это будет нетрудно, однако помните, что для каждой записи конфигурации системы необходимо иметь отдельную резервную копию.
Если стандарта пользовательской конфигурации не существует, то администратор сети должен убедиться, что каждый пользователь имеет резервную копию своей собственной конфигурации, а также восстановительные дискеты в случае, если операционная система (например, Windows NT) предлагает ему возможность их создания.
Обязательно запишите на бумаге координаты сотрудников, ответственных работников, служб технической поддержки, а также сервисных служб - местной телефонной компании, службы обеспечения связи с глобальными сетями и провайдера услуг Internet.
Обеспечьте себе постоянный доступ к информации о сетевом инвентаре, включая сведения о том, где какое установлено оборудование и для чего оно используется, где хранятся резервные данные или аппаратура и, конечно, бумажные копии плана восстановления после аварий.
Корпоративный план восстановления после аварий предписывает, что и в какой последовательности нужно делать для восстановления деятельности отделов или рабочих групп, каков минимальный допустимый режим работы и кто за что отвечает.
ЧТО ДЕЛАТЬ, ЕСЛИ ДЕЛА СОВСЕМ ПЛОХИ?
Все указанные действия описаны для случая, когда авария не затрагивает помещение, в котором расположено сетевое оборудование. На протяжении многих лет магазины, продающие мэйнфреймы, вынуждены были бороться за качество помещений, поскольку старая большая аппаратура очень чувствительна к изменениям окружающей среды.
Несколько лет назад в большом вычислительном центре с машинами IBM при отключении кондиционеров создавалась аварийная ситуация. Хотя локальные сети на базе ПК не столь чувствительны к проблемам такого рода, все же следует предусмотреть свои действия, если в помещении, где установлен сервер, отключится кондиционер.
Центры данных, расположенные в безопасном месте, могут дублировать оборудование сервера и носители данных, однако стоит такое дублирование чрезмерно дорого независимо от того, имеет ли фирма свой собственный центр или использует другие ресурсы. Если фирма может себе позволить такой вариант, то это - лучшее решение вопроса. Сейчас имеются продукты, позволяющие организовать зеркальное отображение деловых данных через глобальную сеть, причем можно почти в реальном времени переключиться на резервный центр данных в случае аварии.
ДЭВИД П. ЧЕРНИКОФФ