Эрик фон Швебер
PC Week Labs изучает способы восстановления сетевых ОС после аварий и объясняет, как этих аварий избежать
Компьютер HAL 9000 в фильме “Космическая одиссея 2001 года” как-то сообщил одному из членов экипажа, что истоками всех компьютерных аномалий являются ошибки людей. И хотя статистика не подтверждает это высказывание, она свидетельствует, что ошибка человека, несомненно, может усугубить сложную ситуацию.
Представители фирмы Ontrack Data International, уже несколько лет исследующей проблему утраты и искажения данных, утверждают, что лишь в 32% случаев причиной отказа дисковых и ленточных накопителей становится ошибка человека. Несмотря на то что, согласно исследованиям Ontrack, к неисправности оборудования электромеханические повреждения приводят чаще, чем неправильные действия людей (см. диаграмму), тем не менее администраторы и служащие, переоценив свои знания, опыт и возможности доступных средств, значительно усложняют или делают невозможными восстановительные работы.
Даже минимальные меры предосторожности могут вам сильно помочь, если вдруг придется восстанавливать данные в сети. Восстановление данных с поврежденных носителей это последнее средство обороны. Гораздо предпочтительнее систематически делать резервные копии, проверять полноту содержащихся в них данных и периодически производить “тренировочное” восстановление, чтобы удостовериться в отлаженности процесса сохранения/восстановления.
В Тестовом центре PC Week Labs мы выяснили, что, хотя сетевых операционных систем (NOS Network Operating System), невосприимчивых к повреждениям, не бывает, файловые системы Windows NT (корпорации Microsoft) и NetWare (фирмы Novell) все же имеют некоторое превосходство над файловыми системами Unix, если говорить о их способности к восстановлению после некорректных действий оператора.
С другой стороны, RAID-системы обладают повышенной устойчивостью к сбоям. Правда, при этом процесс восстановления данных в этих системах значительно более сложен. Кроме того, они слишком чувствительны к ошибкам оператора. Если вы используете ОС Unix либо RAID-массив (неважно, под какой NOS), вам следует обратить особое внимание на подготовку и опыт операторов.
Сетевая файловая система NOS значительно больше и сложнее файловой системы DOS, к тому же данные, хранимые в сети, имеют, как правило, большую ценность. Следовательно, программа для DOS или Windows за $39,95, с помощью которой можно восстановить поврежденную презентацию на мобильном компьютере, абсолютно не подходит для использования в корпоративной сети.
Общие проблемы
Ни одна NOS не может противостоять электромеханическим повреждениям. Если такое повреждение произойдет, необходимо как можно скорее выключить неисправное устройство. Ни в коем случае нельзя запускать программы проверки и/или лечения для физически поврежденных накопителей это лишь ухудшит их состояние и снизит вероятность восстановления.
Кроме аппаратных сбоев причиной повреждения системной области сетевого диска могут стать, хотя и несколько реже, некачественное ПО и вирусы, такие, как Michelangelo и Stoned. Часто системную область удается восстановить, если только не в меру рьяные и недостаточно квалифицированные работники не усложняют ситуацию, например, пытаясь переустановить NOS, тем самым довершая дело, начатое вирусом.
Зачастую самые большие препятствия, мешающие эффективному восстановлению данных, создают сами администраторы, которые из чувства ответственности за потерю данных начинают бессистемно применять программы проверки и исправления ошибок на магнитном диске. Это может привести к дополнительному разрушению информации.
Скорая помощь от NetWare
Каждая NOS предлагает свой вариант ПО для восстановления. Пользователи NetWare в случае аварии обращаются к VRepair, утилите восстановления жесткого диска, входящей в комплект поставки. VRepair вполне подходит для устранения многих неисправностей, однако когда требуется исправить несколько тысяч ошибок за один раз, она может привести к дополнительному повреждению.
Со стороны администраторов будет весьма разумно запускать VRepair вручную в режиме сканирования, в котором создается протокол проверки и не исправляются ошибки. Если неисправностей окажется не очень много, для их устранения можно повторно запустить VRepair.
В случае, когда сетевой том становится невидимым или неподключаемым, специалисты из отдела ИТ часто пытаются создать том заново. При этом FAT (таблица размещения файлов) затирается и волей-неволей приходится для восстановления данных обращаться к услугам профессионала, хотя грамотный администратор в такой ситуации мог бы устранить неисправность и сам. Восстановить можно только те файлы, размер которых меньше или равен размеру кластера, установленному при первом создании тома (для NetWare версии 4.0 и выше он составляет 64 кб, для более старых 4 или 8 кб).
Администраторам сетей NetWare следует учитывать еще одну особенность: если при резервном копировании зеркалируемого тома произойдет аварийное завершение работы, поврежденными окажутся не только резервная копия, но и таблицы описателя тома (Volume Descriptor), оперативной корректировки (Hotfix) и зеркалирования. На время резервного копирования мы рекомендуем в целях безопасности отключить зеркальный диск, а затем заново его создать.
Повреждение Windows NT
У администраторов, обслуживающих Windows NT, заботы примерно такие же; они сталкиваются с теми же видами и причинами повреждений и располагают аналогичными средствами для устранения неисправностей. Программа установки NT по умолчанию устанавливает опцию автоматического запуска утилиты Check Disk при загрузке компьютера. При этом утилита не только проверяет диски, но и пытается исправить найденные ошибки, не запрашивая подтверждения.
Так как Check Disk может ухудшить состояние поврежденных данных, администраторам следует перенастроить NT, запретив обязательный запуск Check Disk, и запускать его вручную в режиме “только проверка”.
Специалистам, предполагающим, что проблему исчезновения данных можно решить путем переустановки NT, следует подумать еще раз. При переустановке ОС главная таблица файлов (Master File Table) будет затерта, что лишь усложнит положение. Хотя после подобных упражнений диск становится кандидатом в клиенты службы профессионального восстановления данных, этого можно избежать. В NT даже высокоуровневое форматирование диска несмертельно. Все версии NT сохраняют информацию о файлах на всех дисках, и профессионалу не составит большого труда найти эту информацию, чтобы восстановить главную таблицу файлов.
К сожалению, удаленные файлы восстановить не так легко. Имеется вероятность “воскрешения” файлов на нефрагментированном диске под NT 3.51, но под NT 4.0 это практически нереально. Такова цена прогресса.
Изменение конфигурации системы, например установку дополнительных накопителей, стоит производить с особой осторожностью. Информация из системного реестра должна быть скопирована и сохранена. Это может понадобиться при сборке RAID-массива из отдельных накопителей после изменения конфигурации.
Утилита NT Disk Administrator позволяет создать дискету аварийного восстановления, с помощью которой можно восстановить системный реестр и таблицу разделов. Такая дискета будет очень полезной специалистам по восстановлению данных. После каждого изменения дисковой конфигурации необходимо создавать новую аварийную дискету.
Инструменты Unix
Когда операторы Unix-систем не “видят” или не могут подключить файловую систему, они порой запускают утилиту makefs, предназначенную для создания файловой системы. Это большая ошибка, поскольку makefs перезаписывает раздел inodes, в котором Unix хранит данные о файловой структуре. Это приводит к потере данных, и тут даже профессиональные инженеры по восстановлению вряд ли смогут помочь.
В менее катастрофических ситуациях очень полезной может оказаться аварийная загрузочная дискета, аналогичная дискете аварийного восстановления для NT и создаваемая при установке ОС.
Администраторы должны помнить, что реализации Unix разных поставщиков уникальны; несмотря на одинаковые интерфейс командной строки, интерфейс программного взаимодействия, функции и утилиты, составляющие Unix, они имеют различную организацию хранения данных на дисках. Таким образом, хотя файловые системы разных реализаций Unix выглядят одинаково, основы их совершенно разные. Прежде чем начинать восстановление данных под Unix, администратору следует проконсультироваться у опытного эксперта, специализирующегося на конкретной модификации Unix.
Да здравствует RAID!
Работая с RAID-устройствами, администраторы, будучи абсолютно уверенными в сохранности данных на RAID-массивах, не делают резервных копий. Это очень серьезная ошибка. Сбои на RAID-системах происходят, конечно, реже, чем на одиночных накопителях, но когда это все-таки случается, последствия оказываются более серьезными.
Получив от RAID сообщение об отказе диска, неквалифицированные работники часто заменяют не тот накопитель из-за того, что не знают об используемом RAID способе нумерации, при котором первый диск имеет номер 0, а не 1. При поломке охлаждающего вентилятора перегреваются все диски массива, и RAID оказывается не в состоянии воссоздать целостный набор данных. В такой ситуации приходится восстанавливать данные на всех дисках массива, а не на одном отдельном накопителе.
Даже незначительная модернизация RAID-системы, например замена контроллера, может привести к серьезным последствиям. Дело в том, что информация о расщеплении данных и битов четности и о нумерации дисков хранится в ПЗУ контроллера. При удалении платы контроллера вместе с ней удаляется ПЗУ и, как следствие, исчезает возможность доступа к данным.
Что может сделать служба восстановления данных
Какие действия надо предпринять, когда возникает необходимость в восстановлении данных? Прежде всего, если есть подозрение, что произошла утрата или повреждение данных, которые невозможно восстановить с резервных копий, надо поручить операцию квалифицированному работнику. Это самая надежная гарантия того, что повреждения будут минимальными.
Вначале сотрудники службы профессионального восстановления изучат ситуацию и посоветуют клиенту, что лучше предпринять. В большинстве случаев накопители придется отправить специалисту по восстановлению. С помощью инструментов низкоуровневого доступа данные с диска будут извлечены и реструктурированы, а затем возвращены заказчику на компакт-диске, ленте или на диске, эквивалентном отказавшему.
Некоторые компании, занимающиеся восстановлением, включая Ontrack, сотрудничают с производителями НМД и поставщиками оборудования (OEM), обеспечивая замену дисков, находящихся на гарантийном обслуживании.
В будущем параллельно с NOS будут устанавливаться небольшие специализированные операционные системы, подобные Data Advisor 3 фирмы Ontrack, производящие общий мониторинг состояния накопителей, а также удаленную диагностику и исправление неаппаратных ошибок.
Эрик фон Швебер руководитель аналитической компании Infomaniacs (Седона, шт. Аризона). Связаться с ним можно по электронной почте: thinktank@infomaniacs.com или по Web-адресу: www.infomaniacs.com.