НАКОПИТЕЛИ

Интерес к использованию в дисковых массивах дешевых винчестеров, выпускаемых для настольных ПК, возник еще в конце прошлого десятилетия, однако эти системы так и не смогли составить достойную конкуренцию более дорогим RAID-массивам на базе интерфейсов SCSI и Fibre Channel из-за низкой надежности и недостаточной производительности накопителей на интерфейсе ATA (AT Attachment, другое название - IDE). Единственный сектор, где до сих пор широко применялись дисковые массивы ATA, - это подключаемые напрямую к сети системы хранения (NAS) начального уровня, рассчитанные на обслуживание небольших компаний и рабочих групп и чаще всего оборудованные только четырьмя накопителями.

Схема использования NetApp NearStore

Аналитики отмечают, что за последний год интерес к ATA-массивам в корпоративном секторе резко вырос и нынешней весной подобные системы уже представили такие известные производители систем хранения, как EMC (www.emc.com), Network Appliance (www.netapp.com) и Quantum (www.quantum.com). Первые две компании до сих пор не выпускали продуктов на базе дисков ATA. Такой всплеск популярности ATA-массивов вызван прежде всего лавинообразным ростом объемов информации и связанными с ним проблемами резервного копирования, с которыми сейчас столкнулись многие крупные компании. По оценкам аналитиков, объем данных, хранимых на дисках в корпоративных ИТ-системах, каждый год возрастает в два-три раза и соответственно требуется больше времени для резервного копирования на ленту. Обычно при резервном копировании RAID-массива работа основных приложений серверов приостанавливается, отсюда увеличение продолжительности этой операции, что ведет к снижению доступности сервера, а значит, и эффективности работы всей ИТ-инфраструктуры предприятия.

Для решения данной проблемы необходимо найти способы ускорения резервного копирования. Узкое место данного процесса - скорость записи на ленту, которая значительно меньше, чем у жестких дисков. Хотя разработчики новых форматов SuperDLT и Ultrium добились улучшения производительности ленточных накопителей, разрыв между скоростью чтения информации с дисков RAID-массива и записи ее на кассеты в ленточной библиотеке по-прежнему сохраняется.

Выходом из этой ситуации является добавление в схему резервного копирования высокоскоростной памяти для временного хранения копируемых данных, откуда они затем переписываются на ленту. В результате сама операция резервного копирования разбивается на два этапа - быстрое копирование с RAID-массива во временное хранилище и затем медленная запись на ленту, во время которой RAID-массив работает в обычном режиме и может обслуживать запросы от серверных приложений.

Почему на роль такой кэш-памяти резервного копирования лучше всего подходят массивы из ATA-дисков? Хотя по быстродействию дешевые винчестеры уступают жестким дискам с интерфейсом SCSI или Fibre Channel, запись на них происходит в несколько раз быстрее, чем на ленту, а следовательно, их применение существенно сокращает время резервного копирования данных с RAID-массива. Кроме того, из-за непрекращающейся все последние годы ценовой войны между производителями дисков с интерфейсом ATA стоимость хранения 1 Гб информации для этих накопителей постоянно снижается.

NetApp NearStore и Quantum DX30

Одними из первых дисковые массивы ATA для резервного копирования (backup array) весной 2002 г. выпустили Network Appliance и Quantum. NetApp NearStore R10 масштабируется до семи 12-дисковых модулей общей емкостью 12 Тб, а 30-дисковый Quantum DX30, выполненный в конструктиве высотой всего 2U, обеспечивает емкость 3 Тб (до конца года за счет сжатия ее планируется увеличить до 5,4 Тб). По сообщениям Quantum, ее дисковый массив способен за час скопировать 140 Гб, что в восемь раз быстрее скорости копирования большинства ленточных библиотек. Продукт NetApp стоит около $250 000, а Quantum - $45 000.

Хотя оба массива рассчитаны на выполнение одной и той же задачи, все же их функциональность значительно отличается, что связано с ориентацией производителей на разные секторы рынка систем хранения.

NetApp известна прежде всего как производитель NAS старшего класса (так называемых файлеров), поэтому NearStore не только использует те же специализированные операционную и файловую системы, что и выпускаемые этой компанией NAS-системы, но и предназначен прежде всего для обслуживания файлеров. По сообщениям в прессе, NearStore уже применяется для резервного копирования в корпорации Cisco, в которой установлено 550 файлеров.

После того как Quantum продала в 2000 г. отделение жестких дисков, основным направлением бизнеса этой компании стали ленточные приводы, а также выпускаемые ее подразделением ATL библиотеки на магнитных лентах. По этой причине Quantum ориентирует свое решение на ленточные библиотеки ATL: DX30 эмулирует модель ATL P1000 и пакеты резервного копирования используют дисковый массив как обычную ленточную библиотеку, а переписыванием данных на реальные ленточные накопители управляет встроенное ПО. Как утверждает Quantum, применение дискового массива типа backup array не требует каких-либо изменений в процессе резервного копирования на ленточные библиотеки ATL или в настройках ПО.

Стоит отметить, что в первоначальных анонсах NearStore назывался альтернативой ленточным библиотекам, однако затем NetApp отказалась от такого позиционирования своего дискового массива, поскольку цена хранения 1 Мб данных для него приблизительно равна двум центам, что примерно в 20 раз превосходит стоимость хранения на лентах. Таким образом, и NetApp, и Quantum ориентируют свои дисковые массивы ATA, дополняющие системы архивирования на магнитных лентах или магнитооптике, только на временное хранение данных при резервном копировании. Однако уже появилась дисковая система ATA, предназначенная именно для архивирования данных.

EMC Centera

Назначение дискового массива Centera компании EMC - хранение архива структурированных данных, например писем электронной почты, отсканированных чеков или рентгеновских снимков. EMC предлагает называть подобные типы данных fixed content и, ссылаясь на данные исследований аналитиков, утверждает, что со временем доля такого контента в общем объеме информации будет постоянно увеличиваться.

Для более эффективной организации архива фиксированного контента в Centera применяется система объектной адресации, принципиально отличная от обычных файловых систем. По словам представителей EMC, использование уникального для каждого объекта адреса вместо идентификатора файла или физического адреса блока данных оптимизирует организацию хранения больших объемов информации и обеспечивает защиту архива от несанкционированных изменений (например, “дорисовывания” нескольких нулей в отсканированный чек). Для обращения приложений к записанным на Centera данным служат API-интерфейсы, включающие только четыре команды - чтения, записи, проверки существования объекта и удаления, поэтому, как считают в EMC, интеграция ее дискового массива и имеющегося прикладного ПО в большинстве случаев не вызовет серьезных проблем. Сейчас Centera поддерживает API для приложений Windows, Solaris и Linux, а в ближайшие месяцы разработчики ее ПО планируют реализовать поддержку HP-UX и AIX.

Аппаратная часть Centera - это 16 четырехдисковых модулей общей емкостью около 10 Тб, устанавливаемых в одной стойке. До 16 массивов Centera можно объединить в кластер. В свою очередь до семи кластеров Centera объединяются в домен с максимальной емкостью свыше одного петабайта (1024 Тб). В базовой конфигурации Centera стоит $204 000. По мнению аналитиков, основными покупателями новых дисковых массивов EMC станут финансовые организации и медицинские учреждения.

Проблемы и перспективы ATA-массивов

Хотя по емкости диски ATA сейчас практически не уступают более дорогим накопителям SCSI и Fibre Channel, их недостаток - низкий для корпоративных систем уровень надежности, поэтому производители ATA-массивов применяют различные способы предотвращения потери данных из-за неисправности винчестера. Например, в DX30 для увеличения срока службы дисков они вращаются только во время чтения и записи на них данных. В дисковых массивах EMC помимо поддержки кластеризации для защиты от аппаратных сбоев задублированы основные компоненты, используются зеркалирование данных и механизмы самотестирования.

Для подключения накопителей ATA служат широкие и короткие (до 45 см) кабели, крайне неудобные при сборке и обслуживании дисковых массивов, занимающие много места и затрудняющие воздухообмен внутри корпуса массива. Впрочем, вскоре эта проблема будет решена - уже осенью нынешнего года выйдут первые диски с новым интерфейсом Serial ATA, которые подключаются узкими кабелями (всего четыре сигнальных провода) длиной до 1 м. Кроме того, скорость передачи данных у Serial ATA почти в два раза выше, чем у последней версии Parallel ATA. По сообщениям в прессе, NetApp планирует перевести NearStore на Serial ATA как только на рынке появятся дисковые контроллеры для этого интерфейса.

Заключение

Несмотря на привлекательное соотношение стоимости хранения данных и быстродействия ATA-массивов, эти системы вряд ли полностью вытеснят библиотеки на лентах или магнитооптических накопителях. Дело в том, что из-за постепенного износа механики жесткие диски в отличие от лент и магнитооптики не способны обеспечить надежное хранение информации в течение нескольких десятилетий, и по этой причине ATA-массивы не подходят для долговременных архивов. Тем не менее они имеют хорошие перспективы как решение, дополняющее традиционные системы архивирования и значительно сокращающее “окно”, выделяемое для резервного копирования, кроме того, наверняка найдут применение при организации архивов больших объемов структурированной информации на некоторых вертикальных рынках.