Возрастающий интерес крупнейших мировых вендоров к устройствам хранения информации и их объединению в сети Storage Area Network (SAN) в основном объясняется изменениями в организации современного бизнеса - переходом к электронному бизнесу. Еще одна причина этого интереса заключается в том, что современные информационные системы обладают существенной диспропорцией - их вычислительные ресурсы явно превосходят возможности хранения и обработки данных. Пришла пора восстановить баланс.
Всем известна первая составляющая эмпирического закона Мура: производительность процессоров удваивается с периодичностью 18 месяцев. Однако существует и вторая часть, гласящая, что с той же скоростью увеличивается и объем хранимой информации. Многие годы производительность процессоров возрастала в строгом соответствии с законом, а коммуникационные возможности компьютеров, определяющие их способность работать с большими объемами информации, явно отставали. Например, за последние 15 лет средний полуторагодовой коэффициент роста скорости передачи данных в сетях составил 1,6, а в шинах, объединяющих процессор с периферией, и того меньше - 1,4. В итоге за эти 15 лет производительность сетей отстала от производительности процессоров в 10 раз, а шин - в 35 раз.
О том, какое значение имеет сбалансированность всех компонентов системы, можно судить на основании следующего частного примера: Unix-серверы компании Sun Microsystems, построенные на менее производительных процессорах, чем их аналоги от Digital, показывали более высокую скорость на ряде тестов за счет того, что между процессорами и памятью в них вместо шин использовались коммутаторы. На уровне корпоративных информационных систем аналогичную функцию выполняет SAN, но при этом совершенствуется не просто передача потока информации между процессором и памятью, а процедура обмена данными между всеми основными компонентами системы.
Архипелаг корпоративной информационной системы
Технология SAN родилась совсем недавно, в 1998 г. На русский язык это название можно условно перевести как “сеть памяти”. Английский вариант точнее, потому что термин “storage” однозначно указывает на устройства долговременного хранения данных: дисковые массивы, библиотеки на магнитных лентах, оптические диски и др. Путь к SAN начался с последовательного интерфейса Fibre Channel, который превосходит параллельный SCSI, традиционно используемый для подключения накопителей, по целому ряду параметров, в том числе по скорости передачи и числу подключаемых устройств, которые к тому же могут быть расположены в нескольких километрах друг от друга.
Не менее важно и то, что Fibre Channel - последовательный интерфейс. Это обстоятельство принципиально меняет схемы построения новых систем памяти, оно открывает возможность для создания сетей из устройств памяти и соответствующего сетевого оборудования (коммутаторов, машрутизаторов, концентраторов). Неслучайно девизом SAN стало: “The Network Behind the Server”, или по-русски - “Сеть за сервером”.
Появление этой технологии было довольно неожиданным для широкой общественности, поначалу она воспринималась как некая экзотика. Отголоски такого настороженного отношения можно, например, найти в статье Кристины Салливан “Сети SAN: кошелек или жизнь” (PC Week/RE, № 48/99, с. 53). Однако очень быстро, буквально в течение второй половины 1999 г., произошла массовая трансформация сознания, и теперь практически всем стало ясно: SAN идеально соответствуют требованиям наиболее модного сейчас направления в корпоративных системах - электронного бизнеса и вполне можно говорить о втором рождении новой технологии, а первые полтора года считать временем ее эмбрионального развития.
Что такое SAN?
Среди различных закономерностей, которые можно обнаружить в процессе эволюции информационных систем, явно прослеживается тенденция к увеличению числа ресурсов с распределенным доступом. Появление SAN стало совершенно естественным шагом в этом направлении.
Во времена изолированных мэйфреймов и мини-ЭВМ распределение ограничивалось тем, чем обладал отдельно взятый компьютер (данные, процессорное время, принтеры и т. д.). Появившиеся в 80-х годах локальные сети (LAN) отчасти сняли проблему изолированности, и на клиентском уровне (front end) появилась свобода подключения “каждого к каждому”. Однако LAN не решают задачу распределения в полном объеме, основные системные ресурсы по-прежнему продолжают оставаться изолированными островами с собственными операционными системами, форматами данных, файловыми системами, объединенными с помощью различных технологий. Как следствие возникает потребность в технике для организации распределения ресурсов на серверном уровне (back end), например, для совместного использования систем резервного копирования и решения многих других задач.
Технология SAN как раз позволяет внедрить еще один сетевой уровень в инфраструктуру корпоративной информационной системы и тем самым решить проблему распределения ресурсов back end.
Этапы эволюции: от изолированных компьютеров до сетей памяти
Технической основой SAN служит интерфейс Fibre Channel, который поддерживает не только канальный протокол TCP/IP, но и блочный протокол SCSI. Нарушая строгие определения, приведенные в стандартах, вполне можно ограничиться признанием Fibre Channel в качестве средства, превращающего параллельный интерфейс SCSI в последовательный, что позволяет объединять в сеть блочные SCSI-устройства. Для создания сети можно использовать аналоги концентраторов, коммутаторов и маршрутизаторов, применяемых в LAN.
Появление такого рода сети приводит к очевидному перевороту в подходе к архитектуре корпоративных систем: память (mass storage), всегда бывшая периферией, становится ядром, а серверы трансформируются в своего рода периферийные устройства. На смену сервероцентричной модели приходит памятецентричная или датацентричная модель.
SAN придает системам целый ряд новых качеств.
Модульная масштабируемость. Если разрублен гордиев узел, связывающий накопители с серверами, то в системе совершенно четко выделяются два практически независимых типа ресурсов: ресурс памяти и вычислительный; принципиально важно то, что они могут развиваться автономно, никак не будучи связанными между собой. Появляется возможность гибко наращивать систему, используя новые технологии и устройства. Это обстоятельство существенно при выборе инвестиционной политики. По оценкам компании Gadzoox, одного из основных производителей ПО для SAN, темпы роста устройств памяти и соответственно инвестиции в них будут, как минимум, вдвое опережать эти показатели для серверов (вспомните о необходимости восстановления баланса).
Решение проблемы резервного копирования. Использование локальных сетей для распределенного доступа к устройствам резервного копирования приводит к перегрузке сети и серверов, так что эта процедура если и выполняется регулярно, то по определенному графику и не очень часто. В итоге резервная копия всегда несколько отличается от последних данных. С возрастанием объема корпоративных данных и их значимости для жизнедеятельности компании резервное копирование превращается в серьезную проблему. Показательно, что именно эта задача стала одним из первых практических приложений SAN.
Повышение качества управления данными. Распределение данных между множеством серверов очевидным образом повышает эксплуатационные издержки, связанные с дублированием информации и возникающими сложностями управления. Объединение всех данных в один ресурс облегчает управление им.
Повышение доступности и надежности систем. Сетевой подход к памяти, реализованный в SAN и позволяющий разносить оборудование на десятки километров и при этом обеспечивать скорость обмена, измеряемую сотнями мегабит в секунду, принципиально меняет отношение к созданию систем с высокой доступностью и надежностью. Из модулей можно собирать практически произвольные кластерные конфигурации.
SAN и электронный бизнес
Интересно сравнить материалы двух конференций, посвященных SAN и по времени отстоящих одна от другой менее чем на год. Первая из них, “Storage Networking Conference”, состоялась в феврале 1999 г., а вторая, Storage Networking World, организованная недавно созданной ассоциацией Storage Networking Industry Association (SNIA), прошла в конце октября 1999 г. На первой никто из участников даже не упомянул об электронном бизнесе как потенциальной области приложения SAN. Поразительно, но тогда вообще о практическом использовании SAN говорилось очень мало, а вскоре признание сетей памяти в качестве технологической основы для e-businees стало буквально тривиальной истиной, на второй конференции этому было посвящено большинство докладов.
Успехи SAN на поприще электронного бизнеса дают некоторым аналитикам повод считать, что информационные технологии вступают в новый виток инфраструктурной эволюции. Например, компания Forrester Research предлагает свою модель истории корпоративных информационных инфраструктур. Первым поколением эта компания считает централизованные инфраструктуры, построенные на основе мэйнфреймов, вторым - распределенные клиент-серверные архитектуры, наконец, третьим - суперструктуры, которые строятся в соответствии с требованиями электронного бизнеса.
Электронный бизнес радикально меняет отношение к информации, с его появлением подавляющее большинство организаций приходят к выводу о том, что только оперативность всей внутренней и внешней работы с данными гарантирует их присутствие на рынке. Качество данных (data quality) приобретает первостепенное значение, и при этом надо учесть, что циркулирующая по сети информация становится все более насыщенна графикой, аудио- и видеофрагментами, что приводит буквально к взрывному росту объемов хранимых данных.
В результате затраты на управление данными начинают экспоненциально возрастать, а стоимость периферии нередко превышает стоимость серверов, к которым она подключена. Именно поэтому сети SAN становятся одной из важнейших составляющих революции электронного бизнеса (eBusiness Revolution).