На фундаменте Fibre Channel вырастают распределенные IP-хранилища данных
Разработчики систем хранения информации получили еще один шанс.
Вот уже несколько лет корпорации EMC, IBM и ряд других производителей пытаются превратить Fibre Channel в фактический стандарт для сетей хранения данных. Однако им не удалось договориться даже о принципах взаимодействия своих продуктов, не говоря уж о том, чтобы убедить менеджеров информационных технологий в жизнеспособности этой идеи. Отсутствие стандартов, дополненное постоянно растущей необходимостью обмена данными через ГВС, подтолкнуло некоторых производителей и их клиентов на другой путь, который, как они надеялись, окажется более гладким. Речь идет об управлении устройствами хранения данных с помощью проверенного временем протокола IP.
Тернистый путь к сетям хранения
“Применение IP в сетях хранения информации создает многообразие способов подключения входящих в эти сети устройств, а Fibre Channel остается рассчитывать лишь на применение внутри центров обработки данных”, - отмечает Майкл Браун, председатель совета директоров и исполнительный директор корпорации Quantum (Милпитас, шт. Калифорния), специализирующейся на производстве аппаратных хранилищ данных.
Первые сети хранения информации появились примерно три года назад. Их главное назначение состояло в том, чтобы улучшить доступ к данным за счет объединения аппаратных хранилищ данных в специально созданную сеть, доступную с любого сервера. В те времена особое внимание уделялось перспективной шинной технологии Fibre Channel, обещавшей стать отличным транспортом для сетей хранения. Она позволяла передавать пакеты большего размера и на большее расстояние, чем стандартная архитектура шины SCSI.
Однако Fibre Channel так и не смогла оправдать возлагавшиеся на нее надежды. Она стала жертвой борьбы между претендентами на стандарт: разработчикам так и не удалось добиться совместимости создаваемых систем, что затормозило развертывание сетей хранения информации. К тому же на этот период пришлось бурное развитие Gigabit Ethernet, которая по пропускной способности - 1000 Мбит/с - существенно превосходит Fibre Channel с ее 850 Мбит/с. Менеджеры по информатизации не слишком торопились модернизировать уже развернутые инфраструктуры ради перехода на волоконно-оптические каналы связи. Сказался и взрывоподобный рост популярности Интернета, в результате чего компаниям пришлось решать задачу управления огромными объемами данных не только на серверах своего предприятия, но и на распределенных узлах, географически разнесенных на большие расстояния.
Тогда и возникла идея управлять устройствами хранения с помощью IP. По словам ее сторонников, такой подход позволяет быстро вывести эту технологию на рынок систем распределенного хранения, обеспечить ее управляемость и совместимость, открыть перед пользователями достоинства ее невысокой стоимости и богатые возможности.
“Реальность такова, что IP сегодня хорошо знаком всем и каждому, - отмечает Жанпитер Ширдер, президент подразделения сетевых систем хранения фирмы Sun Microsystems (Пало-Альто, шт. Калифорния). - А ведь хранилища информации должны стать полноправными членами сети”.
Одним из ярых сторонников этого направления стала фирма WorldCom. Недавно слившаяся с ней компания MCI (Колорадо-Спрингс, шт. Колорадо) в течение нескольких лет делала все возможное, чтобы избавиться от множества выделенных каналов, связывавших ее вычислительные центры. В результате волоконно-оптические каналы Fibre Channel теперь используются здесь лишь для внутренней связи в центрах обработки данных, а все внешние подключения объединены в единую IP-сеть. Благодаря такому подходу пересылка каждого мегабайта информации стала обходиться MCI на порядок дешевле.
“Сегодня, когда высокоскоростными волоконно-оптическими линиями охвачена вся территория США, а магистрали строятся на основе IP, имеет смысл передавать всю информацию по IP-сетям”, - считает Боб Оливер, главный архитектор и стратег MCI. Его компания использует в этих целях систему SRDF over IP (Symmetrix Remote Data Facility over IP - оборудование дистанционного управления данными Symmetrix по IP-каналам) корпорации EMC.
“Это - лишь первый шаг, - уверен Оливер. - SRDF позволила нам избавиться буквально от сотни унаследованных специализированных сетей. В те времена приходилось иметь дело со шлюзами, преобразователями протоколов. Сегодня об этом даже вспоминать страшно”.
Возвращение аппаратных хранилищ в основную телекоммуникационную сеть - весьма парадоксальное решение и в корне противоречит самой концепции сети устройств хранения информации. Ведь такие сети и создаются для того, чтобы операции хранения данных, требующие огромной пропускной способности, не препятствовали обмену сообщениями и передаче другого трафика. “Именно это стало главным стимулом развертывания сетей хранения данных, так почему же мы опять возвращаемся в основную сеть? - задается вопросом Шаун Ту, системный администратор фирмы American Security Group (Атланта, шт. Джорджия). - Главное - понять, зачем это нужно. Ведь информационные сети были отделены от сетей хранения не зря”.
И в самом деле, перевод устройств хранения в IP-сети ставит перед фирмами-производителями целый ряд технических проблем и вопросов стандартизации. Без их решения разработчикам едва ли удастся превратить сети хранения поверх IP в универсальное средство подключения к сетям хранения.
Бремя нагрузки
Несколько фирм-производителей уже предложили наложить SCSI - основное подключение хранилищ данных в средах Unix и Windows NT - на IP, создав тем самым гибкую ГВС устройств хранения. Однако среди потребителей много таких, кто считает протокол IP недостаточно надежным и эффективным для столь ответственной задачи, как хранение информации.
IP разрабатывался для передачи больших объемов информации. Пакеты доставляются получателю не в строгой последовательности, а восстановление их исходного порядка производится в точке получения. SCSI, напротив, требует, чтобы пакеты следовали строго один за другим без каких-либо задержек. Достаточно хотя бы одному пакету выбиться из общей последовательности - и будут испорчены все переданные данные или нарушено подключение.
Фирма Cisco Systems (Сан-Хосе, шт. Калифорния) и корпорация IBM (Армонк, шт. Нью-Йорк) решили объединить свои усилия в решении этой проблемы. Недавно они представили в группу систем хранения информации IETF (Internet Engineering Task Force - целевая группа технической поддержки Интернета) совместный проект спецификации под названием iSCSI и предложили утвердить его в качестве стандарта. А в конце июля Cisco объявила о намерении приобрести фирму NuSpeed Internet Systems (Мэпл-Гроув, шт. Миннесота), которая уже занимается разработкой продуктов на базе iSCSI.
Задержка пакетов в технологии iSCSI компенсируется за счет того, что данные размещаются в памяти без учета их последовательности. Правда, новая спецификация требует увеличения размеров заголовка каждого пакета. Включенная в него дополнительная информация значительно ускоряет сборку пакетов на уровне ТСР, снижая тем самым запаздывание данных.
К сожалению, такой метод может усложнить работу некоторых приложений. Это, в частности, относится к средствам обработки транзакций баз данных. Они, как и SCSI, не терпят ни малейшей задержки в потоке информации.
Еще одним препятствием может стать дополнительная нагрузка, накладываемая на вычислительную систему с использованием IP для доставки данных из хранилищ. Одна только программная обработка пакетов в IP-стеке может потребовать слишком большой доли ресурсов центрального процессора.
Решить такую проблему надеется начинающая фирма Nishan Systems (Сан-Хосе, шт. Калифорния), избравшая весьма оригинальный подход. К концу нынешнего года она планирует выпустить систему хранения на базе IP, в которой этот протокол будет применяться не только в ГВС, но и внутри вычислительных центров обработки данных. Уникальность новой разработки в том, что стек IP встраивается в сетевые адаптеры и обработка трафика ведется в обход серверного ЦПУ.
Кардинальным решением проблемы, как считают эксперты, могла бы стать реализация IP на аппаратном уровне, однако такой процесс может растянуться на годы. “Источник всех бед нужно искать в базовом протоколе, а вовсе не на транспортном уровне”, - уверен Даррен Томас, вице-президент подразделения средств хранения информации корпорации Compaq Computer (Хьюстон, шт. Техас).
То, что возможности IP в сетях хранения весьма ограниченны, признают даже сторонники этого пути.
“IP не позволяет определить, какой объем трафика пересылается в данный момент, - говорит Оливер из MCI. - Чтобы решить подобные проблемы, необходимо дополнить этот протокол другими инструментальными средствами”. Его фирма совместно с EMC уже приступила к разработке служб каталога и правил - двух ключевых механизмов восстановления порядка пакетов после их транспортировки.
Чтобы подкрепить свои планы в области IP, производители начинают налаживать партнерские отношения в этой области. Cisco, например, активно сотрудничает с известным разработчиком коммутаторов Fibre Channel фирмой Brocade Communications Systems (Сан-Хосе, шт. Калифорния). Результатом должна стать инкапсуляция протокола Fibre Channel в TCP/IP, которая позволит наладить связь между оборудованием обеих фирм. Первые плоды сотрудничества ожидаются во втором квартале следующего года.
А фирма Gadzoox Networks, также расположенная в Сан-Хосе и занимающаяся производством коммутаторов, заключила союз с Lucent Technologies (Мюррей-Хилл, шт. Нью-Джерси) по разработке спецификации IPFC (IP Fibre Channel). По замыслу авторов идеи, маршрутизация трафика Fibre Channel по IP-сетям позволит связать между собой островки сетей хранения данных, разделенные большими расстояниями.
Есть и такие фирмы, которые хотят воспользоваться преимуществами привычных сетевых архитектур, в частности, Ethernet.
Фирма Adaptec (Милпитас, шт. Калифорния) потратила два года на разработку технологии EtherStorage. Кроме того, она представила на рассмотрения IETF проект спецификации под названием SEP (SCSI Encapsulation Protocol - протокол инкапсуляции SCSI), определяющей технологию пересылки данных в виде блоков по существующим сетям IP и Ethernet.
Какая бы спецификация IP ни победила в развернувшейся борьбе, можно с уверенностью сказать, что Fibre Channel перестает быть синонимом систем распределенного хранения. Применение IP открывает перед компаниями широкий спектр возможностей по использованию в этих целях самых разнообразных сетевых транспортов и линий связи.
“Не стоит забывать, что пользователям важна не сама спецификация Fibre Channel, а сеть устройств хранения, - подчеркивает Пауль фон Стамвиц, главный инженер Adaptec. - Едва ли кто захочет ограничиться одним-единственным типом подключения”.
На фоне интереса к пересылке трафика устройств хранения по IP-сетям все отчетливее вырисовывается тенденция стандартизации. Оптимизма в отношении спецификации Fibre Channel поубавилось, чему в немалой степени способствовала поддержка альтернативных технологий со стороны EMC, IBM и других компаний, ставших под знамена этих лидеров. Правда, обе группы тут же вступили в конкуренцию между собой, так что в подходе к IP-хранению вполне может произойти раскол. Рабочая группа IP-сетей хранения рассматривает в настоящее время три проекта спецификаций - iSCSI, IPFC и SEP. Как ожидается, их тестирование на совместимость с новым стандартом начнется в первые месяцы следующего года.
“Уверяю вас, сегодня мы находимся в гораздо лучшем положении, чем во времена начальной разработки Fibre Channel, - говорит Джулиан Сатран, научный сотрудник Матанского центра передовых технологий IBM (Хайфа, Израиль) и один из авторов спецификации iSCSI. - Конечно, то, что мы движемся по пяти различным путям, не слишком хорошо. Но разум в конце концов должен возобладать”.
IP-хранение для узлов Интернета
Не вызывает никаких сомнений, Что если бы фирма Click2send.com (Саннивейл, шт. Калифорния) не взяла на вооружение технологию IP-хранения, ей никогда не удалось бы достичь своей амбициозной цели - стать Интернет-вариантом корпорации Federal Express.
Чтобы развернуть услуги по доставке файлов через Интернет, фирме понадобилась инфраструктура, способная обслуживать огромное - от 20 до 50 терабайт - хранилище данных на каждом из четырех концентраторов трафика, расположенных в Азиатско-Тихоокеанском регионе, Европе и США.
Внутри вычислительных центров связь между устройствами хранения поддерживается по волоконно-оптическим каналам Fibre Channel, однако применение такой технологии для связи между центрами, находящимися на разных концах земного шара, обошлось бы слишком дорого.
Поэтому Click2send.com обратилась за помощью к корпорации ЕМС, которая в первом квартале нынешнего года завершила разработку технологии SRDF over IP (Symmetrix Remote Data Facility over IP - оборудование дистанционного управления данными Symmetrix по IP-каналам). “Если бы не ПО зеркалирования SRDF, - признается Дейвид Найт, главный инженер Click2send.com, - нам пришлось бы самим разрабатывать программные средства управления хранением данных с помощью протокола IP. Такая работа грозила растянуться на долгие месяцы, а ведь в Интернете потеря времени чревата утратой лидерства”.
Click2send.com предлагает своим клиентам услуги по доставке больших файлов (по объему, как правило, превышающих 3 Мб) через Интернет. Для такой пересылки создается туннель между интрасетью компании и сервером Click2send.com, благодаря чему трафик минует обычный сервер электронной почты клиента.
Предлагаемая корпорацией ЕМС система SRDF использует IP-магистраль, предоставленную фирмой Global Crossing.
По мнению Найта, IP-хранение играет неоценимую роль для налаживания связи между удаленными друг от друга хранилищами, однако едва ли сможет прийти на смену Fibre Channel внутри вычислительных центров. “По правде говоря, заменить Fibre Channel в наших центрах обработки данных смогла бы только технология Infiniband”, - говорит он, имея в виду среду коммутации серверного уровня, появление которой на рынке ожидается в следующем году.
“Применение IP в центрах обработки данных крайне неэффективно, - уверен Найт, - однако для глобальных вычислительных сетей у нас просто нет иного выхода”.