ОБЗОР
Fujitsu Siemens Computers делает основной упор на высокую отказоустойчивость, готовность и надежность систем, не забывая при этом о производительности
Анализ, проведенный консультационными фирмами, показывает, что один час простоя ИТ-систем в большинстве отраслей обходится в сотни тысяч долларов и даже может достигать миллионов, например при оказании финансовых услуг или торговле на фондовой бирже. Эти цифры, в частности, говорят о том, что от безошибочной работы ИТ-инфраструктуры, особенно серверов и систем хранения данных, зачастую зависит само существование компании.
Сервер Primergy B210
При выборе того или иного оборудования необходимо обращать внимание на те функции и возможности, которые отличают семейство данной фирмы-производителя от других. Так, корпорация Fujitsu Siemens Computers делает в своих продуктах основной упор на их высокую отказоустойчивость, готовность и надежность, а также на защиту доступа, не забывая при этом и о производительности. Стоит отметить, что эта корпорация имеет значительный опыт построения систем масштаба предприятия и систем высокой готовности.
В частности, семейство Primergy представлено не только рядом эффективных серверов, основанных на стандартной архитектуре Intel со специальными технологическими расширениями, разработанными для улучшения показателей надежности и экономичности, но и подсистемами хранения данных. Линейка серверов содержит машины начального уровня, серверы рабочих групп и отделений, а также корпоративные серверы, которые полностью программно совместимы благодаря использованию высокопроизводительных процессоров Pentium III, Pentium III Xeon и Itanium. Семейство Primergy включает машины как в напольном (модели B120, B210, E200, H200, H400, K400), так и в стоечном исполнении (модели N200, N400, N800 и N4000), причем последние обычно называют вычислительными узлами.
Средства управления
Средства управления сервером и клиентами полностью интегрированы в средства управления системой, сетью и приложениями. Благодаря этому обеспечивается легкое в использовании, надежное и недорогое управление всей информационной инфраструктурой. Вместе с серверами Primergy поставляется несколько пакетов программного обеспечения, таких, как ServerStart, ServerView и RemoteView.
ServerStart обеспечивает поддержку во время установки и конфигурирования серверов, позволяя быстро сконфигурировать сервер в соответствии со специфическими требованиями. Для установки операционных систем предлагается специальное меню, помогающее пользователю легко пройти через данный процесс. ServerView - это средство, предназначенное для обслуживания и контроля работы серверов и кластеров. Оно обеспечивает предварительную диагностику возможных сбоев и позволяет всем Primergy-серверам в сети управляться с единой консоли. Это уменьшает стоимость администрирования и приводит к снижению общей стоимости владения системой (TCO). Технология предварительного обнаружения и анализа позволяет выявлять сбои в работе системы и информировать о них. Средство автоматической реконфигурации и перезапуска сервера выполняет рестарт системы после удаления поврежденных компонентов из ее конфигурации. ServerView обеспечивает такие функции, как мониторинг температуры процессоров и окружающей среды, хранение сообщений об ошибках в энергонезависимой памяти, таймеры включения питания, таймер для выполнения процедуры автоматической реконфигурации и перезагрузки системы, посылка сообщения на пейджер в случае перезагрузки системы после ошибки, мониторинг загрузки шин, предупреждающее сообщение об угрозе выхода из строя вентилятора, таймер для мониторинга операционной системы и приложений, детальные отчеты о состоянии и ошибках процессоров и модулей основной памяти.
В состав RemoteView входит средство управления сервером, вызываемое при сбоях операционной системы и аппаратуры сервера. При желании RemoteView может включать в себя плату RemoteView Service Board, которая функционирует как отдельная система внутри сервера со своей собственной операционной системой, Web-сервером, SNMP-агентом, пользовательским управлением, энергоснабжением и средствами предсказания и предупреждения сбоев. После запуска можно проводить дистанционную диагностику по локальной или глобальной сети. RemoteView предоставляет возможность обслуживать и конфигурировать систему даже через модем. При возникновении определенных видов ошибок программа управления сервером оповещает об этом администратора через пейджер и автоматически запускает RemoteView. После этого администратор может выполнять удаленное обслуживание и диагностику сервера. Дистанционное управление снижает потребность в дорогостоящих и отнимающих много времени сервисных услугах, в результате уменьшаются простои сервера, а стоимость обслуживания становится ниже.
Обеспечение отказоустойчивости
Наличие кластерных решений необычайно привлекательно для большинства потребителей, заинтересованных в высокой отказоустойчивости и доступности их информационных систем. Эффективным и экономичным способом достижения большой устойчивости к ошибкам является объединение нескольких серверов Primergy в кластер. В случае отказа одной системы другая берет выполнение ее задач на себя. Важными элементами в реализации устойчивых к катастрофам решений являются кластерные решения для резервных серверов с автоматическим восстановлением (Fujitsu Siemens ServerShield, Microsoft Cluster Services, Fujitsu Siemens Reliant Monitor System for Linux, Novell Cluster Services, SCO NonStop Clusters), а также технология волоконно-оптических каналов (Fibre Channel, FC), которая используется для соединения с подсистемами хранения данных на больших расстояниях.
Применяя опыт, накопленный при создании высоконадежных систем на базе мэйнфреймов, работающих под управлением UNIX, Fujitsu Siemens Computers может не только создавать отказоустойчивые системы на основе Primergy, но и обеспечивать при этом нужную функциональность. Например, программные продукты MultiPath и Duplex Data Manager позволяют создавать как избыточные каналы доступа между сервером и внешними подсистемами хранения, так и внешние подсистемы хранения, используя “зеркальное” отражение данных. В сочетании с кластерными решениями и оптоволоконной технологией эти функции позволяют создавать удаленные “зеркала” информационных центров, обеспечивая таким образом непрерывную доступность информационной инфраструктуры даже в случае крупных аварий.
ПО MultiPath предназначено для серверов Primergy и обеспечивает защиту от отказа волоконно-оптического канала связи между компьютером и внешней дисковой подсистемой хранения. Причиной отказа Fibre Channel может быть повреждение компонентов (кабелей, концентратора) или неисправность самого хост-адаптера. Для обеспечения общей отказоустойчивости FC-соединения с дисковой подсистемой дублируются, тем самым сервер получает альтернативные пути доступа через резервный хост-адаптер волоконно-оптического канала. При отказе одного из путей MultiPath автоматически инициирует процесс переключения на другой канал, перенаправляя туда все потоки данных. В общем случае поддерживаются два режима работы. В первом оба канала Fibre Channel работают в конфигурации “активный - резервный”. При нормальном функционировании весь трафик данных направляется через активный канал, а резервный канал начинает работать в случае отказа основного. Это решение поддерживает постоянство потока данных без ограничений на пропускную способность даже при появлении ошибки. Второй подход связан с выравниванием нагрузки. При обычной работе общий поток данных распределяется между обоими каналами, идентифицируемыми по номеру логического устройства LUN (Logical Units). При появлении ошибки весь трафик проходит по исправному каналу, при этом максимально используется его полоса пропускания. И в этом случае все приложения продолжают выполняться без пауз или остановок. Неисправные компоненты можно заменить и немедленно инициировать.
MultiPath работает под управлением операционных систем MS Windows NT, MS Windows 2000 и Linux. Благодаря реализации на уровне драйверов MultiPath не только гарантирует максимальную производительность, но и полностью прозрачно для операционных систем и иных программ. Это означает, что применение двойных и резервных маршрутов не обнаруживается на уровне операционной системы, благодаря чему не требуется отдельной сертификации кластера при использовании дополнительных сервисов.
ПО Duplex Data Manager (DDM) для серверов Primergy обеспечивает работу удаленных резервных дисковых подсистем хранения данных. Применяя технологию Fibre Channel, можно создавать конфигурации, защищенные от катастроф, используя стандартную экономичную технологию Primergy, в которой исключены все возможные локальные точки потенциального отказа благодаря большой удаленности подсистем друг от друга. Дело в том, что DDM дуплицирует каждую операцию записи (DuplexWrite), при этом каждая из двух дисковых подсистем все время содержит идентичные данные. Дисковые подсистемы могут подключаться либо через индивидуальные FC-каналы, либо через “петлю” FC-AL (FC Arbitrated Loop) - таким образом, возможно резервирование не только подсистем, но и путей доступа. Каждый их двух путей доступа обеспечивает соединение с сервером через отдельный FC-адаптер. При отказе дисковой подсистемы (в случае ее полной физической утраты в результате пожара или иной катастрофы), DDM гарантирует, что данные будут обрабатываться без перебоев благодаря доступу к оставшимся “зеркалированным” данным.
DDM поддерживает работу с операционными системами Windows NT 4.0, MS Windows 2000, Linux и полностью прозрачно не только для них, но и для кластерных сервисов и используемых приложений.
DDM рекомендуется применять в сочетании с MultiPath - тогда обе подсистемы хранения остаются доступными даже если один из двух FC-каналов отказал. Другими словами, это сочетание гарантирует непрерывное резервирование данных, доступ к которым обеспечивается по одному исправному каналу связи. Несмотря на возможность работы в среде без поддержки кластеризации сервера, DDM главным образом рекомендуется использовать в комбинации с сервисами Microsoft Cluster Services или Fujitsu Siemens Reliant Monitor System для Linux, поскольку это решение гарантирует резервирование не только системы и маршрутов данных, но и самого сервера. Полный отказ сервера и дисковой подсистемы (вызванный, например, катастрофой в одном здании) обнаруживается программным обеспечением кластера на сервере, расположенном в другом здании. После этого активируется процесс восстановления работоспособности и начинают обрабатываться “зеркалированные” данные. Ни прикладная программа, ни сервисы не в состоянии заметить, что теперь данные поступают из дисковой подсистемы, имеющей иное физическое местоположение.