ОБЗОРЫ
Продолжая разрабатывать новые решения NonStop eBusiness для стандартных корпоративных сред, корпорация Compaq Computer (www.compaq.com) представила стратегию, направленную на повышение производительности, надежности и масштабируемости систем в соответствии с требованиями Интернет-экономики. Эта стратегия получила название eGeneration. Она позволяет Compaq удовлетворить требования заказчиков, нуждающихся в поддержке большого числа пользователей, которые одновременно обращаются к огромным массивам информации. По словам президента и главного исполнительного директора Compaq Майкла Капелласа (Michael Capellas), новая модель электронного бизнеса порождает потребности в инфраструктуре Интернета, обеспечивающей значительно более высокую надежность, доступность и масштабируемость, и стратегия ProLiant eGeneration позволит заказчикам получить такие решения с новым уровнем обслуживания и поддержки. В рамках новой стратегии Compaq и Unisys (www.unisys.com) подписали соглашение, в соответствии с которым Compaq будет поставлять на рынок 32-процессорные платформы Cellular MultiProcessing (CMP).
Компания Unisys больше известна своим сервисным бизнесом, но в течение последних нескольких лет она занималась разработкой серверных технологий. Это и определило выбор Compaq, которая конкурирует на рынке мощных серверов с корпорацией IBM, купившей в свое время компанию Sequent.
Процессорный элемент CMP
Соглашение между компаниями стало важной частью программы Compaq Windows 2000 Datacenter Program. Созданные в результате данного партнерства серверы Compaq ProLiant обладают повышенным уровнем надежности и масштабируемости. Архитектура Unisys CMP разработана для применения процессоров Intel Pentium III Xeon (32-разрядных) и Itanium (64-разрядных) и оптимизирована для операционной системы Windows 2000 Datacenter Server.
Как уже сообщалось (см. PC Week/RE, № 38/2000, с. 2), в конце сентября корпорация Compaq обнародовала специальную программу и представила продукты для Windows 2000 Datacenter Server. Впервые на стандартной платформе предложены продукты, специально предназначенные для использования на самых верхних уровнях корпоративных систем, где до сих пор доминируют фирмы, выпускающие RISC/Unix-системы.
Серверная система Windows 2000 Datacenter Server включает поддержку 32-процессорной параллельной обработки данных и физической памяти объемом до 64 Гб; обеспечивает четырехузловую кластеризацию и балансировку нагрузки как стандартный сервис; предоставляет расширение физических адресов (Physical Address Extension, PAE) для добавления дополнительных объемов памяти; включает технологию Winsock Direct для обеспечения высокоскоростных соединений в сетях SAN (Storage Area Network), а также новый инструмент управления процессами, который позволяет минимизировать риски утечки информации благодаря специальным объектам с повышенной защитой, управляющим ассоциированными с ними процессами. Кроме того, Windows 2000 Datacenter Server предоставляет развитые сетевые и Интернет-сервисы. Эта серверная ОС оптимизирована для работы с большими хранилищами данных, эконометрического анализа, научного и инженерного моделирования, онлайновой обработки транзакций (OLTP) и консолидации серверов. Windows 2000 Datacenter Server предназначена для использования в крупных организациях, которым требуется очень надежное и высокопроизводительное программное обеспечение, оптимально функционирующее в сетевых средах с высоким трафиком.
В настоящее время Compaq протестировала и сертифицировала несколько моделей серверов для работы с Windows 2000 Datacenter Server. Так, сервер ProLiant 8500 имеет максимум восемь процессоров, 8 Гб основной памяти и четыре дисковых накопителя. Диски, источники питания и вентиляторы заменяются в “горячем” режиме. Кроме того, под управлением Windows 2000 полностью поддерживается режим PCI Hot Plug. Интегрированный контроллер позволяет организовать дисковый массив RAID, а модульный дизайн сервера - заменять модули без переключения каких-либо кабелей: все модули подключаются к центральному коннектору (backplane). Сервер ProLiant 8500 рекомендуется для различных областей применения: Интернет, Exchange-сервер, сервер баз данных и т. д. Вместе с сервером поставляется лицензия на Windows 2000 Datacenter Server для восьми процессоров и плата удаленного управления Remote Insight Lights-out Edition.
Для наиболее требовательных к производительности приложений типа мощных и неразделяемых баз данных (non-partitionable databases) или крупных приложений уровня всего предприятия Compaq выпустила новый 32-процессорный сервер ProLiant ML770. Он имеет следующие основные характеристики:
- 32 процессора Intel Pentium Xeon 700 МГц с 2 Мб кэш-памятью на процессоре;
- 32 Гб основной памяти;
- до 64 разъемов PCI (33 МГц, 64 разряда);
- разбиение системы на разделы с возможностью независимого выполнения в каждом из них нескольких копий ОС;
- резервирование дисков, источников питания и вентиляторов для повышения надежности системы.
ProLiant ML770 создан на базе архитектуры CMP, лицензию на которую Compaq получила от Unisys. Новый сервер стандартно поставляется с предустановленной системой MS Windows 2000 Datacenter Server. Он может быть эффективен в тех случаях, когда потребности в производительности превосходят возможности имеющихся серверов, а также когда требуются преимущества стандартной архитектуры и лучшее соотношение цена/производительность. Отметим, что все серверы Compaq прошли всестороннее тестирование и сертифицированы по соответствующим программам Microsoft.
Теперь Compaq в состоянии предложить два решения для 32-процессорных серверов. Для пользователей, которым необходимы наивысшая производительность сервера и преимущества полностью 64-разрядной среды Unix и ее приложений, предназначен сервер AlphaServer GS320. Тем же, кто выбрал Windows как стандартную платформу и предпочитает стандартную архитектуру в сегменте самых производительных серверов, больше подойдет ProLiant ML770.
Особенности CMP
Впервые Unisys обнародовала свои планы по созданию 32-процессорного компьютера в 1997 г. А вот поддерживать и совершенствовать архитектуры SMP (Symmetric Multi Processsing) на базе Intel компания начала еще в 1991 г. Совместно с рядом других компаний, прежде всего с SCO, она адаптировала будущие версии ОС UnixWare для работы на 32-процессорных платформах. Новая концепция, заключающаяся в разделении процессоров на несколько вычислительных сред, работающих под управлением разных ОС, первоначально была рассчитана на Unix. Данное ПО позволяло совместно использовать системные панели, шины, подсистемы ввода-вывода, источники питания и память. Первым 32-процессорным сервером Unisys, работающим с MS Windows 2000 Datacenter Server, стала модель ES7000.
Вообще говоря, СМР - это перестраиваемая симметрично-многопроцессорная архитектура, которая позволяет комбинировать традиционную мультипроцессорную архитектуру SMP и кластерные технологии. В индустрии мэйнфреймов SMP используется уже более 30 лет. Она позволяет связать несколько процессоров в одну систему и объединить их вычислительную мощность. На любом процессоре может работать любая программа: прикладная, сетевая операционная система, программа по обмену с диском или обработке сетевого трафика. Более того, в этом случае процессоры способны выполнять одну и ту же задачу совместно. Когда один процессор завершает свою работу, он может взять на себя часть нагрузки другого. Таким образом, SMP-архитектура дает возможность эффективно использовать процессоры, уменьшая время их простоя. Большинство современных сетевых операционных систем поддерживают эту архитектуру.
Процессоры в SMP взаимодействуют друг с другом с помощью так называемой шины межсоединения и имеют общий пул памяти. При увеличении в сервере числа процессоров возрастает и трафик на данной шине. Если это число становится значительным, пропускная способность системы существенно снижается.
NUMA (Non-Uniform Memory Access) - это архитектура памяти, используемая в многопроцессорных системах, где время доступа зависит от физического расположения памяти. Процессор может работать с собственной локальной памятью гораздо быстрее, нежели с нелокальной, которая, в свою очередь, является локальной для другого процессора или разделяется между несколькими процессорами. NUMA, как и SMP, позволяет получить объединенную вычислительную мощность множества процессоров, каждый из которых обращается к общему пулу памяти. Однако в этом случае процессоры для связи друг с другом организованы в небольшие группы, или узлы. Например, 16-процессорный сервер может содержать четыре узла по четыре процессора. Каждый узел имеет собственный пул памяти.
NUMA уменьшает нагрузку на шину по сравнению с SMP, поскольку процессоры в узлах взаимодействуют между собой и со своей локальной оперативной памятью (ОЗУ) через отдельные шины. Кроме того, они могут обращаться к пулам памяти других узлов, хотя время доступа зависит от того, насколько эти узлы удалены друг от друга. Поэтому такую архитектуру часто называют архитектурой с распределенной разделяемой памятью. Если в SMP обычно бывает задействовано не более восьми процессоров, то в NUMA они могут исчисляться уже сотнями. Усовершенствованная архитектура ccNUMA (cache coherent NUMA) обеспечивает когерентность, т. е. идентичность содержимого, кэш-памяти.
Под кластером обычно понимают многомашинную вычислительную систему с общей дисковой памятью. Использование кластеров повышает производительность и надежность системы, так как в случае сбоя одного компьютера его работу берет на себя другой. Каждый сервер (узел кластера) имеет собственное ОЗУ, причем обычно он не может “видеть” содержимое ОЗУ другого узла. Узлы кластера могут быть частями многопроцессорной системы - SMP или NUMA.
Ячейки CMP - это процессорные элементы, называемые также sub-pods, или cells. CMP проектировалась в расчете на 64-разрядный Merced, однако задержки с выпуском этого процессора привели к тому, что первые версии CMP-серверов используют 32-разрядный Pentium III Xeon. Одновременно Unisys позаботилась о возможном сосуществовании процессоров Xeon и Merced в рамках одной CMP-системы. Таким образом, можно приобрести СМР-сервер c Xeon, а затем модернизировать его конфигурацию, добавив процессоры Merced.
32-процессорная SMP-система
В любой процессорной ячейке установлены четыре процессора. Кроме имеющейся у каждого кристалла стандартной кэш-памяти второго уровня в архитектуру элемента включена разделяемая между четырьмя процессорами кэш-память третьего уровня TLC (Third Level Cache). Ее емкость составляет 16 Мб (в следующем поколении процессоров она возрастет до 32 Мб). Очевидно, что применение в CMP-серверах кэш-памяти третьего уровня, имеющей большую емкость, способно существенно поднять производительность, особенно в случае использования бизнес-приложений, для которых характерен интенсивный обмен данными с оперативной памятью. Что же касается ОЗУ, то емкость блока MSU (Memory Storage Unit) наращивается блоками по 128 Мб SDRAM до максимальной емкости в 8 Гб. Таким образом, общий объем ОЗУ 32-процессорного сервера составляет 64 Гб.
Устройство управления памятью, подсистема ввода-вывода и процессоры в процессорном элементе связаны между собой при помощи матричного коммутатора (crossbar), а не посредством традиционной системной шины. Технология коммутации, пришедшая из мира мэйнфреймов, уже давно применяется и в SMP-серверах как типичный архитектурный прием. Преимуществом этой архитектуры перед шиной является возможность устранения конфликтов на системной шине и соответственно отсутствие перегрузок.
Подсистема ввода-вывода в СМР основывается на стандартных шинах PCI. Однако для повышения эффективности путем использования режима DMA три шины PCI, входящие в состав процессорного элемента, связаны с коммутатором через специальный мост ввода-вывода DIB (Direct I/O Bridge). Каждая PCI-шина имеет по четыре PCI-слота, т. е. всего 12 слотов на элемент. Общее количество слотов PCI на сервер составляет 96.
Процессорный элемент представляет собой почти готовую SMP-систему, использующую матричный коммутатор вместо системной шины. СМР-сервер может включать до четырех коммутаторов и до восьми процессорных элементов.
Разработчики заложили в CMP уникальные особенности, обеспечивающие возможности статического и динамического парционирования (разбиения) SMP-сервера, приводящие к преобразованию всей SMP-системы в кластер, в свою очередь построенный из SMP-серверов с числом процессоров, кратным четырем. Отметим, что в кластерах, построенных на базе CMP-систем, возможно совместное использование ОЗУ (shared memory), т. е. взаимодействие узлов может осуществляться через общее поле ОЗУ. Для повышения производительности предлагается использовать технику интерливинга (interleaving), когда байты 0-63 берутся из первого MSU, байты 64-127 - из второго и т. д.
Выделение разделов в СМР предполагает возможность работы в каждом из них своей ОС. В CMP-серверах они могут быть разными - например, Windows NT, Windows 2000 или SCO UnixWare. Разделение может быть статическим и динамическим. В первом случае администратор выделяет ресурсы для каждой партиции до загрузки, а во втором добавление или удаление процессоров, памяти, ресурсов ввода-вывода к любой партиции может происходить при работающей ОС.
Архитектура CMP оптимизирована для выполнения как задач онлайновой обработки транзакций (OLTP), так и функций хранилищ данных. В состав средств CMP входит применяемая в мэйнфреймах подсистема поддержки эксплуатации, со сбором информации на сопутствующих каналах, позволяющая оперативно выявлять отказы и инициировать восстановление в случае сбоев, а также поставлять данные об условиях эксплуатации в сервисный центр. Благодаря этому неисправности можно устранить раньше, чем произойдет отказ системы.
Новая архитектура позволяет снизить стоимость владения несколькими серверами за счет реконфигурирования. Как уже отмечалось, CMP-сервер можно представить как единую SMP-систему, состоящую из 32 процессоров, или как комбинацию разделов-кластеров (до восьми кластеров в системе), которые способны работать в гетерогенных окружениях и приложениях одновременно. Кластеры могут собираться как в пределах одного корпуса, так и в виде распределенных систем с применением традиционных средств типа соединительных кабелей и сетевой аппаратуры. Допускается динамическое изменение конфигураций разделов для подстройки под требования бизнеса. Например, один из разделов используется для разработки приложений, другой - для тестирования, а третий - для работы с существующими приложениями. Или: один раздел занимается управлением базами данных, другой - приложениями пользователей. Наконец, предприятие может работать ночью в одном режиме, а в течение рабочего дня динамически переконфигурировать системы для оптимизации онлайновой обработки запросов.
Общая стоимость владения системой снижается за счет концентрации серверов в одном помещении и использования общей памяти для обмена данными. С точки зрения пользователей и администраторов, система представляет собой единое целое, отражая процессы, происходящие на предприятии, которое она обслуживает. По прогнозам, в базовых конфигурациях 32-процессорные CMP-системы могут стать сравнимыми по цене с традиционными восьмипроцессорными серверами.