В очередном, 29-м по счету, списке пятисот самых мощных суперкомпьютеров мира (Top500 он был обнародован в конце июня на конференции по суперкомпьютерным вычислениям в Дрездене) первое место сохранила установленная в Ливерморской лаборатории Министерства энергетики США система BlueGene/L компании IBM, производительность которой недавно была увеличена до 280,6 Тфлопс. Второе и третье место в Top500 делят суперкомпьютеры производства корпорации Cray — Cray XT4/XT3 (101,7 Тфлопс) в лаборатории Oak Ridge, также принадлежащий американскому министерству энергетики, и Cray Red Storm (101,4 Тфлопс) в Sandia National Laboratory.
В первую десятку Top500 попали также два новых IBM BlueGene/L, установленные в суперкомпьютерных академических центрах штата Нью-Йорк. Еще один новый суперкомпьютер, занявший в рейтинге восьмое место, — кластер на базе серверов Dell в National Center for Supercomputing Applications.
Самым мощным суперкомпьютером Европы остается кластер MareNostrum на базе блейд-серверов IBM JS21, построенный в Барселонском университете, а замыкает первую десятку суперкомпьютер компании SGI Altrix, установленный недавно в Мюнхене (производительность этих машин — 62,63 и 56,52 Тфлопс соответственно).
Из японских суперкомпьютеров по мощности лидирует собранный корпорацией NEC кластер на базе технологии InfiniBand, состоящий из серверов Sun Fire x4600 с процессорами Opteron.
Из суперкомпьютеров, занимающих первые пятьдесят позиций Top500, как и в первой десятке, доминируют новички — средний возраст этих систем не превышает полутора лет, и почти половина из них установлена или существенно модернизирована в этом году. Примерно 60% этих машин используют фирменные реализации массивно-параллельной архитектуры (MPP), а остальные представляют собой кластеры стандартных серверов на базе процессоров x86. Около половины из 50 самых мощных суперкомпьютеров — это системы IBM (в том числе 13 машин BlueGene/L), 18% — Dell и 10% — Cray. С точки зрения используемых процессоров в среди первых пятидесяти суперкомпьютров Top500 первое место занимает Power (46% суперкомпьютеров), за которым следуют процессоры Intel и AMD (40 и 12% соответственно). В среднем суперкомпьютер из первых пяти десяток Top500 насчитывает 11,3 тыс. процессорных ядер.
Среди изменений по сравнению с опубликованной в конце прошлого года предыдущей версией Top500 наиболее интересны следующие:
- почти в полтора раза увеличилась мощность суперкомпьютера, занимающего последнюю строку рейтинга, — если раньше самая медленная система Top500 имела производительность 2,737 Тфлопс, то теперь —4,005 Тфлопс. Также стоит отметить, что в предыдущей версии списка сегодняшний номер 500 занимал 216-ю позицию;
- средняя производительность по всему перечню за полгода выросла с 3,54 до 4,92 Пфлопс;
- чаще всего в суперкомпьютерах Top500 используются процессоры Intel — они установлены в 289 системах, что на 28 систем больше, чем в предыдущей версии. В то же время доля AMD Opteron снизилась со 113 до 105 систем, а IBM Power — с 93 до 85 систем;
- в большинстве суперкомпьютеров установлены двухъядерные процессоры Xeon (205 систем) и Opteron (90 систем);
- почти три четверти суперкомпьютеров — это кластеры, причем для их построения все чаще применяется технология высокоскоростных интерконнектов InfiniBand. Если полгода назад в Top500 было 78 кластеров InfiniBand, то теперь их число выросло до 127. И всё же наиболее распространенной технологией интерконнектов остается Gigabit Ethernet, которая используется в 207 суперкомпьютерах (на четыре суперкомпьютера меньше, чем в предыдущей редакции Top500).
Среди вендоров по числу суперкомпьютеров на первое место вышла HP, на долю которой приходится 40,6% Top500, однако IBM сохранила первое место по суммарной мощности и по данному показателю значительно превосходит своего конкурента. Стоит также отметить, что этими двумя производителями выпущены почти все попавшие в список суперкомпьютеры, используемые в коммерческом секторе и в промышленности. Список суперкомпьютеров HP значительно расширился за счет вычислительных кластеров на базе ее блейд-серверов нового поколения BladeSystem c-Class — на их долю приходится 152 из 203 позиций в списке самых мощных систем компании, попавших в Top500, однако ни одна из них не вошла в число первых пятидесяти систем рейтинга.
Более половины суперкомпьютеров установлены в США (281 система), далее идет Великобритания (43 системы), Германия (24 системы), Япония (23 системы) и Китай (13 систем).
В Тop500 попали и пять российских суперкомпьютеров:
- построенный в Томском государственном университете кластер “СКИФ Cyberia” на базе Xeon и интерконнектов QLogic Infinipath (105-е место в Тop500);
- установленный в Межведомственном суперкомпьютерном центре (МСЦ) MVS-15000ВМ, состоящий из объединенных сетью Myrinet блейд-серверов IBM JS21 (187-е место);
- два кластера блейд-серверов HP ProLiant BL460c (265-е и 294-е места), развернутые в МСЦ и в компании Logistic Services (F), о которой известно лишь, что она относится к промышленному сектору;
- кластер стоечных серверов HP ProLiant DL140G3 в Московском физико-техническом унституте (415-е место).
К дрезденской конференции ведущие производители суперкомпьютеров подготовили ряд интересных анонсов своих последних разработок. Корпорация IBM представила второе поколение суперкомпьютеров BlueGene/P, которые по максимальной мощности будут почти втрое превосходить BlueGene/L. По заявлению IBM, BlueGene/P способен обеспечить производительность от 1 Пфлопс до 3 Пфлопс.
Как и его предшественник, новый суперкомпьютер построен по модульной архитектуре и состоит из стоек с процессорными модулями. Один кристалл BlueGene/P состоит из четырех процессоров PowerPC 450 с тактовой частотой 850 МГц и выполняет до 13,6 млрд. операций в секунду. Квадратная плата 2×2 фута вмещает 32 кристалла и обеспечивает производительность 435 млрд. операций в секунду. В одной стойке BlueGene/P помещается 32 платы суммарной производительностью 13,9 Тфлопс. Однопетафлопсная конфигурация суперкомпьютера состоит из 72 стоек или около 295 тыс. процессоров, а максимальная конфигурация BlueGene/P мощностью 3 Пфлопс — из 216 стоек с 885 тыс. процессоров.
По сравнению с BlueGene/L в новом суперкомпьютере установлены более быстрые процессоры и вдвое увеличилось их число на кристалле, а также вырос до 2 Гб объем оперативной памяти на кристалле. В качестве ОС в нем служит Linux, а приложения можно создавать на Fortran, Cи и C++ с помощью стандартных протоколов MPI.
Кроме того, как утверждает IBM, новая SMP-архитектура суперкомпьютера позволяет программировать его приложения в той же среде, что используется для вычислительных кластеров из стандартных серверов, что существенно расширяет возможности применения BlueGene в коммерческом секторе.
Первый BlueGene/P будет установлен в конце текущего года в одной из лабораторий Министерства энергетики США. Заказы на него уже подали несколько академических институтов США, Великобритании и Германии.
Наряду с разработкой суперкомпьютеров на основе фирменных технологий IBM активно продвигает и вычислительные кластеры из стандартных компонентов. Корпорация объявила, что ее System Cluster 1350 поддерживает версию Windows Server 2003 для высокопроизводительных вычислений Windows Compute Cluster Server 2003 (ССS). Кроме того, System Cluster 1350 теперь поддерживает десятую версию SuSE Linux Enterprise Server и в нем можно применять серверы с четырехъядерными Xeon.
Компания Sun анонсировала на дрезденской конференции петафлопсный суперкомпьютер Constellation, который сейчас развертывается в университете Техаса в Остине. Constellation, работающий под управлением Solaris 10, предполагается использовать для исследований изменений климата, моделирования процессов в мировом океане и изучения причин землетрясений. Его предполагается запустить в начале следующего года. Он будет состоять из объединенных через коммутатор InfiniBand блейд-серверов Sun Blade 6000, насчитывающих около 15 тыс. процессоров UltraSparc T1, Opteron и Xeon, а также серверов хранения данных Sun Fire 4500 суммарной емкостью 1,7 Пб и ленточных библиотек StorageTek.
На базе блейд-серверов создан и новый суперкомпьютер Altix ICE 8200 с архитектурой MPP компании SGI. В одной стойке этой системы, использующей SuSE Linux Enterprise Server 10, размещается до 512 процессорных ядер Xeon суммарной мощностью 6 Тфлопс. В лезвиях Altix ICE 8200 установлена двухпроцессорная бездисковая системная плата Atoka, совместно разработанная SGI с Intel специально для высокопроизводительных вычислений. Для связи лезвий в единую систему в этом суперкомпьютере применяется сеть 4X DDR InfiniBand 20 Гбит/с с иерархической топологией без коммутации, а отвод тепла реализован с помощью водяного охлаждения. В США одна стойка Altix ICE 8200 в полной конфигурации стоит около 350 тыс. долл.
Компания HP в Дрездене объявила о запуске программы оптимизации высокопроизводительных приложений для многоядерных процессорных архитектур Multi-Core Optimization Program. Помимо самой HP в этой программе участвуют AMD и Intel, а также компании Accelrys и TotalView и Институт технологии в Карлсруэ. HP также объявила о начале поставок Windows CSS в составе пакета решений для высокопроизводительных вычислений Unified Cluster Portfolio, объединяющего кластерные платформы и серверы ProLiant и BladeSystem. Корпорация разработала для Windows CSS-скрипты и документацию, упрощающие развертывание кластера, и как опцию предлагает драйверы MPI и InfiniBand для этой ОС. За месяц до конференции по суперкомпьютерам HP включила в Unified Cluster Portfolio коммутаторы DDR InfiniBand производства Cisco и объявила о поддержке драйверов InfiniBand от Cisco в блейд-серверах BladeSystem.
Построение высокопроизводительных вычислительных кластеров должны упростить представленные корпорацией Intel оптические кабели Connect Cables, позволяющие с помощью интерфейсов InfiniBand и 10-Гбит Ethernet передавать данные между узлами кластера на скорости до 20 Гбит/с и разносить узлы до 100 м. По данным корпорации, по сравнению с медными кабелями 24AWG кабели Connect Cables легче на 84%, занимают места меньше на 83% и у них на 40% меньше радиус изгиба. К тому же при соединении с помощью медного кабеля узлы кластера можно разносить не более чем на 10 м. В то же время в отличие от обычных оптических кабелей Connect Cables подключаются к разъему для медного кабеля и не требуют использования дорогих оптических трансиверов. В результате их применение упрощает инсталляцию и расширение кластера, а также улучшает воздухообмен внутри его стоек. На конференции в Дрездене многие ведущие производители суперкомпьютеров продемонстрировали кластеры, построенные с помощью Connect Cables.