Несмотря на то что в ноябрьском 2011 г. суперкомпьютерном рейтинге Top 500, как мы знаем, первая десятка лидеров впервые за всю историю составления списка осталась неизменной, в целом отрасль явно не стоит на месте.

У посетителей ежегодной научной конференции “Мировые тенденции развития технологий в области высокопроизводительных вычислений” (Russian Supercomputing Conference — RSC'2011), прошедшей в Москве, была возможность ознакомиться с тематической экспертизой лидера отечественного рынка (как минимум исходя из данных того же Top 500) компании “Т-Платформы”, которую события 2011 г. даже подвигли на создание своеобразного рейтинга.

Тенденции

Говоря о ключевых трендах сегодняшнего дня, главный системный архитектор “Т-Платформ” Андрей Слепухин первым делом отметил бурное развитие гибридной архитектуры с применением GPU. Сейчас в Top 500 присутствует 39 гибридных систем, из них 35 — на базе графических ускорителей Nvidia.

Стоит отметить, что флагманский суперкомпьютер “Т-Платформ” — кластер “Ломоносов” из Московского госуниверситета им. М. В. Ломоносова — после недавней модернизации также стал использовать GPU Nvidia. Более того, о неподдельном интересе компании к данной теме свидетельствует факт проведения ею в 2011 г. конкурса проектов “Эффективное использование GPU-ускорителей при решении больших задач” с общим призовым фондом в 10 млн. руб. На награждении победителей генеральный директор “Т-Платформ” Всеволод Опанасенко подчеркнул, что конкурс наглядно продемонстрировал незаменимость вычислительных кластеров на базе гибридных архитектур при решении реальных научно-практических задач. В частности, по его словам, участники инициировали ряд фундаментальных исследований в генетике, медицине, физике твердого тела, сейсморазведке и др.

Редакция недавно имела возможность ознакомиться с иной точкой зрения (www.pcweek.ru/themes/detail.php?ID=135851) на перспективы гибридности. Однако, по мнению г-на Слепухина, именно гибридность сейчас возглавляет гонку за экзафлопс. И если еще пару лет назад полагали, что наиболее вероятным способом достижения такой производительности станет использование архитектуры с большим количеством легковесных ядер — логическое продолжение архитектуры BlueGene, — то сегодня все больше говорят о гибриде. Считается, что легковесных ядер будет недостаточно, чтобы обеспечить производительность всего набора приложений, которые начнут эксплуатироваться в обозримом будущем.

По уверению г-на Слепухина, в настоящее время происходит наиболее тесная интеграция процессора и графического ускорителя. Пока что они имеют каждый свою память, и интерфейс между ними является тем бутылочным горлышком, которое мешает эффективно использовать данную архитектуру.

В компании видят, что уже сейчас появляется поддержка более однородной архитектуры. Вышли два новых процессора AMD, которые пока, правда, больше применяются в ПК и ноутбуках, но в будущем эта архитектура перейдет и в серверные процессоры. Также и Nvidia в рамках проекта “Денвер” (?) занимается разработкой ARM-процессора с интегрированным видеочипом.

Еще один важный тренд в отрасли: всё больше появляется систем с водяным охлаждением, причем с “горячим” — с температурой воды 40 0C и выше. Как поясняет г-н Слепухин, это связано в первую очередь с тем, что общая энергоэффективность системы при охлаждении горячей водой может быть на 30—35% выше, чем у ее аналогов, охлаждаемых воздухом. (Речь идет не только о самом суперкомпьютере, но и о его инфраструктуре.) Говорить, что эти системы завоевывают массовый рынок, пока рано, хотя интерес к ним растет (больше всего в Европе, несколько меньше в США), и это, безусловно, одно из самых важных направлений развития инфраструктуры.

Следующая тенденция: там, где не нужна сверхвысокая производительность (не более нескольких десятков терафлопс), применяются предельно простые системы на базе стандартных системных плат. Как правило, это достаточно плотные решения — до двух вычислительных узлов в одной U-стойке. При этом в них не только нет интегрированного интерконнекта, но даже не всегда обеспечивается отказоустойчивость по блокам питания и вентиляторам. Все упирается в простоту и цену.

Еще интересный момент — в суперкомпьютинг приходят мобильные технологии, что прежде всего связано с анонсом в конце октября 64-разрядной архитектуры ARMv8. Многие компании уже заявили, что будут на ее базе разрабатывать свои процессоры. В частности, одну лицензию приобрела Nvidia, которая намерена интегрировать эту архитектуру со своими графическими ускорителями.

И последняя тенденция, упомянутая г-ном Слепухиным: в отрасли все больше внимания уделяется нетрадиционному HPC. Речь идет о всевозможных нерегулярных задачах (наподобие тех, что используются в новом рейтинге Graph 500), имеющих отношение к таким областям, как аналитическая обработка больших объемов данных. Этот интерес, по мнению Андрея Слепухина, объясняется тем, что рынок подобных задач гораздо больше рынка традиционного суперкомпьютинга.

Экспертный рейтинг

В номинации “Лучшая система” первое место компания “Т-Платформы” безоговорочно отдала японской машине K Computer, возглавившей Top 500 с четырехкратным отрывом от ближайшего конкурента. Ее результат просто потрясает — это не только 10 Пфлопс на тесте Linpack, но еще и четыре первых места в тесте HPCC, который объединяет несколько задач с совершенно разными характеристиками.

Второе место было отдано китайской системе Sunway BlueLight производительностью порядка 1 Пфлопс, которая построена на процессорах китайского же производства, что само по себе очень интересное явление. Третье место досталось второму прототипу BlueGene/Q с очень низким энергопотреблением.

В номинации “Лучшая компания — производитель систем” первое место за Fujitsu, создавшей K Computer. Второе место у Cray. Третье — у компании Appro, также представившей в 2011 г. достаточно много решений, причем на базе стандартной кластерной архитектуры, — это как раз упоминавшиеся выше простые недорогие системы, имеющие притом производительность на уровне 1 Пфлопса.

В номинации “Лучшая компания — производитель технологий” первое место присудили Nvidia за огромную работу по продвижению гибридных вычислений. Второе — Fujitsu за микропроцессоры Sparc 64 VIIIfx и новый Sparc 64 IXfx. Третье — ARM за развитие ее перспективной архитектуры.

В категории “Лучший процессор” победил 16-ядерный Fujitsu Sparc 64 IXfx. За ним следует китайский процессор ShenWei 1600, используемый в вышеупомянутой системе BlueLight. Замыкает тройку Intel Sandybridge (развитие стандартной архитектуры x86, в которой тем не менее реализовано довольно много интересных нововведений, благодаря которым этот процессор вполне хорошо показывает себя на различных приложениях).

В категории “Лучший интерконнект” первое место “Т-Платформы” отдают Mellanox FDR InfiniBand за то, что Mellanox методично, из года в год (без опозданий, в обещанные сроки), выпускает новые версии InfiniBand с улучшенными характеристиками и с постоянно увеличивающейся пропускной способностью. Второе место заняла компания Extoll, представившая разработки собственного интерконнекта, третье досталось Gnodal.

В категории “Лучшая система хранения данных” первое место присуждено системе DDN SFA 12000, позволяющей получить пропускную способность до 40 Гб/с. На втором месте ClusterStor 3000 компании Xyratex, которая на рынок HPC вышла не так давно, но хорошо была известна в сегменте собственно СХД. По уверению г-на Слепухина, сейчас эта компания весьма активно работает как над аппаратными средствами, так и над ПО. На третьем месте — система Panasas ActiveStor 12. В номинации “Лучшая технология” единственным прорывом года в “Т-Платформах” считают Hybrid Memory Cube (HMC), анонсированную компанией Micron (позже совместно с Samsung был создан консорциум, который будет заниматься продвижением новинки на рынке). По заявлению разработчиков, в то время как широко известная технология DDR4 представляет собой эволюционное развитие стандартов оперативной памяти, HMC является истинно революционной технологией, полностью меняющей парадигму современных архитектур. HMC использует конфигурацию уложенных друг на друга чипов памяти с логикой в нижнем слое. По уверению г-на Слепухина, данная технология позволяет весьма существенно увеличить пропускную способность памяти, а это одно из наиболее узких мест в суперкомпьютинге вообще. При этом HMC уменьшает энергопотребление и повышает надежность системы.

Единственный конкурент в этой номинации — технология FinFet, которую Intel будет применять при производстве своих новых процессоров.

“Лучшей перспективной разработкой” с точки зрения “Т-Платформ” стал процессор Epiphany компании Adapteva, который достиг производительности в 70 Гфлопс/Вт — по своей энергоэффективности он превосходит ближайших конкурентов в десятки раз. Правда, это значение касается так называемой арифметики с одинарной точностью, но вскоре будет выпущен процессор, который также сможет поддерживать арифметику с двойной точностью — производительность уменьшится до 50 Гфлопс/Вт, но это все равно останется выдающимся результатом.

На второе место “Т-Платформы” поставили разработанный Intel процессор KnightsKomer (составляющий конкуренцию GPU); он еще не вышел на рынок, но его первые образцы уже успешно тестируются в лабораториях. На третьем месте процессор AMD Fusion, который позволяет использовать общую память как для процессора, так и для графического ускорителя.

В номинации “Лучшее системное ПО” первое место за пакетом SWARM компании ETI, практикующим новый подход к вычислениям на многоядерных и многопроцессорных системах. На второе место вышел набор компиляторов Accelerator Compilers компании PGI. Третье место присуждено библиотеке CUDA компании Nvidia.

Наконец в номинации “Лучшее сообщество/инициатива” первое место присуждено новому стандарту вычислений на ускорителях OpenACC, во многом базирующемуся на вышеупомянутых разработках PGI для компиляторов. Второе место у сообщества Graph 500, которое хоть пока и не составляет большой конкуренции Top 500, но активно развивается.

“Не судите…”

Разумеется, картина событий года была бы горазда более полной для отрасли, если бы свое мнение высказали другие игроки рынка. Однако компания РСК, единственный на сегодня формальный отечественный конкурент “Т-Платформ” из числа тех, чьи разработки за последнее время попадали в мировой топ, от оценок воздержалась. В ее пресс-службе высказали мнение о том, что подведением итогов можно заниматься лишь в том случае, если ты готов претендовать на роль “мирового судьи” — с высоты своего положения, глобального опыта, реальной объективности и всеми признанного авторитета. В мировой практике это делают независимые и известные всем исследовательские компании — не занимаясь сами бизнесом, они имеют право судить глобально и пытаться формировать объективное мнение и аналитику. РСК на подобную роль не претендует.

Наверное, подобный комментарий не совсем справедлив по отношению к “Т-Платформам” (компания представила свой рейтинг на тематической конференции и отдельно его нигде не публиковала), но факт остается фактом — отнюдь не весь рынок готов делиться своим видением ситуации в мировом суперкомпьютинге.

А жаль.