Растущие требования к производительности и энергоэффективности суперкомпьютеров заставляют шире использовать графические процессоры в сверхпроизводительных системах
Суперкомпьютерные вычисления продолжают уверенно двигаться к экзафлопному барьеру, обещая появление инноваций, которые смогут проникнуть во все уголки жизни, в сочетании с технологией, способной преобразовать деловую и персональную активность. Министерство энергетики США ожидает, что производительность суперкомпьютеров подойдет к рубежу вычислений экзоуровня к 2019 г. Однако чтобы достичь этой цели, предстоит преодолеть несколько серьезных препятствий, главным из которых выступает проблема энергопитания.
“Развитие суперкомпьютеров, как и мобильных телефонов или планшетов, сегодня ограничивается объемом потребляемой энергии, — заявил президент и исполнительный директор Nvidia Хен-Сун Хуанг 15 ноября, выступая в качестве ключевого докладчика на конференции по супервычислениям SC11. — Это наша гравитация… Энергоэффективность является нашим единственным критическим требованием”.
Изготовители микросхем постоянно совершенствуют свою продукцию, стремясь внести свой вклад в снижение объема энергии, потребляемой сверхпроизводительными суперкомпьютерами. Компании Intel и Advanced Micro Devices продолжают увеличивать число ядер в своих процессорах с архитектурой x86 и добавляют в них улучшенные возможности управления питанием для повышения как производительности, так и энергоэффективности. Например, в первый день конференции AMD официально представила свои 16-ядерные процессоры Opteron 6200 Interlagos, оснащенные функциями управления энергоэффективностью TDP Power Capping. Однако действительно реальным прорывом в области сверхвысокопроизводительных вычислений стало применение графичеcких процессоров или графических акселераторов — микросхем, берущих на себя основной объем операций с графикой и ускоряющих процесс ее обработки.
При объединении в одну систему с традиционными процессорами графические процессоры позволяют резко поднять производительность такой системы, не вызывая соответствующего скачка в потреблении энергии. Графические технологии начали играть более заметную роль в повышении эффективности вычислений несколько лет назад, в первую очередь благодаря разработкам компании Nvidia, крупнейшего в мире поставщика графических процессоров.
Это тренд был очевиден на конференции SC 11 и подтверждается опубликованным 14 ноября списком 500 наиболее мощных суперкомпьютеров в мире. Согласно “Топ 500”, сегодня 39 суперкомпьютеров используют графические ускорители — это число более чем в два раза превосходит соответствующий показатель полугодовой давности. Из этих 39 суперкомпьютеров 36 используют графические процессоры Nvidia, еще два — процессоры Cell производства IBM и два оставшихся — графические микросхемы Radeon компании AMD.
Гибридный суперкомпьютер
Помимо этого большинство новостей о суперкомпьютерах, объявленных на конференции, касалось систем, построенных на графических акселераторах. Nvidia и несколько европейских суперкомпьютерных центров объявили о планах создания гибридного суперкомпьютера, который будет использовать как обычные, так и графические процессоры, и, по утверждениям официальных лиц, будет в состоянии выполнять вычисления на экзафлопном уровне при снижении энергопотребления на 15–30% по сравнению с системами, использующими только традиционные процессоры.
Ведущий поставщик суперкомпьютеров компания Cray также заявила, что она возьмет под свой контроль проект Blue Waters Национального научного фонда, прекращенный IBM в августе 2011 г. из-за повышенных расходов и технических проблем, и создаст сверхмощную систему с устойчивой производительностью на петафлопсном уровне. Суперкомпьютер будет выполнен на базе новой системы Cray XK6, использующей процессоры Interlagos производства AMD наряду с графическими процессорами Nvidia.
Эддисон Снел, исполнительный директор консультационной компании Intersect360 Research, специализирующейся на рынке сверхпроизводительных вычислений, заявил на пресс-конференции, что он ожидает расширения масштабов внедрения графических акселераторов, причем лидерство в этой области сохранится за разработками Nvidia. Однако он считает, что в будущем конкуренцию лидеру составит Intel, реализующая сейчас свою инициативу Many Integrated Cores. Сумит Гупта, директор Nvidia по маркетингу линейки продуктов Tesla, сообщил eWeek, что графические ускорители имеют серьезные преимущества над традиционными процессорами, в частности, они потребляют намного меньше энергии и могут выполнять параллельную обработку данных.
Среди других плюсов графических ускорителей — уменьшенные размеры и повышенная эффективность: в то время как AMD и Intel предлагают максимум 16 ядер на процессоре, графический ускоритель Nvidia может использовать до 500 ядер. Проблема, по словам Гупты, состоит в том, чтобы помочь организациям подготовить рабочую нагрузку, основная часть которой сегодня структурирована для последовательной обработки, к переводу на параллельные вычисления.
Большинство приложений работают быстрее при параллельной обработке данных, однако корпоративные пользователи и ИТ-специалисты пока чувствуют себя более уверенно при последовательной работе. Учитывая выигрыш в производительности и энергопотреблении, достигаемый при переходе к параллельной обработке данных, можно ожидать изменения такого отношения. “Мир движется к параллельным вычислениям, — заявил Гупта. — Назад пути нет”.
Задача состоит в том, чтобы облегчить переход к параллельным методам обработки данных, считает он. С этой целью Nvidia объединяет свои усилия с компаниями Cray, The Portland Group и Центром анализа и прогнозирования штормов (Center for Analysis and Prediction of Storms), запустив проект по разработке OpenACC, нового стандарта в параллельных вычислениях. С помощью OpenACC, ученые, исследователи и корпоративные пользователи смогут запускать свои приложения в режиме параллельной обработки на разнородных системах, использующих как стандартные процессоры, так и графические ускорители. Специалисты по параллельному программированию получат возможность составлять команды для компилятора, который проделает всю работу по оптимизации приложений для работы в системах с графическими ускорителями. “Это привлечет огромное число специалистов к параллельным вычислениям”, — считает Хуанг.