Последние несколько лет организации, использующие высокопроизводительные вычисления (HPC), все чаще применяют графические ускорители (GPU) Nvidia и Advanced Micro Devices для повышения производительности суперкомпьютеров при умеренном росте энергопотребления.
Представители Nvidia и AMD утверждают, что сопроцессор Intel уступает их графическим процессорам по производительности и энергоэффективности — важнейшим показателям в области высокопроизводительных вычислений.
Теперь в эту сферу пытается вторгнуться Intel, которая предлагает для повышения производительности мощных систем свой новый сопроцессор Xeon Phi в сочетании с традиционными ЦПУ. Он имеет то преимущество, что позволяет организациям использовать знакомые продукты Intel с архитектурой x86.
Такие ускорители и сопроцессоры (они работают вместе с центральными процессорами, помогая суперкомпьютерам решать требующие интенсивных вычислений и допускающие множественный параллелизм задачи в основном за счет большого числа ядер) заняли центральное место на выставке суперкомпьютеров SC12. Nvidia и AMD представили новые GPU, а Intel — первый из своих сопроцессоров Xeon Phi.
Одновременно суперкомпьютер Titan (система Cray XK7, использующая серверные процессоры AMD Opteron и новые GPU Nvidia K20) вышла на 1-е место в списке 500 самых быстрых суперкомпьютеров мира. Впервые попал в этот список и занял в нем 7-е место суперкомпьютер Stampede, собранный из серверов Dell с процессорами Intel и сопроцессорами Xeon Phi.
С появлением сопроцессоров Xeon Phi начинается конкуренция. Некоторые аналитики считают, что сопроцессоры Intel могут стать угрозой для Nvidia, которой принадлежит 90% рынка.
“Это довольно обычный конфликт между существующей и новой технологией, — сообщил корреспонденту eWeek по электронной почте Чарльз Кинг, главный аналитик фирмы Pund-IT Research. — В действительности вопрос сводится к тому, получат ли клиенты и партнеры (например, ISV- и OEM-производители) благодаря новым решениям выигрыш в производительности, который оправдывает затраты, необходимые для использования новых технологий. Что касается GPU, то Nvidia подчеркивает… производительность систем, в которых применяются GPU, но мало говорит о времени и затратах, которые необходимы для портирования имеющихся приложений на ее платформу, обучения программистов, приобретения ими навыков, позволяющих извлечь максимум возможного из новых систем, и т. д. Ответ Intel можно охарактеризовать так: что, если у вас была бы альтернатива, обеспечивающая сходную или более высокую производительность и работу имеющихся приложений и кода без адаптации? Для многих игроков это сильный аргумент. Особенно для тех, кто работает с коммерческими HPC”.
Патрик Ванг, аналитик из компании Evercore Partners, написал в отчете от 15 ноября, что “выпуск Xeon Phi знаменует начало новой эры, а для Nvidia — появление нового антагониста”. По мере того, как Intel будет наращивать производительность сопроцессора, проблемы для Nvidia станут только усугубляться, писал Ванг. По его словам, “вопрос не в том, сможет ли Intel завоевать позиции на рынке, а в том, когда она их завоюет”.
Популярность ускорителей типа GPU, а теперь и сопроцессоров Intel растет в связи с тем, что организации, использующие HPC в таких отраслях как энергетика, финансовые услуги, здравоохранение, наука и создание цифрового контента, все чаще обращаются к суперкомпьютерам для решения задач, допускающих множественный параллелизм. В то же время высоко ценится эффективное расходование системами энергии. Организации стремятся сократить затраты на электропитание и охлаждение в этих крупных ЦОДах с все более плотным размещением оборудования. 62 суперкомпьютера из вошедших в опубликованный 12 ноября список Top 500 использовали GPU или сопроцессоры.
Последние несколько лет Nvidia и AMD продвигают свои малопотребляющие многоядерные графические технологии в качестве идеальных ускорителей. Основную долю рынка захватила Nvidia. Однако на него пытается проникнуть Intel со своими сопроцессорами Xeon Phi. Процессоры Intel Xeon уже используются во многих суперкомпьютерах (в 76 из списка Top 500). Теперь Intel пытается использовать этот факт для продвижения Xeon Phi.
Сопроцессоры Intel разрабатывались восемь лет и стали первыми продуктами, выпущенными в рамках программы Many Integrated Cores (MIC). На выставке SC12 Intel представила две версии с 60 и более ядрами, Phi 5110P и 3100, которые появятся в следующем году. Однако первые клиенты, такие как Texas Advanced Computing Center (TACC), где создается суперкомпьютер Stampede, уже используют адаптированные модели Phi.
Во время проведенного недавно в TACC семинара для журналистов, длившегося весь день, представители Intel утверждали, что сопроцессоры Xeon Phi, имеющие архитектуру x86, являются предпочтительным вариантом для занимающихся HPC организаций по сравнению с GPU. Большинство программистов уже знакомо с архитектурой x86 и соответствующими инструментами (от компиляторов и сред исполнения до библиотек отладчиков и планировщиков нагрузки), а основная масса задач уже оптимизирована для x86, сказал Джеймс Рейндерс, директор Intel по пропаганде параллельного программирования. Кроме того, Intel подчеркивает, что сопроцессоры x86 могут взаимодействовать с операционными системами независимо от центральных процессоров.
Задачи, решаемые с помощью Xeon Phi, в гораздо меньшей степени требуют перекодирования, чем решаемые с помощью GPU, сказал Рейндерс. У организаций, имеющих дело с задачами, допускающими множественный параллелизм, “не возникает необходимости в нескольких версиях процессоров для различных архитектур”.
Суперкомпьютер Stampede, когда он будет полностью готов, покажет производительность в 10 Пфлопс (квадрильонов операций в секунду). Как сказал директор TACC Джей Буассо, 70% этой производительности обеспечат сопроцессоры Xeon Phi. Во время семинара Буассо неоднократно отмечал преимущества технологии ускорителя на базе x86.
“Архитектура x86 существует уже много лет, и люди довольно хорошо с ней знакомы”, — констатировал он. Хотя технология ускорителей GPU прекрасна, “есть проблемы с ее программируемостью”.
В тот же день, когда Intel представила Xeon Phi, Nvidia и AMD выпустили свои GPU нового поколения. Nvidia анонсировала изготовленные по 28-нм технологии Tesla K20 и K20x, первые GPU с архитектурой Kepler. Суперкомпьютер Titan корпорации Cray насчитывает 560 640 процессоров, в т. ч. 261 632 GPU Nvidia K20x. Производительность Titan составляет 17,59 Пфлопс, которую на 90% обеспечивают ускорители Nvidia.
AMD представила 12 ноября GPU FirePro S10000. Представители корпорации отметили, что в нем используется архитектура Graphics Core Next, позволяющая GPU одновременно ускорять решение вычислительных и графических задач.
Сотрудники Nvidia и AMD отвергли технологию Intel Xeon Phi. Сумит Гупта, главный менеджер подразделения Nvidia Tesla Accelerated Computing, сказал, что Intel отстала в области технологии ускорителей на несколько лет, и сопроцессоры Xeon Phi лишь немного превосходят GPU Nvidia с прежней архитектурой Fermi по таким показателям как производительность и энергопотребление.
“По эффективности продукт Intel примерно соответствует нашему продукту трехлетней давности, так что Intel сильно отстает в области энергоэффективности”, — заявил Гупта корреспонденту eWeek.
Кроме того, он не разделяет идею, будто архитектура x86 дает Intel какие-то преимущества. Если сопроцессоры Intel могут использовать тот же язык и те же инструменты, что и традиционные ЦПУ Xeon, то Гупта указал на язык программирования Nvidia CUDA, который работает с C/C++ или Fortran и поддерживает инструменты OpenACC. Всего, по его словам, было выпущено 395 млн. GPU CUDA, а количество скачиваний CUDA составило 1,5 млн. Кроме того, обучение этому языку ведется в 62 странах, а системы производства Cray, Hewlett-Packard, IBM, SGI и Asus выпускаются с GPU K20 и K20x.
Гутпе вторит Джон Густафсон, главный технолог AMD по графическим системам. Он сказал, что Intel “не дотягивает до того уровня, на котором мы находимся”. AMD, которая использует главным образом язык программирования OpenCL, более трех лет выпускает GPU, что обеспечивает ей преимущество в данной области. Кроме того, утверждение, будто архитектура x86 дает Intel преимущество перед GPU, не имеет смысла, заявил Густафсон корреспонденту eWeek. Независимо от того, используют программисты GPU или сопроцессоры Intel, им приходится перекомпилировать ПО, сказал он. “Все мы вынуждены вносить изменения в свой код”, — констатировал Густафсон.
Серверные процессоры AMD Opteron имеют архитектуру x86. Но корпорация гарантирует, что организации, которым необходимы возможности GPU, могут приобрести их у AMD. (AMD распространяет это на весь свой серверный бизнес. В конце прошлого месяца она объявила, что в 2014 г. приступит к выпуску серверных процессоров на базе ARM).
“AMD предлагает необходимые инструменты для реальных задач”, — сказал Густафсон. Он не согласен с утверждением Intel, будто x86 является правильной архитектурой для любых задач: “Для молотка все выглядит как гвоздь”.
Корпорация Cray на протяжении многих лет использовала процессоры AMD Opteron и GPU Nvidia. Однако ранее в этом месяце она объявила, что первый суперкомпьютер в ее семействе нового поколения систем XC будет построен на процессорах Intel Xeon с применением как Xeon Phi, так и GPU Nvidia Tesla. Бари Болдинг, вице-президент Cray по корпоративному маркетингу, заявил корреспонденту eWeek, что на протяжении многих лет проверено, что GPU могут сделать работу приложений очень быстрой. Сопроцессоры Xeon Phi выглядят многообещающе, но сейчас вопрос заключается в следующем: можно ли добиться с их помощью такой же производительности, как с GPU? "Мы считаем, что можно”, — заявил Болдинг.
Аналитик Кинг из фирмы Pund-IT согласен с этим. По его словам, технология Intel Xeon Phi сможет составить GPU жесткую конкуренцию, если ее производительность окажется высокой.
“Сейчас GPU привлекают к себе большое внимание среди тех, кто занимается HPC в исследовательских центрах и в университетах, — сообщил Кинг корреспонденту eWeek по электронной почте. — Это прекрасно с точки зрения завоевания популярности. Но до признания рынком, не говоря уже о коммерческом успехе, им еще далеко. Я считаю, что в дальнейшем многое будет зависеть от того, каково окажется соотношение цены и производительности у сопроцессоров Intel по сравнению с GPU. Если они опередят GPU или хотя бы приблизятся к ним, производители коммерческих систем HPC, вероятно, отдадут предпочтение архитектуре x86. Коммерческих производителей интересуют не только передовые технологии. В конце концов, они пытаются заработать себе на жизнь. Наибольшего успеха добиваются те производители, которые это понимают и отдают все силы достижению этой цели”.