Одна из наиболее важных тенденций в области высокопроизводительных вычислений (HPC) — переход от гомогенных архитектур к гибридным. Какие перспективы здесь открываются для пользователей HPC-систем и какие проблемы еще предстоит преодолеть на этом пути? Об этом рассказывает Сумит Гупта, директор бизнеса Tesla в Nvidia.

В последнем рейтинге суперкомпьютеров TOP500 гибридных систем с GPU уже 39 (вдвое больше, чем в предыдущем). С вашей точки зрения, такая архитектура станет мейнстримом в сфере HPC или же займет определенную нишу?

Мы считаем, что гибридные вычисления уже стали общепринятой технологией в сфере HPC. Все ключевые мировые производители HPC-систем используют графические процессоры Nvidia Tesla в своих решениях для ускорения ресурсоемких вычислений. Корпорации Intel и AMD также недавно анонсировали планы создания новых продуктов, использующих графические ускорители для вычислений общего назначения. Экспоненциально растет и количество приложений, написанных под гибридную архитектуру. Во многие коммерческие инструменты и продукты с открытым кодом — компиляторы, отладчики, средства управления кластерами — уже включена поддержка GPU. И совершенно понятно, почему это происходит: графические акселераторы позволяют получить более высокую производительность при меньших финансовых затратах и меньшем энергопотреблении.

Вот уже более трех лет на рынке представлены настольные суперкомпьютеры, в которых используются и ваши технологии. Оправдали ли такие системы ожидания?

Выводя на рынок персональный суперкомпьютер (PSC) на базе Tesla, мы хотели предоставить ученым и исследователям настольное решение с прорывной производительностью, которое позволило бы им избежать трудностей и затрат, связанных с доступом к серверным мощностям и суперкомпьютерам. И именно поэтому PSC быстро оказались востребованными.

Заказчики и сейчас говорят, что получить доступ к национальным суперкомпьютерным кластерам крайне затруднительно, но располагая PSC, они имеют в своем распоряжении вычислительные мощности, достаточные для задач моделирования.

Сегодня PSC переизобретаются заново, поскольку требования к производительности продолжают расти. Например, производственники заинтересованы в целостном подходе к созданию продуктов, предполагающем конвергенцию процедур проектирования и моделирования новых изделий. Проблема в том, что проектирование осуществляется на рабочих станциях, а задачи моделирования решаются на серверных кластерах. Поэтому Nvidia представила технологию Maximus, позволяющую создавать рабочие станции с производительностью, достаточной как для проектных задач, так и для моделирования. Это дает инженерам возможность быстрее перейти от концепта к законченному продукту.

Стремление кардинально повысить показатель “производительность на ватт” открывает дорогу на рынок HPC-систем и для производителей ARM-процессоров. Как вы оцениваете их перспективы в данном сегменте?

Процессоры ARM с низким потреблением фактически оккупировали сегмент мобильных телефонов и планшетов. Microsoft объявила о поддержке ARM в ОС Windows 8, что может привести к появлению массового сегмента лэптопов на базе таких CPU. Недавно HP анонсировала проект Moonshot, нацеленный на создание серверов с ARM-процессорами для быстро растущего рынка облачных и веб-услуг.

Проблема энергоэффективности для суперкомпьютеров не менее важна, чем для мобильных устройств. Поэтому по мере укрепления позиций в области персональных и облачных вычислений ARM будет играть все более значимую роль и в HPC-системах. Не случайно Суперкомпьютерный центр Барселоны недавно объявил, что строит прототип кластера на базе процессоров ARM и графических процессоров Nvidia, чтобы изучить возможности построения энергоэффективных суперкомпьютеров экзафлопсной производительности.

Отказ от гомогенных архитектур в пользу гибридных серьезно усложняет задачи для разработчиков ПО. Не станет ли это тормозом на пути эффективного использования растущих аппаратных возможностей?

Разработчики ПО сейчас в трудном положении. Программировать многоядерные процессоры очень сложно, и обычно требуются месяцы, чтобы при переходе от одноядерных CPU к многоядерным получить выигрыш хотя бы в 5%.

В гибридных архитектурах с GPU добиться эффекта проще, поскольку тут есть возможность последовательно выполняемые операции возложить на CPU, а части программы, предполагающие интенсивные вычисления, — на GPU. Основная проблема заключается в том, как распараллелить процессы, но разработчикам придется решать ее в любом случае в связи с переходом на многоядерные CPU.

Представленный недавно метод GPU Directives упрощает разработчикам задачу по эффективному использованию GPU. Новые компиляторы позволяют распараллеливать вычисления с сохранением исходного кода приложения или его минимальной корректировкой за счет включения в код директив, дающих компилятору указания, какие участки кода нужно распараллелить. Использование открытого стандарта OpenACC позволяет программистам получить мгновенное ускорение приложений с минимальными трудозатратами. По отзывам разработчиков, использовать директивы для GPU проще, чем программировать многопоточность для исполнения на CPU.

Решения для HPC-систем — лишь одно из направлений бизнеса Nvidia. Какое значение оно имеет для вашей компании?

HPC-направление имеет стратегическое значение для Nvidia по двум причинам. Во-первых, это относительно новый рынок, который служит для нас драйвером роста. На HPC-сегмент приходится значительная часть глобального серверного рынка, и мы считаем, что наши решения для этого сегмента — именно то, что нужно заказчикам.

Во-вторых, продолжая работу в сфере HPC, мы, как нам кажется, можем внести значительный вклад в решение имеющихся у заказчиков проблем, в чем и заключается одна из целей компании. Гибридные HPC-системы дают в руки исследователей мощный инструмент не только для решения сложных вычислительных задач, но и для проведения глубоких научных исследований в области здравоохранения, энергетики, метеорологии. Этот перечень можно продолжить.

СПЕЦПРОЕКТ