Прошедший год можно назвать одним из самых непредсказуемых и неоднозначных в плане развития технологий высокопроизводительных вычислений как в России, так и во всём мире. На его протяжении в отрасли сформировался ряд мощных перспективных технологий, появилось несколько новых трендов. В то же время производительность самых мощных систем мира не претерпела серьезных изменений, зато суперкомпьютеры из середины мирового рейтинга TOP-500 продемонстрировали определённый рост по этому показателю.
Неоднозначным оказался
На пути к экзафлопсным вычислениям: шаг вперёд, два шага вбок
Сравнение опубликованной в конце ноября новейшей,
Четвертый раз подряд TOP-500 возглавила суперкомпьютерная система Tianhe-2 («Млечный путь 2») Китайского национального университета оборонных технологий с прежней производительностью 33,86 Пфлопс в тесте Linpack — на протяжении последних двух лет она не претерпела изменений. Не изменились конфигурации и уступающих ей почти вдвое и занимающих соответственно второе и третье место систем Titan Cray XK7 (17,59 Пфлопс) и Sequoia (17,17 Пфлопс). Единственным пополнением десятки лидирующих суперкомпьютеров в последнем выпуске TOP-500 стала замыкающая список система Cray CS-Storm неназванного департамента правительства США с производительностью 3,57 Пфлопс.
Начиная с пятой позиции рейтинга мощность систем измеряется уже единицами петафлопс, а начиная с
Любопытен срез по применяемым в современных суперкомпьютерах графическим акселераторам и сопроцессорным модулям, оказывающим значительное влияние на суммарную производительность систем в определённых задачах. Так, первая и седьмая системы лидирующей десятки используют сопроцессоры Intel Xeon Phi, в то время как вторая и шестая имеют GPU компании Nvidia. В целом 75 систем из вошедших в последний перечень TOP-500 работают с применением ускорителей и сопроцессоров (годом ранее таковых насчитывалось всего 62). Полсотни из них используют графические чипы Nvidia, три работают с GPU ATI Radeon, 25 систем выполнены с применением технологии Intel MIC (Xeon Phi).
Процессорные решения Intel, как и раньше, являются платформой для подавляющего числа систем из рейтинга TOP-500 (85,8%). Остальные платформы представлены (в убывающем порядке) процессорами IBM Power, Fujitsu SPARC64 и AMD Opteron.
По странам и континентам
Несмотря на то что самый мощный суперкомпьютер планеты по-прежнему находится в Китае, США остаются страной с наибольшим присутствием в TOP-500 (231 система), но несколько сдают свои позиции (в ноябре
В летнем,
Впервые появилась в рейтинге и сразу удачно «приземлилась» на
Однако самые впечатляющие итоги года продемонстрировала российская группа компаний РСК. Количество суперкомпьютеров её производства в рейтинге TOP-500 удвоилось: в новую редакцию вошли сразу четыре системы РСК с прямым жидкостным охлаждением, включая разработанные для Санкт-Петербургского государственного политехнического университета (СПбПУ) кластерную систему «Политехник РСК Торнадо» на базе
На
В общем зачёте по числу суперкомпьютеров, входящих в TOP-500, лидерами по-прежнему остаются HP (179 систем, две из них — в России) и IBM (153 системы), при этом показатели обеих компаний снизились со времени предыдущего рейтинга. Замыкает тройку лидеров Cray с 62 системами.
Курс на производительность, уплотнение, экономию энергии
Как бы то ни было, рынок HPC переживает период существенных изменений. Раджиб Хазра, вице-президент Intel и руководитель группы технических вычислений компании, в своём выступлении на конференции SC’14 в Новом Орлеане (США) сформулировал этот процесс следующим образом: «Нынешнюю трансформацию рынка суперкомпьютеров не стоит описывать словами „лучше“ или „больше“. Это скорее фундаментальное изменение модели использования технологий через интеграцию, совместные разработки, совершенствование программных платформ и даже изменение бизнес-модели предоставления HPC-вычислений, в первую очередь в виде суперкомпьютеров как сервиса».
Идёт широкое индустриальное внедрение представленного осенью нового поколения процессоров Intel Xeon. Решения на этих процессорах с поддержкой нового поколения памяти DDR4 демонстрировали на выставке SC’14 многие производители и интеграторы HPC-систем, включая группу российских компаний РСК.
В то же время дальнейшее развитие рынка высокопроизводительных вычислений в Intel связывают с более глубокой интеграцией различных компонентов системы на едином кристалле в рамках развития архитектуры Intel MIC (Many Integrated Core). На конференции SC’14 компания представила новое, третье поколение процессоров Intel Xeon Phi с кодовым названием Knights Hill, выпуск которых будет налажен с применением
Ожидается, что Knights Landing поддержат более полусотни ведущих компаний индустрии, при этом во многих системах будет использоваться модуль в виде платы расширения с интерфейсом PCIe. Чипы Knights Landing, в частности, будут использоваться в суперкомпьютере Trinity совместного проекта Лос-Аламосской и Сандийских национальных лабораторий, а также в суперкомпьютере Cori Национального научного вычислительного центра энергетических исследований министерства энергетики США.
Помимо этого представители Intel рассказали о дальнейшем развитии архитектуры Omni-Path, способной передавать данные со скоростью 100 Гбит/с и
В рамках этого проекта Intel запустила программу Intel Fabric Builders Program для формирования совместной экосистемы решений на базе Intel Omni-Path Architecture.
Компания Nvidia представила на конференции новый флагманский двухпроцессорный графический ускоритель Tesla K80, обладающий почти вдвое более высокой производительностью и вдвое более широкой полосой пропускания памяти по сравнению с предшественником Tesla K40. Ускоритель Tesla K80 обладает 4992 параллельными ядрами CUDA, оснащён 24 Гб памяти GDDR5 и обеспечивает полосу пропускания до 480 Гб/с. Новинка поддерживает технологию динамического изменения частоты Nvidia GPU Boost и обеспечивает производительность до 8,74 Тфлопс для вычислений с одинарной точностью и до 2,91 Тфлопс — с двойной точностью.
Сумит Гупта, генеральный менеджер Nvidia и глава подразделения Tesla Accelerated Computing, в беседе об особенностях Tesla K80 подчеркнул, что новый двухпроцессорный ускоритель оснащён пассивным теплоотводом и поэтому позиционируется как решение для серверных систем с централизованным охлаждением. Максимальный выигрыш производительности при использовании ускорителей Tesla K80 уже сейчас можно получить более чем в 280 научных, инженерных, коммерческих и корпоративных приложениях.
Он рассказал также о планах внедрения высокоскоростного интерфейса NVLink, предназначенного для прямой связи нескольких GPU Nvidia в одной системе, при этом процессорная платформа может быть любой на выбор — IBM Power, x86 или ARM. Интерфейс NVLink разгружает шину данных между GPU и CPU и позволяет ускорить обмен данными в
Широкое внедрение шины NVLink начнётся в 2016 г., когда будет представлена архитектура GPU Nvidia нового поколения с рабочим названием Volta. Именно такие ускорители с топологией NVLink предполагается использовать в будущих суперкомпьютерах Summit и Sierra, установка которых запланирована на
Ожидается, что к тому времени интерфейс NVLink будет полностью готов для эксплуатации в системах с любыми процессорами архитектур IBM Power, x86 и ARM. Кроме того, архитектура Volta и технология NVLink позволят вплотную приблизиться к созданию систем так называемого «экзафлопсного уровня».
Говоря о перспективных разработках, нельзя не упомянуть новый «дата-центристский» подход IBM, выраженный, в частности, в открытой архитектуре OpenPOWER. Каких-то специальных анонсов к SC’14 от IBM не последовало, но сам по себе контракт на сумму 325 млн. долл. с министерством энергетики США на создание упомянутых выше суперкомпьютеров для Ливерморской и Оак-Риджевской лабораторий вполне красноречиво говорит об успехах OpenPOWER Foundation, насчитывающей к настоящему времени более 80 участников, включая Google, Mellanox, Nvidia, Tyan, Samsung, Hitachi, ZTE, QLogic, Rackspace и других.
Японская Fujitsu совсем недавно обнародовала планы по выпуску новых процессоров SPARC64 IXfx, ориентированных на производство суперкомпьютеров с потенциальной возможностью взять барьер в 100 Пфлопс. Ожидается, что
В целом же Fujitsu планирует довести развитие архитектуры суперкомпьютеров K «до горизонта экзаскейла», который, по мнению японского министерства образования, культуры, спорта, наук и технологий, будет достигнут уже в 2020 г.
Что касается появления на рынке HPC новых процессорных игроков, таких как ARM или MIPS с их новыми
Ближайшие горизонты
Очевидно, что в момент, когда производительность флагманских систем рейтинга составляет десятки петафлопс, а суммарная производительность всей полутысячи суперкомпьютеров рейтинга насчитывает три сотни петафлопс, обозначать какие-то конкретные сроки появления первой «экзафлопсной» системы преждевременно. Тем не менее серьёзные изменения в верхних строках TOP-500 ожидаются уже в следующем году, и их источником с высокой долей вероятности станут Китай и Япония. Точно нельзя сбрасывать со счетов обновление нынешнего лидера, китайской системы Tianhe-2, результаты тестов которой, правда, появятся не раньше лета.
Серьезную заявку представляют собой и планы Cray по выпуску упомянутых выше суперкомпьютеров Trinity и Cori для научных лабораторий США. В настоящее время доподлинно известно, что обе они будут выполнены на базе сопроцессоров Intel Xeon Phi с переработанной архитектурой Silvermont (Knights Landing), с применением нового поколения процессоров Intel Xeon, оперативной памяти DDR4 DRAM и скоростной межблочной топологии Cray Aries.
В
Завершая наш экскурс по ближайшим перспективам суперкомпьютерной отрасли, хотелось бы ещё раз упомянуть возможности отечественной массово-параллельной архитектуры RSC PetaStream на основе Intel Xeon Phi, которой принадлежат вот уже более года непобитые мировые рекорды по вычислительной и энергетической плотности, а также по компактности.
Как показала сопутствовавшая конференции SC’14 выставка, многие ведущие мировые компании в области HPC только сейчас начали всерьёз относиться к возможностям жидкостного охлаждения кластерных систем. В этом смысле разработки РСК опередили многие мировые бренды на годы, поскольку компания изначально практикует охлаждение рабочих блоков «горячей водой». Более того, в суперкомпьютерах RSC PetaStream реализована разработанная совместно с Emerson Electric подсистема питания на базе отраслевого стандарта электропитания постоянным током с напряжением 400 В. Это позволяет значительно снизить сечение питающих шин, увеличить эффективность распределения электроэнергии более чем на 90% и таким образом повысить надежность и энергоэффективность при снижении эксплуатационных издержек.
Помимо этого архитектура RSC PetaStream, как утверждают ее создатели, хорошо масштабируется и может быть использована для моделирования нагрузок того самого «горизонта экзаскейла», включая разработку соответствующих приложений.