NVIDIA представила графический ускоритель NVIDIA Tesla P100 для PCIe серверов, который делает такие системы значительно производительнее и выгоднее по сравнению с системами на базе CPU.
Интерес исследователей и коммерческих организаций к супервычислениями сегодня высок как никогда. Согласно данным Национального научного фонда, большинство исследователей не имеют возможности зарезервировать достаточное количество времени на суперкомпьютерах для проведения необходимых исследований. Кроме того, сегодня активно увеличивается потребность в технологиях высокопроизводительных вычислений (HPC) для работы в ресурсоемких приложениях глубокого обучения (Deep Learning). Не последнюю роль играет тот факт, что исследователи все активнее применяют методы искусственного интеллекта (AI) для развития традиционных областей науки.
Графический ускоритель Tesla P100 для PCIe отвечает высоким вычислительным запросам благодаря несравненной производительности и эффективности графической архитектуры NVIDIA Pascal. Он позволяет создавать «суперузлы», пропускная способность которых превышает пропускную способность 32 узлов на базе CPU и сокращает капитальные и операционные расходы до 70% .
«Ускоренные вычисления — это единственный способ оперативно реагировать на активно растущий спрос исследователей по отношению к высокопроизводительным вычислениям и приложениям искусственного интеллекта, — отметил Ян Бак (Ian Buck), вице-президент по решениям для ускоренных вычислений в NVIDIA. — Использование систем на базе CPU требует построения огромного количества стандартных узлов, что приводит к несоразмерно большим затратам по отношению к получаемой производительности. Значительное масштабирование производительности с помощью меньшего количества более мощных узлов на базе Tesla P100 позволяет вкладывать больше средств в вычисления, а не в инфраструктуру».
Вычислитель Tesla P100 для PCIe доступен в стандартном PCIe форм-факторе и совместим с современными серверами на базе GPU. Он оптимизирован для ресурсоемких приложений высокопроизводительных вычислений и искусственного интеллекта. Один сервер на базе Tesla P100 мощнее 50 узлов на базе CPU при работе с приложением молекулярной динамики AMBER и быстрее 32 узлов на базе CPU при работе в приложении материаловедения VASP.
Ближе к концу года ускорители Tesla P100 для PCIe будут установлены в новую версию самого мощного суперкомпьютера Европы Piz Daint, расположенного в Швейцарском национальном супервычислительном центре в Лугано.
«Ускорители Tesla P100 обеспечивают новый уровень производительности и эффективности для решения самых сложных вычислительных задач нашего времени, — прокомментировал Томас Шультес (Thomas Schulthess), профессор вычислительной физики при Швейцарской высшей технической школе Цюриха и директор Швейцарского национального супервычислительного центра. — Модернизация 4500 GPU-ускоренных узлов в Piz Daint до Tesla P100 повысит производительность системы более чем вдвое, что позволит ученым быстрее совершать прорывы в ряде областей, включая космологию, материаловедение, сейсмологию и климатологию».
Tesla P100 для PCIe — это новейшее решение в составе платформы ускоренных вычислений NVIDIA Tesla. Один узел Tesla P100 на базе Pascal обеспечивает 4.7 терафлопс и 9.3 терафлопс пиковой производительности одинарной и двойной точности соответственно, что соответствует суммарной производительности более 32 серверов на базе CPU.
Tesla P100 объединяет процессор и данные в одном блоке, обеспечивая беспрецедентный уровень эффективности вычислений. Инновационный подход к структуре памяти — чип-на-пластине-на-подложке (CoWoS) с HBM2 — втрое повышает полосу пропускания памяти — до 720Гб/с — по сравнению с архитектурой NVIDIA Maxwell.
Технология Page Migration Engine для упрощения параллельного программирования позволяет разработчикам сосредоточиться на повышении производительности вместо управления движением данных и позволяет приложениям превышать физический размер памяти GPU за счет поддержки страничной организации памяти. Технология унифицированной памяти существенно увеличивает продуктивность работы благодаря единому пространству памяти для всего узла.
Платформа Tesla является одной из ведущих в мире платформой HPC-вычислений благодаря поддержке 410 GPU-ускоренных приложений, включая девять из десяти ведущих 10 HPC-приложений.
Характеристики Tesla P100 для PCIe: производительность в 4.7 терафлопс для вычислений двойной точности и 9.3 терафлопс для вычислений одинарной точности и 18.7 терафлопс для вычислений половинной точности с технологией NVIDIA GPU BOOST; поддержка PCIe Gen 3 (32ГБ/с в обоих направлениях); улучшенная программируемость с технологией Page Migration Engine и унифицированной памятью; защита ECC для повышенной надежности; оптимизация под сервер для высокой скорости передачи данных и надежности.
В наличии две конфигурации: 16 Гб стековой памяти CoWoS HBM2 обеспечивает пропускную способность в 720 Гб/с; 12GB стековой памяти CoWoS HBM2 обеспечивает пропускную способность в 540 Гб/с.
Графический ускоритель NVIDIA Tesla P100 для PCIe-систем будет доступен в четвертом квартале 2016 года от реселлеров и производителей серверов, включая Cray, Dell, Hewlett Packard Enterprise, IBM и SGI.