В последних числах июня компания “Т-Платформы” сообщила, что в ходе проведения теста Graph 500 мощнейший российский суперкомпьютер “Ломоносов” продемонстрировал высшую среди участников производительность.
Свежая редакция нового суперкомпьютерного рейтинга является второй по счету (первая вышла полгода назад), и в ней пока фигурируют всего 28 машин.
Инициаторами Graph 500 выступили ведущие эксперты ряда национальных исследовательских центров, действующих под эгидой лаборатории Sandia (США). Данный проект призван определить вычислительные комплексы, наиболее эффективно обрабатывающие большие массивы разреженных данных, представленных в виде графа или базы данных.
В “Т-Платформах” отмечают, что задачи такого рода широко распространены в фармакологии, информационной безопасности и т. д. Для их эффективной реализации системы должны обладать высокой производительностью и обеспечивать массивную обработку сотен петабайт данных. В ходе теста оценивается время, затрачиваемое системами на обработку графа. При этом его результат измеряется количеством обработанных за единицу времени ребер. По результатам теста российский суперкомпьютер “Ломоносов” установил новый рекорд, достигнув уровня производительности в 43,5 GE/s (миллиардов обработанных ребер в секунду).
Впрочем, сразу нужно оговориться, что упомянутый показатель сейчас не является в рейтинге приоритетным (в отличие от размера обработанного графа), поэтому “Ломоносов” занимает в Graph 500 только третью строчку, пропустив вперед машины с меньшей производительностью. (В “Т-Платформах” уверяют, что кураторы рейтинга подумывают над тем, чтобы поменять акценты при составлении списка, но пока это лишь перспективы.)
Анонс свежего Graph 500 состоялся в рамках Международной суперкомпьютерной конференции (International Supercomputing Conference — ISC’2011), прошедшей в Гамбурге в последней декаде июня. Тогда же было объявлено о завершении модернизации (введении в эксплуатацию второй очереди) “Ломоносова” и одновременно с этим были представлены результаты другого суперкомпьютерного рейтинга Top 500, являющегося на данный момент самым известным проектом подобного рода, в котором кластеры ранжируются в зависимости от производительности, продемонстрированной на специализированном тесте Linpack.
С учетом того, что заявки на включение в оба рейтинга по их правилам требуется подавать заранее, в редакции поначалу возникло подозрение в подтасовке данных. И если в отношении Top 500 нас сложно чем-либо удивить (нарушения правил всплывают постоянно, но кураторов рейтинга это нисколько не заботит ) , то с уровнем качества Graph 500 хотелось разобраться подробнее.
Пояснения архитектора “Т-Платформ” Антона Коржа, являющегося непосредственным автором обоих оптимизаций “Ломоносова” под оба рейтинга, наши подозрения развеяло. По его словам, результат для Graph 500 был получен еще в марте и в тестировании не участвовали добавившиеся после модернизации узлы на основе графических процессоров (GPU), а только 4096 узлов с процессорами классической архитектуры.
Что касается теста для Top 500, то на нем был задействован весь кластер, что, по словам г-на Коржа, было сопряжено с существенными трудностями, так как для подобной гибридной конфигурации пока нет доступного варианта теста Linpack — его пришлось значительно модифицировать.
По уверению г-на Коржа, заявка подавалась в срок (в середине мая), и, в частности, именно поэтому был получен не слишком высокий КПД (отношение реальной производительности кластера к пиковой) — 49,5%. Будь времени больше, его бы наверняка удалось поднять до 52—53%.
Сопоставляя два рейтинга, г-н Корж отмечает, что они не выступают конкурентами, а скорее дополняют друг друга. По его словам, ни для кого не секрет, что Linpack является односторонним тестом и лишь небольшая часть задач на него похожа. Есть же ряд задач совсем иного свойства, для оценки производительности на которых и был придуман Graph 500.
Г-н Корж приводит образное сравнение суперкомпьютера с автомобилем. Пиковая производительность — это паспортная мощность мотора в лошадиных силах, Linpack и Top 500 — это стрит-рейсинг (соревнование в том, кто быстрее проедет 500 м по прямой), а вот Graph 500 — это езда по центру города по узким переулкам, где важна маневренность.