17 ноября на специализированной конференции в американском Портленде была представлена очередная, 34-я по счету редакция рейтинга мощнейших вычислительных машин планеты Top 500.
От России в список попали восемь машин, и после изучения биографий некоторых из них у редакции есть все основания утверждать, что больше ни один из производителей суперЭВМ, представляющих сейчас свои решения в нашей стране, не может похвастаться строгим соблюдением общеизвестных правил подачи заявок в рейтинг.
С учетом того что зарубежные кураторы Top 500 и сами относятся к трактовке и соблюдению собственных правил крайне странно, ситуация (как минимум в контексте России) окончательно превращается в фарс.
Теперь обо всем по порядку.
Дела минувшие
Напоминаем, что Top 500 традиционно составляется два раза в год (в ноябре и июне) ведущими экспертами США из Государственного научно-исследовательского вычислительного центра министерства энергетики, а также из университетов Мангейма и Теннеси. Строчки в рейтинге распределяются в соответствии с тем, какую производительность продемонстрировали системы при прохождении специального стандартного теста Linpack.
На официальном сайте Top 500 в соответствующем разделе четко говорится: для того чтобы претендовать на место в осенней редакции списка, необходимо подать заявку с протоколом теста Linpack до 1 октября и не позднее 1 ноября запустить машину на постоянном месте будущей работы (“All system reported have to be installed by November 1st”).
Полтора года назад у редакции была возможность убедиться в том, что данные положения правил ведущими мировыми поставщиками суперкомпьютеров зачастую игнорируются. В ходе нашего расследования выяснились весьма любопытные вещи о машинах из ноябрьского рейтинга 2007 г. (последнего на тот момент). Так, суперкомпьютер IBM в УГАТУ (181 строка Top 500) был собран и прошел Linpack-тестирование лишь в начале января 2008 г. Суперкомпьютер IBM в СФУ (183 строка) был доставлен и установлен в университете к началу декабря 2007 г. А еще одна машина IBM из МСЦ РАН (183 строка) как минимум 25 октября 2007 г. уже была разобрана на части и распределена между несколькими учреждениями страны.
В отношении кластеров компании HP исчерпывающую информацию получить тогда не удалось. Сотрудники МСЦ РАН ушли от ответа на вопрос, когда у них была установлена машина МВС-100К (33 строка), но поставили под сомнение дедлайн 1 ноября. При этом официальная презентация суперкомпьютера состоялась только 27 февраля 2008 г.
Также странно выглядела и ситуация с кластером HP в ВятГУ (242 строка), чья презентация прошла 25 января 2008 г.
Чтобы прояснить некоторые нюансы составления рейтинга, редакция тогда обратилась к одному из главных кураторов рейтинга Джеку Донгарре. И отвечая на наиболее неудобные вопросы о нарушении сроков запуска суперкомпьютеров, он сослался на некое “правило двух месяцев”, совершенно не объяснив, что оно означает.
Абсурдность данного правила стала ясна уже в июне 2008 г. Вышел очередной Top 500, для попадания в который по общепринятым (публичным) стандартам необходимо подать заявку с протоколом теста до 15 апреля и не позднее 15 мая запустить машину на постоянном месте работы. На первой строчке этого рейтинга оказался комплекс IBM Roadrunner, триумфально перешагнувший петафлопсный рубеж. Однако, судя по западным публикациям, он разогнался до петафлопса в первых числах июня, а его поставка на место назначения была намечена на август. По какому календарю г-н Донгарра отсчитывает свои два месяца, можно только гадать.
Более того, еще через полгода к выходу ноябрьской редакции Top 500 стало очевидным, что каким бы ни было загадочное правило, применяется оно избирательно. За несколько дней до публикации рейтинга кластер Cray XT Jaguar был разогнан до значений производительности, позволяющих ему претендовать на первую строку Top 500. Однако в полном соответствии с публичными правилами в сводную таблицу попали показатели более ранних тестов, и вершина топа снова осталась за IBM Roadrunner. Стало быть на Cray непубличное правило не распространяется.
Итак, чего же в итоге редакция добилась своим расследованием? Джек Донгарра держит в голове загадочное правило, использует его избирательно, да еще и отсчет таинственных двух месяцев осуществляет произвольно. Западные гиганты этого либо не замечают, либо воспринимают как должное. Российские представительства вендоров и владельцы машин об этом правиле ничего не знают, ориентируются на публичные правила на сайте, но легко их нарушают либо производят инсталляции в атмосфере ничем не мотивированной секретности, закономерно провоцирующей кривотолки.
Наверное, всю эту неразбериху стоило еще тогда начать воспринимать как данность — если игра без правил устраивает всех участников рынка, включая, судей, то, наверное, это их право. Просто СМИ при этом надо перестать вводить общественность в заблуждение, апеллируя тем или иным образом к Top 500.
Но в том-то и дело, что полтора года назад в России еще существовали разработчики, настаивавшие на честной игре в соответствии с публичными (а не тайными) правилами. Речь идет о головном исполнителе суперкомпьютерной программы “СКИФ-ГРИД” Союзного государства России и Белоруссии — Институте программных систем (ИПС) им. А. К. Айламазяна РАН, а также компании “Т-Платформы”.
Что ж, прошедшие с тех пор полтора года привели ситуацию к общему знаменателю.
Свежий рейтинг
В ноябрьском Top 500 текущего года оказалось сразу четыре новых суперкомпьютера с российской пропиской. Два из них произведены IBM, базируются в неназванных банке и правительственной организации, и открытых данных о них нет. А вот два других расположились в публичных государственных учреждениях. Они-то нас и интересуют.
Заявленная Linpack-производительность суперкомпьютера “Ломоносов” из научно-исследовательского центра МГУ им. М. В. Ломоносова, произведенного компанией “Т-Платформы”, составила ни много ни мало 350,1 Тфлопс, что позволило ему занять аж 12-ю строку Top 500. Это достижение для отечественной индустрии можно без всяких оговорок назвать по-настоящему знаковым.
Редакция обратилась к заместителю директора центра Владимиру Воеводину с вопросом, проводились ли уже заявленные в рейтинге испытания, или машина попала в него авансом? Ответ г-на Воеводина выглядел следующим образом: “Машина протестирована в компании “Т-Платформы”, затем перевезена к нам в университет, сейчас идет наладка/тестирование на месте”. Это письмо пришло 18 ноября и ровно неделей позже состоялась официальная презентация “Ломоносова”. Однако, исходя из ответа г-на Воеводина, можно сделать однозначный вывод, что 1 ноября машина была еще в нерабочем состоянии. Если “правило двух месяцев” на данный случай распространяется, то дата реальной презентации легко под него подгоняется. Но публично заявленное правило рейтинга явно нарушено.
Второй интересующий нас кластер “СКИФ-Аврора” прописан в Южно-Уральском государственном университете (ЮУрГУ). И вот с ним-то все оказалось совсем загадочно.
По информации из открытых источников контракт на поставку суперкомпьютера в университет был подписан с организацией “РСК-СКИФ” 5 ноября текущего года, а ввод системы в промышленную эксплуатацию намечен на I квартал 2010 г. Несмотря на очевидное нарушение правил Top 500, данная машина уже занимает 450 строку рейтинга.
Казалось бы, результат налицо, и уточнения излишни. Однако с учетом того, что в создании “Авроры” было заявлено непосредственное участие ИПС РАН, чей директор Сергей Абрамов еще совсем недавно являлся самым ярым борцом за чистоту Top 500, редакция решила обратиться к нему за комментариями.
Г-н Абрамов со всеми вопросами относительно сроков поставки переадресовал нас к “РСК-СКИФ” (дескать, контракт подписывала именно она — независимая во всех смыслах организация). При этом он заверил нас, что “ребята дела ведут честно, “СКИФ-Аврора” создана и работает”.
К “РСК-СКИФ” нас переадресовал и директор Суперкомпьютерного центра, завкафедрой системного программирования ЮУрГУ Леонид Соколинский.
Исполнительный директор этой компании Алексей Шмелев на вопрос, существовала ли машина физически (целиком или фрагментарно) перед подписанием контракта, или ее только сейчас начнут собирать и отлаживать на территории университета, ответил несколько расплывчато: любую суперЭВМ сначала собирают на заводе-изготовителе, где машина проходит тщательное тестирование, после чего ее разбирают и устанавливают у заказчика.
Тогда были заданы уточняющие вопросы: правильно ли редакция понимает, что сборка на заводе-изготовителе начинается после подписания контракта (т. е. сейчас); суперЭВМ конкретной мощности ведь не делают (в России по крайней мере) на всякий случай — в надежде найти заказчика после; или какая-то договоренность с университетом существовала и ранее?
Ответы г-на Шмелева выглядели следующим образом: “Договоренности не было; ЮУрГУ объявил тендер, и мы его выиграли; с производственными планами все намного сложнее; я бы не хотел вдаваться в тонкости наших процессов принятия решений и наших планов продаж, но все совсем не так просто, как вы себе это представляете”.
Хорошо. Давайте поговорим о том, как мы себе это представляем. В официальном пресс-релизе по случаю подписания контракта сказано, что “в ЮУрГУ сейчас осуществляют адаптацию существующего и разработку нового ПО для “Авроры”, используя для этого два вычислительных модуля суперкомпьютера, установленные в университете”. Напрашивается предположение, что разработчиками было создано некое масштабируемое решение. Его прототип (отнюдь не сам кластер заявленной мощности) сейчас служит базой для построения полноценной системы. И соответственно в Top 500 попала прогнозируемая, а не реальная производительность по Linpack. Наверное, у участников проекта есть иное объяснение ситуации, но они им не делятся.
Выводы
Итак, что нам в итоге продемонстрировал новый рейтинг? Отечественные разработчики, ранее показывавшие пальцем в сторону западных поставщиков, теперь сами решили, скажем так, не сопротивляться общим тенденциям.
Полагать, что с большим уважением к рейтингу стали относиться их зарубежные коллеги, также нет никаких оснований. Например, лидер отрасли IBM по-прежнему использует лазейку в правилах Top 500 и продолжает заниматься переносом данных от одних машин к другим подобным, но более мощным. Масштабы этого явления увеличиваются, и в новом рейтинге есть совершенно замечательный фрагмент с 330 по 358 сроку, где у всех суперкомпьютеров разная пиковая, но одинаковая Linpack-производительности. То есть по всем признакам, вслед за одним протестированным в 2008 г. кластером в список прицепом попало еще 28 машин. (Если бы тест прогнали на них, результаты оказались бы выше.) Сколько из этой армии по тем или иным причинам не доехало в срок до владельцев и стало мертвыми душами, одному богу известно (а в списке есть и еще, более мелкие подобные фрагменты).
Г-н Абрамов уверяет, что своих убеждений не менял. Дескать, если играешь в игру, то надо строго придерживаться правил, а приходя в чужой монастырь, надо следовать его уставу. Top 500 — чужой монастырь, и после достопамятных пояснений г-на Донгарры, по всей видимости, г-ну Абрамову стало ясно, что его устав де-факто “гибче”, чем это можно понять из официальных документов. А значит о чем-то спорить нет оснований. Но чего тогда стоит такой рейтинг?