Использование гибридных вычислительных систем, сочетающих в себе классические процессоры Intel x86 и графические (как правило, Nvidia), — общепризнанная тенденция в мировом суперкомпьютинге. Главным доводом в пользу актуальности гибридов, как правило, выступает указание на исключительную энергоэффективность этих систем, что сегодня действительно является жизненно важным условием создания серьезных суперкомпьютеров.
Однако на гибридность есть и иная экспертная точка зрения, также подкрепленная вескими аргументами и реальными фактами.
В первой декаде декабря российская компания РСК объявила, что установленный ею в Южно-Уральском государственном университете (Челябинск) суперкомпьютер “СКИФ-Аврора ЮУрГУ” на основе процессоров Intel Xeon 5680 с применением жидкостного охлаждения стал самой энергоэффективной российской HPC-системой согласно новой редакции рейтинга Green 500 за ноябрь 2011 г., заняв в нем 109-е место. В настоящее время в Green 500 находятся всего пять суперкомпьютеров из России, и по сравнению с предыдущим рейтингом их число сократилось более чем в два раза.
В Green 500 входят самые энергоэффективные вычислительные кластеры в мире (по соотношению производительности и энергопотребления); он рассчитывается и публикуется дважды в год на основе данных популярного рейтинга Top 500 мощнейших суперкомпьютеров мира.
По данным списка Green 500 суперкомпьютер “СКИФ-Аврора ЮУрГУ” обладает энергоэффективностью на уровне 349,78 Мфлопс/Вт, обгоняя по этому показателю своего ближайшего российского конкурента (153-я позиция в Green 500) почти в полтора раза и потребляя при этом почти в десять раз меньше электроэнергии — всего 287,04 кВт.
В компании добавляют, что вычислительная система “СКИФ-Аврора ЮУрГУ” с пиковой производительностью 117 Тфлопс была построена на базе самых высокопроизводительных на тот момент моделей процессоров Intel Xeon 5680 с тактовой частотой 3,33 ГГц и тепловыделением 130 Вт, причем без использования графических ускорителей. С точки зрения РСК, лучшая позиция системы в Green 500 среди всех российских суперкомпьютеров убедительно подтвердила тот факт, что залогом энергоэффективности являются не графические ускорители как таковые, а ноу-хау построения энергоэффективных систем на базе мощных центральных процессоров и перспективного жидкостного охлаждения.
После этого заявления редакция посчитала нужным обратиться в компанию за разъяснениями, которые дали технический директор РСК Егор Дружинин и исполнительный директор Алексей Шмелев.
В первую очередь мы поинтересовались, корректно ли все же предположить, что если в “СКИФ-Авроре ЮУрГУ” будут использованы графические ускорители, то система станет еще более энергоэффективна. В ответ было указано на то, что решения, создаваемые РСК, разрабатываются с прицелом на достижение наибольшей эффективности во всех ключевых метриках: полезная производительность, энергопотребление (энергоэффективность), минимально занимаемая площадь (компактность) за счет высокой вычислительной плотности, совокупная стоимость владения (TCO) и пр. И накопленный опыт позволяет говорить, что графические процессоры, или ускорители (ГПУ) хороши только для одной области применения — обработки графических данных. С одной стороны, они демонстрируют высокую пиковую производительность, однако с другой, ГПУ до сих пор не показали эффективной работы при запуске больших кластерных приложений за исключением тестов Linpack. Поэтому даже если бы теоретическое включение графических ускорителей повысило пиковую производительность архитектуры “РСК Торнадо” и каким-то образом улучшило показатели в вышеупомянутом тесте, еще не факт, что общая эффективность системы заметно выросла бы от такой гибридной комбинации. Более того, все ключевые проекты РСК (в ЮУрГУ, Росгидромете, МФТИ), реализованные на основе архитектуры “РСК Торнадо” в 2011 г., на практике продемонстрировали, что используя лучшие из доступных на рынке стандартных (а не нишевых, то есть узкоспециализированных и дорогих) технологий (например, массовых серверных плат на базе Intel Xeon), возможно строить кластерные системы, высокоэффективные как по показателям абсолютной производительности, так и относительно других важнейших (в долгосрочной перспективе) параметров — потребляемой этой системой электроэнергии, общей цены решения и эксплуатационных расходов. В частности, вычислительный кластер Росгидромета, созданный на основе архитектуры “РСК Торнадо”, показал рекордную вычислительную эффективность — 92% от пика в тесте Linpack, — используя только центральные процессоры Intel Xeon 5680, в то время как эффективность графических процессоров обычно почти в два раза ниже и находится на уровне порядка 50% от пика. Соответственно в РСК уверены, что используя будущие серверные процессоры Intel Sandy Bridge, удастся еще больше улучшить реальную производительность и энергоэффективность систем заказчиков без необходимости переписывания “с нуля” их приложений для работы с графическими ускорителями.
Мы поинтересовались также, способен ли “СКИФ-Аврора ЮУрГУ” к “гибридному апгрейду” в принципе и есть ли у компании какие-либо конкретные планы на этот счет.
В ответ в РСК указали на то, что когда создавалось решение “СКИФ-Аврора”, оно на “гибридную модернизацию” рассчитано не было (хотя теоретически это возможно). В настоящий момент у РСК нет запросов от клиентов на добавление графических процессоров в решения на базе архитектуры “РСК Торнадо”. Для компании очевидно, что изначально завышенный интерес к ГПУ сейчас пошел на спад — так же как это было несколько лет назад с процессорами IBM Cell: после долгих рассуждений о “выдающихся” показателях Cell сейчас их уже никто не вспоминает и практически не использует.
В РСК сейчас отмечают большой интерес заказчиков к анонсированному появлению в 2012 г. ускорителя архитектуры х86 — Intel MIC. Утверждается, что решение показало производительность в 1 Тфлопс еще до официального выпуска, став наиболее быстрым ускорителем на рынке, а с учетом возможности сохранения исходного кода приложений — и самым реалистичным вариантом для серьезного улучшения показателя “производительность на ватт” для суперкомпьютера.
Резюмируя свой ответ, специалисты компании подчеркивают: несмотря на то, что архитектура “РСК Торнадо” позволяет интегрировать графические ускорители, в РСК считают, что наиболее эффективна и выгодна для заказчиков интеграция в их решение именно ускорителей Intel MIC.