В Рыбинске состоялось открытие нового суперкомпьютерного центра Научно-производственного объединения “Сатурн”. Пиковая производительность запущенной в эксплуатацию кластерной системы составила 14,3 Тфлопса, что позволило этой машине стать самым мощным на сегодняшний день суперкомпьютером, использующимся в промышленности России и стран СНГ (по крайней мере из числа тех систем, данные о которых можно найти в открытых источниках.)
Как отмечают на предприятии, вычислительные системы подобного уровня в мировой практике имеют собственные имена. Некоторое время назад в “Сатурне” был объявлен конкурс среди работников на лучшее имя для нового суперкомпьютера. Из нескольких сотен предложенных вариантов победителем было признано имя “АЛ-100” в честь 100-летия со дня рождения основателя компании, выдающегося ученого и конструктора Архипа Михайловича Люльки, двигателям которого традиционно присваивалась марка “АЛ”.
“Сатурн” – одна из крупнейших корпораций, специализирующихся на разработке и производстве газотурбинных двигателей для военной и гражданской авиации, судов военно-морского флота, а также энергогенерирующих и газоперекачивающих установок. И когда на пресс-конференции, посвященной созданию кластера, речь заходила о применении суперкомпьютера, в равной степени упоминались и военные, и гражданские программы предприятия.
Заказчиком системы выступила конструкторская служба “Сатурна”. Генеральным подрядчиком стала компания КРОК, а построение системы происходило при непосредственном участии специалистов IBM, Intel и APC by Schneider Electric.
Созданная машина представляет собой кластер на базе решения IBM System Cluster 1350. Основой для вычислительного поля стали блейд-серверы HS21 на базе четырехъядерных процессоров Intel, объединенные высокоскоростной сетью Infiniband. Расчетное поле включает 1344 ядер Intel Xeon и 1344 Гб оперативной памяти.
Управление кластером осуществляет ПО IBM Cluster Systems Management (CSM), а для обеспечения управления вычислительными заданиями используется ПО IBM Tivoli Workload Scheduler LoadLeveler. (По словам заместителя генерального конструктора, начальника расчётно-исследовательского управления “Сатурна” Юрия Шмотина, аналогичного российского ПО на рынке пока просто нет.)
Работоспособность системы обеспечивается комплексом инженерной инфраструктуры, включающей системы бесперебойного электропитания, прецизионного кондиционирования и автоматического газового пожаротушения. Все они объединены системами централизованного мониторинга и автоматизации.
Как отметил заместитель директора по ИТ НПО “Сатурн”, руководитель проекта по созданию суперкомпьютера Юрий Зеленков, у его предприятия весьма богатая история работы с передовыми электронно-вычислительными системами. По его словам, первый сверхмощный для своего времени компьютер в Ярославской области появился в 60-х годах ушедшего века именно на “Рыбинских моторах” (заводе, вошедшем впоследствии в объединение “Сатурн”).
Впрочем, и в вопросах современных параллельных вычислений инженеры “Сатурна” уже не новички. В 2005 г. на предприятии был установлен суперкомпьютер производительностью 0,9 Тфлопс. Как отмечает руководство, его запуск позволил конструкторским подразделениям перейти на новый уровень аналитического проектирования, основанный на использовании численных методов на всех этапах разработки газотурбинных двигателей — самых сложных, с точки зрения директора по ИТ “Сатурна” Александра Пионтковского, механических изделий, производимых промышленностью.
Запустив первый кластер, руководство рассчитывало, что его мощностей предприятию хватит на пять, а то и десять лет. Однако уже в 2006-м к ресурсам суперкомпьютера были подключены филиалы НПО в Москве и Перми, и загрузка кластера фактически приблизилась к насыщению. В середине 2007 г. было принято решение об установке нового суперкомпьютера, превосходящего своего младшего брата по производительности более чем в 15 раз. Теперь уже на предприятии не строят иллюзий относительно неисчерпаемости ресурсов машины и считают, что ее мощностей “Сатурну” хватит года на три.
В создании первого кластера также принимали участие компании КРОК и IBM, однако, как подчеркивает Александр Пионтковский, ко второму проекту они были допущены исключительно по той причине, что выиграли новые объявленные объединением конкурсы. Представители компаний эту информацию подтвердили. По утверждению директора направления аппаратных средств IBM в России и СНГ Сергея Бугрина, им пришлось доказывать свою состоятельность буквально с нуля. Технологии не стоят на месте, и предложенные решения позволили создать многократно более мощную систему, энергопотребление которой осталось практически на том же уровне.
Установка первой машины закономерно была сопряжена с рядом трудностей, и главные проблемы были связаны с системой инфраструктуры. С учетом этого опыта второй кластер решено было строить, объявив на реализацию этой части проекта отдельный конкурс. Его победителем стала компания APC by Schneider Electric, предложившая решение, представляющее собой открытую, гибкую, интегрируемую архитектуру, легко масштабируемую, как уверены на предприятии, и наращиваемую вместе с ростом потребностей “Сатурна”.
В том, что эти потребности обязательно будут расти, в компании нисколько не сомневаются (только в прошлом году “Сатурн” запустил в опытную эксплуатацию три новых авиадвигателя). Поэтому Александр Пионтковский отдельно обратил внимание на то, что в серверном помещении суперкомпьютерного центра осталось место еще для одной приблизительно такой же по габаритам системы. И, по его уверению, оно обязательно будет заполнено в обозримом будущем. Причем первая дополнительная кластерная стойка может появиться в самое ближайшее время и доведет пиковую производительность машины до 15,5 Тфлопс.
Говоря о стоимости проекта, на предприятии отмечают, что на 60% она сложилась из расходов на саму вычислительную систему, а на 40 — из расходов на инфраструктуру. В денежном выражении сумма прямых инвестиций составила 70 млн. руб., однако г-н Пионтковский склонен считать, что с учетом интеллектуальных и прочих затрат смело можно говорить о стомиллионных вложениях.
В оценке экономической целесообразности открытия нового центра в “Сатурне”, по утверждению руководства, применяется весьма гибкий подход. В объединении резонно считают, что в современной авиационной индустрии ни одно предприятие не способно создавать новую конкурентоспособную продукцию без применения передовых информационных технологий. Впрочем, если подходить к подобным проектам исключительно с позиций экономики, то, по оценкам руководства, первый кластер окупился примерно за 15 мес, ориентировочный период возврата вложений второго суперкомпьютера — полгода.
Ну и когда речь заходит о теории, то вводя в эксплуатацию суперЭВМ, его создатели обычно склонны рассуждать о том, какое бы место кластер занял в текущих рейтингах Top 500 (мощнейшие машины мира) и Top 50 (ареал России и стран СНГ). Данное мероприятие не стало исключением — организаторы записали “АЛ-100” в четвертую сотню и в первую пятерку соответственно. Впрочем, пока это все чистой воды прогнозы. Стандартный тест Linpack, по результатам которого машины могут претендовать на строчки в упомянутых рейтингах, в “Сатурне” еще не проводился.