Третий в мире суперкомпьютер nasa и sgi приносит отличную отдачу
До сих пор все усилия Национального агентства по аэронавтике и исследованию космического пространства обзавестись достаточными резервами вычислительных ресурсов оставались бесплодными. Как известно, NASA - государственная организация США, нацеленная на изучение космоса. Но здесь занимаются и массой других исследовательских проектов в области аэрокосмической техники, нанотехнологий, расшифровки ДНК-структур, а также земной метеорологии.
С давних времен NASA - крупнейший клиент фирмы Silicon Graphics (www.sgi.com) и других производителей суперкомпьютеров. Однако многие сотни ее штатных исследователей, будь то специалисты по долгосрочным прогнозам погоды или по влиянию среды на состояние космических челноков, не имели достаточных вычислительных мощностей и резервов для хранения данных.
В 2004 г. NASA решило покончить с этим хроническим дефицитом и заключило грандиозный контракт с SGI на поставку системы, призванной удесятерить общий объем ее вычислительных ресурсов. Проект Columbia предусматривал строительство в сжатые сроки мощнейшего в мире суперкомпьютера. Созданная в итоге система сегодня занимает третье место в мировом рейтинге суперкомпьютеров TOP500.
“Нам предстояло серьезно усилить свои высокоуровневые вычислительные ресурсы, - рассказал руководитель проекта Columbia Билл Тигпен из NASA. - Ведь мы подошли к такой точке, когда у нас отсутствовали свободные вычислительные мощности на случай срочного исследовательского проекта. Из-за этого нам приходилось отвлекать ресурсы, нацеленные на выполнение других проектов, притормаживая темпы многих плановых работ”.
В июле 2004 г. SGI и NASA официально приступили к строительству 20 самостоятельных систем, содержащих по 512 процессоров. Это было не совсем простым решением, так как создавать крупные системы гораздо труднее, чем просто подключать лишние процессоры.
“Чем масштабнее система, тем выше риск ее отказа”, - пояснила Джил Мацке, управляющий маркетингом SGI по высокопроизводительным вычислительным системам. По ее словам, SGI особенно беспокоили факты спадов продуктивности, отмечавшиеся в работе других сверхбольших систем.
NASA поставило условие - менее чем за год ввести систему в строй. Для соблюдения этих жестких сроков SGI пришлось перевести свои производственные участки на круглосуточный график работ и организовать тесное взаимодействие между NASA, SGI, корпорацией Intel (www.intel.ru), поставившей более 10 000 процессоров Itanium, и корпорацией Computer Sciences (Эль-Сегундо, шт. Калифорния), выполнявшей роль субподрядчика SGI по интеграции создаваемой системы.
“В этой ситуации, - сказал Тигпен, - мы избрали не совсем стандартный подход: NASA, Intel и SGI трудились как одна общая команда”.
В конструктивном аспекте SGI решила главные вопросы производительности, скоординировав взаимодействие своих систем Altix под началом 20 самостоятельных ОС, каждая из которых заведует узлом из 512 процессоров, вместо того, чтобы делать эти процессоры независимыми, а затем добиваться их слаженной работы. Такая структура существенно упрощает суперкомпьютерные вычисления.
Специалист компонует микросхемы
одной из 20 систем Columbia,
каждая из которых содержит
по 512 процессоров
Intel Itanium 2
Гигантский проект заставил SGI ввести ночные смены и отменить выходные дни. Как только сотрудники компании завершали сборку отдельных узлов, их отправляли специалистам CSC, трудившимся на площадке NASA Ames Research Center в районе Моффет-Филд (тоже расположенном в Маунтин-Вью) и соединявшим все компоненты в один суперкомпьютер, размещавшийся на площади около 1000 кв. м.
Как и в SGI, персонал CSC отработал немало сверхурочных часов, чтобы уложиться в сроки выполнения проекта. Алан Пауэрс, занимающий важный пост среди специалистов Computer Sciences, высоко оценивает труд очень ответственной и скоординированной команды, строго соблюдавшей график, по которому новые компоненты системы должны были приводиться в рабочее состояние не позднее чем через 3-5 суток после их доставки.
Когда через четыре месяца работа была завершена, оказалось, что ее выполнили не только досрочно, но с большой экономией бюджетных денег. По оценке Пауэрса, проект Columbia обошелся примерно в восьмую часть средств, затрачивавшихся на строительство некоторых других крупнейших суперкомпьютеров, например Earth Simulator в Японии.
Помимо оперативности Пауэрс ставит в заслугу SGI использование стандартных систем оперативной памяти, процессоров Intel и ОС Linux, что позволило снизить стоимость Columbia в сравнении с другими проектами SGI, использовавшими только ее собственные технологии. Тем не менее ряд фирменных разработок SGI, в частности технология межсоединений NUMAlink Interconnect Fabric для суперкомпьютеров, существенно помогла усилить эффективность Columbia, отметил он.
По словам Пауэрса, сегодняшние возможности NASA уже несравнимы с тем, что было лет пять назад, и Columbia сократила затраты времени на ряд важных проектов численного моделирования. Так, задания по моделированию мирового климата, на которые раньше уходило по нескольку месяцев, теперь выполняются за пару недель.
На данный момент, заявил Тигпен, специалисты NASA полностью удовлетворены громадным приростом своих вычислительных возможностей: “Всего за четыре месяца мы удесятерили то, чем располагали раньше. Мне приходит масса писем от ученых, которые сообщают, что благодаря Columbia они выполняют расчеты, ранее попросту невозможные. Например, при моделировании климата шаг сетки в восьмую часть градуса дает гораздо больше информации, чем шаг в полградуса. Columbia позволяет строить гораздо более точные модели”.
Автор статьи Андреа Орр живет в Сан-Франциско. С ней можно связаться по адресу: andrea_orr@sbcglobal.net.