В мультиках Warner Bros. страус Роад Раннер мчится по пустыне и постоянно обгоняет своего вечного соперника-койота благодаря невероятной скорости бега и быстроте мышления. Суперкомпьютер IBM с тем же именем Roadrunner тоже станет обитать в пустыне штата Нью-Мехико, точнее — в Лос-Аламосской национальной лаборатории. И подобно своему популярному тезке сможет обойти конкурентов благодаря скорости работы и быстроте мышления, то бишь вычислений. Как утверждают представители IBM, эта гигантская система просто обречена на роль самого быстрого в мире суперкомпьютера.
На заводе IBM в штате Нью-Йорк инженеры сейчас завершают подготовку к отправке Roadrunner министерству энергетики США в Лос-Аламос, которая намечена на август. Главный инженер корпорации Дональд Грайс, курирующий проект создания компьютера ценой в 100 млн. долл., полагает, что производительность его детища сможет выйти на уровень 1 Пфлоп, т. е. машина будет в состоянии выполнять каждую секунду один квадрильон вычислительных операций. Если это случится, Roadrunner первым достигнет цели, к которой рвутся многие производители подобных систем, включая Cray, Sun Microsystems и SGI. Несколько недель назад SGI и Intel рассказали о своих планах по созданию суперкомпьютера для NASA с производительностью более 1 Пфлоп, над собственной системой такого же класса активно работает и Sun, также обещая превзойти этот знаковый уровень.
С технической точки зрения у Roadrunner есть одна уникальная особенность, в корне отличающая его от других суперкомпьютеров, включая Blue Gene той же самой IBM, который занимает несколько верхних строк в рейтинге Top 500. Это — применение процессоров Cell, разработанных совместными усилиями IBM, Sony и Toshiba для игровых приставок наподобие PlayStation. На этот раз Голубой гигант создал гетерогенную структуру, где стандартная архитектура x86-процессоров Opteron сочетается с микросхемами Cell, которые выступают в роли ускорителей системы Roadrunner. Такая внутренняя структура должна облегчить создание приложений для нового суперкомпьютера. Благодаря ей разработчики получат возможность писать приложения, в которых наиболее ресурсоемкие задачи будут возлагаться на Cell, а стандартными вычислениями станет по-прежнему заниматься семейство х86.
“Дойдя до фрагмента со сложными вычислениями, программист сможет ускорить его выполнение, — пояснил Грайс в интервью eWeek. — С этим, конечно, придется немного повозиться, но лишь один раз, а затем можно будет пользоваться этим модулем снова и снова. Мы уже проверили несколько таких подпрограмм, и все отлично срабатывало. Концептуально это мало чем отличается от ветвления в ассемблерном языке, так что программисту нужно лишь выделить ресурсоемкие фрагменты исходного текста и перевести их на Cell. После этого остается только написать такой же, как и в ассемблере, код их выполнения на ускорителе и идти дальше”.
Подобная конструкция суперкомпьютера помогает преодолеть некоторые сложности, возникающие из-за повышения плотности упаковки компонентов в микропроцессоре и увеличения количества ядер при неизменной тактовой частоте. Кроме того, таким способом IBM добилась снижения энергопотребления своей новой машины с одновременным повышением скорости ее работы до 1 Пфлоп и выше.
По оценкам аналитика Illuminata Гордона Хаффа, выбранный IBM подход идет в русле общей тенденции развития высокопроизводительных суперкомпьютеров, предполагающей отход от однородных систем в пользу гибридных решений с применением разнотипных микропроцессоров, каждый из которых заточен под выполнение какой-то конкретной задачи. “На такой путь уже выходят вычислительные системы общего назначения, все шире обсуждается сейчас и вопрос объединения разнородных элементов, — рассказал Хафф. — Главная трудность здесь связана с ПО, так как у нас пока еще нет отработанной модели программирования гетерогенных вычислительных сред. К счастью, в области высокопроизводительных суперкомпьютеров, особенно их старших моделей, программисты гораздо спокойнее воспринимают сложности, прекрасно сознавая, с какими скоростями приходится иметь дело”.
Согласно данным IDC, рынок сверхвысокопроизводительных суперкомпьютеров вырос в 2007 г. на 15,5% и достиг уровня 11,6 млрд. долл. Как ожидается, такой рост будет продолжаться, и к 2011-му общий объём данного сегмента составит около 15 млрд. долл.
А ведь технологии, созданные для суперкомпьютеров, как не устают повторять аналитики и производители, через какое-то время прокладывают себе путь и в корпоративную среду. В качестве примера Грайс приводит финансовые организации, которые прямо-таки жаждут заполучить в свой арсенал суперкомпьютерную технологию, чтобы предельно ускорить транзакции и обработку огромных массивов данных.
Кроме микропроцессоров Cell Грайс и его коллеги решили включить в Roadrunner и стандартные компоненты IBM, равно как и других производителей. Примечательно, что все микропроцессоры AMD и “лезвия” IBM будут работать исключительно под управлением операционной системы Fedora Linux фирмы Red Hat. Сердцем же Roadrunner является, по терминологии IBM, “трехлезвийник” — узел в составе двух лезвий BladeCenter QS22 с четырьмя процессорами Cell, одного лезвия LS21 с двумя процессорами Opteron и еще одного лезвия ввода-вывода данных. Связь каждого ядра Opteron с соответствующим процессором Cell инженеры IBM доверили шине PCI Express.
Для Roadrunner, как и для представленного 13 мая лезвийного сервера QS22, корпорация IBM выбрала процессоры Cell модели PowerXCell 8i, которые обладают встроенной поддержкой вычислений с удвоенной точностью. Это позволяет в два раза повысить скорость обработки данных, что, естественно, крайне важно для решения научных задач.
После сборки Roadrunner в Лос-Аламосе – она должна завершиться ближе к концу нынешнего года -- начнется серия проверок интерконнектов на основе коммутаторов Voltaire InfiniBand. Один такой блок содержит до 16 стоек, каждая из которых вмещает 180 специально изготовленных “трехлезвийников”.
Всего в Лос-Аламосе планируется развернуть 18 таких “соединенных устройств”, что и позволит довести производительность системы в непрерывном режиме до петафлопсного уровня.