СУПЕРКОМПЬЮТЕРЫ

В мае 2006 г. вышел аналитический отчет IDC, посвященный рынку высокопроизводительных серверов, в который включены параллельные суперкомпьютеры, векторные машины, кластеры, а также устройства новых архитектур. За прошлый год этот рынок резко вырос (на 23%!) - до 9,1 млрд. долл. Быстрее всего развивается ниша кластеров. Сектор серверов всех типов составил 51,3 млрд. долл., увеличившись на 4,4%.

Наибольший спрос на подобные решения приходится со стороны академических структур и университетов - он вырастет с 1,7 млрд. долл. в 2005 г. до 2,5 млрд. в 2010-м. Через пять лет биоинженеры всего мира готовы потратить на суперкомпьютеры 2,2 млрд. долл., пользователи САПР - 2 млрд., а исследовательские государственные и военные структуры - примерно по 1,7 млрд. долл.

Неожиданностью на этом оптимистичном фоне стало июньское исследование IDC, посвященное рынку высокопроизводительных машин Японии. Хотя в минувшем году этот рынок подрос на 5,6% и составил 57 млрд. йен (примерно 520 млн. долл.), к 2010-му он скорее всего уменьшится до 41,8 млрд. Обычно основной объем заказов на суперкомпьютеры поступает японским компаниям от местных университетов и различных исследовательских структур, которые постепенно сокращают свои запросы. Эксперты IDC полагают, что такое снижение интереса со стороны научных организаций временно, просто поставщики производительных решений переориентируются на частных потребителей, предлагая новые линейки машин с возможностями, учитывающими нужды коммерческих структур, и их адаптация к научным задачам требует времени.

Дестабилизирующее воздействие на рынок оказывают и растущие сомнения проектировщиков высокопроизводительных машин в перспективности векторной архитектуры - типовой для Японии модели построения суперкомпьютеров. Эти сомнения усиливаются и малой отдачей от ряда масштабных проектов в этой области, в частности 10-летнего проекта по созданию логических компьютеров 5-го поколения, завершившегося в 1989 г. Главной причиной его относительной неудачи стали излишне сложные математические подходы, для эффективного воплощения которых требовались машины с производительностью порядка 10 Гфлопс. Сегодня, судя по всему, компании этой страны готовы частично отказаться от 30-летнего опыта создания векторных машин в пользу гибридных и grid-систем.

Суперкомпьютерная гонка супердержав

Японская суперкомпьютерная индустрия развивалась в постоянном соперничестве с аналогичной индустрией США. На запуск в 1976 г. в американской ядерной лаборатории Лос-Аламоса первого суперкомпьютера Cray-1 с производительностью 160 Мфлопс японцы ответили спустя год внедрением супермашины FACOM 230-75 производства компании Fujitsu. Она предназначалась для научных расчетов и на первый взгляд сильно отставала в производительности, показывая лишь 22 Мфлопс. Через год к ней присоединилась система HITAC M-180IAP фирмы Hitachi с показателем 10 Мфлопс. Однако она, в отличие от американской модели, являлась многофункциональной и могла использоваться для самых разных задач. На HITAC, в частности, заработала уникальная ОС, поддерживающая 40 типов векторных инструкций. В нее входил первый в мире автоматический компилятор Фортрана для векторного процессора, успешно транслировавший для новой архитектуры существовавшие программы на Фортране - их модификации не требовалось. Схожее программное решение попыталась реализовать в 1979-м американская фирма Denelcor. Она выпустила машину HEP-1 (160 Мфлопс), которая поддерживала оригинальную для того времени многопотоковую архитектуру. В поставку для HEP-1 был включен компилятор, способный автоматически распараллеливать исходный код.

Японские компании в то время сделали стратегический выбор в пользу векторных машин. При этом, правда, они часто реализовывались не как самостоятельные решения, а как векторные процессоры, расширяющие возможности типовых американских мэйнфреймов. В США же в векторной архитектуре создавались лишь машины Cray, а другие аппараты строились преимущественно в многопроцессорных архитектурах с распределенной памятью. Однако подход японцев (мощная векторная логика, сосредоточенная в одном процессоре, и большие объемы ОЗУ - до 512 Мб) оказался эффективнее. За считанные годы японцы обогнали своих конкурентов: в 1985 г. система FACOM VP-400 первой в мире преодолела порог в 1 Гфлопс (с результатом 1,14 Гфлопс), вскоре к ней присоединилась машина NEC SX-2 (1,3 Гфлопс). Американцы тогда смогли найти лишь векторный ответ: выпущенный в том же году Cray-2 почти достиг показателя 2 Гфлопс. Однако вскоре США запустили масштабную программу развития суперкомпьютерных ресурсов и одновременно стали оказывать давление на Японию, требуя от нее закупок американской супертехники. В результате уже к концу 1980-х годов на первые места по производительности вышла большая группа американских кластеров - например Intel iPSC/860, составленный из 128 процессоров суммарной производительностью 2,6 Гфлопс.

Гонка продолжалась. Ответом Японии стала первая многопроцессорная векторная машина NEC SX-3 (четыре процессора общей производительностью 5 Гфлопс), сразу завоевавшая популярность у пользователей, а вот вышедшую в 1993 г. американскую Cray-3 (16 Гфлопс) не приобрел ни один заказчик. Через два года появилась крайне удачная модель NEC SX-4 (64 Гфлопс), а другой японский комплекс CP-PACS (614 Гфлопс) занял первое место в Top500. (Интересно, что уже в 2003 г. он вообще выбыл из списка как самая медленная система.)

Наконец, в 1996 г. специализированная японская машина Grape-4, предназначенная для астрофизических расчетов, показала удивительный по тем временам результат в 1 Тфлопс. Его в 1998-м повторила система Hitachi SR8000 с псевдовекторной архитектурой на базе RISC-процессоров.

Японские компании успешно развивали новые векторные архитектуры с эффективным доступом как к общей, так и к распределенной памяти. Кроме того, было принято важное решение об использовании Unix в качестве базовой ОС для векторных машин... Однако в середине 1990-х годов вследствие масштабного сокращения военных бюджетов рынок суперкомпьютеров испытал резкий спад спроса и множество исследовательских проектов было закрыто.

В 2005 г. рынок высокопроизводительных систем вырос на 23% и составил 9,1 млрд. долл.

В результате конец XX в. прошел под знаменем кластерной модели IBM. Система ASCI Blue по моделированию ядерных взрывов продемонстрировала в 1998 г. пиковый результат 3 Тфлопс, а вот новая модель NEC SX-5 достигла лишь 128 Гфлопс. Но в 2001-м первое место в Top500 захватила (причем с очень значительным отрывом от преследователей) японская система "Симулятор Земли" с пиковой производительностью почти 41 Тфлопс. Ситуация изменилась только в конце 2004-го с выходом суперкомпьютерного кластера IBM BlueGene (91 Тфлопс). Представители этого семейства лидируют и поныне: результат IBM BlueGene/L равен 360 Тфлопс.

Сегодня сильнейшая векторная машина Hitachi SR11000 из 80 процессоров, внедренная в метеорологической службе, демонстрирует лишь 10,7 Тфлопс. Примерно на таком же уровне остановились и комплексы NEC: SX-8 достиг показателя 9 Тфлопс. Но существуют в Японии и невекторные решения - grid-сеть Токийского технологического университета (10 480 процессоров AMD Opteron) достигла уже 50 Тфлопс. Она создана в рамках национальной программы развития grid-сетей NAREGI (www. naregi.org). Центр вычислительных наук CCS университета Цукубы в июле 2006 г. приступил к сборке обновленной версии машины CP-PACS из 2560 процессоров Intel Xeon, которая должна показать производительность 14,3 Тфлопс.

Соотношение сил в суперкомпьютерной гонке напоминает ситуацию пятилетней давности - вроде бы отставание от США велико, однако потом появляется сверхпроизводительная система, которая становится лидером на много лет. Каким будет ответ Японии?

Гибридная векторно-оптическая архитектура

Суперкомпьютерная индустрия этой страны развивалась с прицелом на единичных крупных потребителей из научных сфер. При этом в силу технических и политических причин векторные системы выпускались как расширения зарубежных мэйнфреймов. Кроме того, мощной национальной полупроводниковой индустрии было по силам разрабатывать уникальные процессоры, сравнимые по производительности с масштабной параллельной архитектурой из множества узлов. Поэтому за счет множества перспективных наработок с большим потенциалом приверженность векторной архитектуре сохранится в Японии еще много лет: софт для нее создавать гораздо проще, нежели для кластерных, и она хорошо подходит для решения обширного класса задач.

Сильнейшие системы США, несмотря на рекордную мощность, сложны в производстве, а создание ПО для них обходится весьма дорого. Но кластерная архитектура становится общемировым стандартом - по оценкам экспертов CCS, кластеры с эффективностью 20-30% от потенциально возможной превосходят по соотношению стоимость/производительность векторные системы с эффективностью 99%. При этом внятная государственная политика в области суперкомпьютеров в Японии сегодня отсутствует, хотя объем инвестиций в эту сферу весьма велик.

Очередной вершиной в суперкомпьютерной гонке объявлен порог в 10 Пфлопс, которого соперники намерены достичь еще в текущем десятилетии. Японцы собираются сделать это с помощью гибридной архитектуры, в которой в кластер будет объединено множество векторных процессоров. Существенную помощь окажут наработки упомянутого проекта логических компьютеров - хотя основной его задачей было создание универсальной системы логического вывода, ее функционирование отрабатывалось на параллельных архитектурах с оптическими межсоединениями. Именно эта аппаратная идея и станет ключевой в будущем решении.

Длина внутренних соединений в "Симуляторе Земли" (между узлами и между процессорами и памятью, каждое длиной от сантиметров до метров) составляет 2400 км. Чтобы достичь производительности в 10 Пфлопс с помощью нынешних японских технологий, надо увеличить длину соединений до 20 тыс. км, а мощность подобного комплекса составит 30 МВт (мощность турбины современной ТЭЦ). Кроме того, пропускная способность типового кабельного соединения равна в "Симуляторе" 500 Мбит/с. Для петафлопных систем, по оценкам CCS, ее придется увеличить до 40 Гбит/с. Интересно, что такой порог полосы пропускания (40 Гбит/с) запланирован к достижению в проекте Chip To Chip Interconnects/Terabus (бюджет 30 млн. долл.) военного агентства передовых исследований США DARPA, в котором участвует IBM и ряд университетов, а также в спутниковых системах лазерной связи.

В сентябре 2005 г. японское правительство приняло решение о запуске нового проекта Keisoku, который был официально открыт в апреле нынешнего года. Его бюджет, первоначально составлявший 714 млн. долл., быстро вырос до 1 млрд., и еще 300 млн. долл. на смежные проекты получил национальный центр высокопроизводительных вычислений, поддерживаемый государственной научной лабораторией RIKEN. Цель Keisoku незамысловата: японцы намерены первыми в мире преодолеть порог в 10 Пфлопс (правда, завершение программы намечено на 2012 г.). Для этого создается комплекс, выполненный в гибридной архитектуре, а межсоединения обеспечиваются оптическими технологиями. Он будет задействован в научно-технических проектах. К работам привлекаются специалисты из компаний Fujitsu, Hitachi и NEC. Последняя, в частности, уже объявила о создании технологии оптических межсоединений с потенциалом 20 Тбит/с.

Промежуточные результаты гонки будут подведены в 2008 г. Корпорация IBM тогда же обещает представить машину с производительностью 1 Пфлопс, однако Япония рассчитывает к тому времени уже выйти вперед - Токийский университет готовит машину Grape-DR с показателем 2 Пфлопс. Она базируется на модели Grape-6 и предназначена для астрономических расчетов. В ней будет сосредоточено 2 млн. процессоров, управляемых Linux 2.6.6, только Grape-DR выполняется не в векторной, а в кластерной MPP-архитектуре с распределенной памятью. Для межсоединений задействуется сеть Fast Ethernet.

Возможно, на суперкомпьютерном рынке появятся и другие игроки. Не дремлет "китайский дракон", стремительно ворвавшийся в Top500 в начале XXI в. Так, машину с производительностью 1 Пфлопс к 2010 г. обещают сразу две организации - Dawning Group и Lenovo Group. А компания Intel недавно объявила о программе поддержки индийских фирм, разрабатывающих ПО для параллельных архитектур. Это отличный бизнес - однопроцессорные системы сегодня исчерпали свой ресурс, и в мире программирования начинается принципиально новый этап создания параллельных приложений. Правда, порог вхождения в него высок, но и отдача от вложений в исследования в сфере многопроцессорных и параллельных архитектур велика.

Версия для печати