На прошедшей в середине июня в Дрездене международной конференции по суперкомпьютерам (International Supercomputing Conference) компания AMD представила новое поколение потоковых процессоров FireStream 9250, которые предназначены для ускорения научных и инженерных расчетов, а также других приложений, требующих больших объемов вычислений. По информации компании, при работе, например, с программами финансового анализа графический адаптер FireStream 9250 в ряде случаев позволяет добиться 55-кратного увеличения производительности по сравнению с той, какая достигается при использовании для тех же расчетов одного центрального процессора.
FireStream 9250 — первый среди потоковых ускорителей AMD, преодолевший рубеж производительности в 1 Тфлопс (триллионов операций с плавающей запятой в секунду) при обычной точности вычислений. Он вдвое мощнее устройства предыдущего поколения FireStream 9170 — первого потокового процессора, обеспечивающего двойную точность вычислений с плавающей запятой, и представляет собой уже второе поколение потоковых процессоров, позволяющих делать вычисления с плавающей запятой с двойной точностью, обеспечивая при этом быстродействие более 200 Гфлопс.
Новый процессор потребляет менее 150 Вт; AMD будет поставлять его в виде платы, укомплектованной памятью GDDR3 объемом 1 Гб и устанавливаемой в один PCI-слот. Компактность в совокупности с пониженным тепловыделением делает FireStream 9250 хорошим решением для 1U-серверов, а также настольных ПК и рабочих станций. Для создания и оптимизации приложений, использующих возможности потоковых процессоров AMD, а также графических решений ATI Radeon и ATI FireGL компания предоставляет разработчикам инструментальные средства FireStream SDK, обеспечивающие доступ к интерфейсам прикладного программирования (API). В этот набор для разработчиков среди прочего входит инструмент Brook+ (расширения языка Cи для потоковых вычислений) для создания приложений на языке программирования высокого уровня.
AMD планирует начать поставки FireStream 9250 и поддерживающего это решение SDK в третьем квартале 2008 г.; его примерная стартовая цена — 1000 долл. Первый потоковый процессор FireStream 9170, объявленный примерно полгода назад и укомплектованный памятью на 2 Гб, в настоящее время поставляется по цене около 2000 долл.
FireStream 9250 составит конкуренцию аналогичному семейству потоковых ускорителей Tesla компании Nvidia. Эта фирма недавно объявила о выпуске второго поколения изделий Tesla 10P, которое тоже достигло терафлопсного рубежа производительности, оказавшись вдвое мощнее предыдущего поколения Tesla 8, выпущенного год назад. Кроме того, Tesla 10P комплектуется большей памятью по сравнению с первым поколением фирменных потоковых процессоров (4 против 1,5 Гб).
По информации Nvidia, Tesla 10P содержит 1,4 млрд. транзисторов и 240 вычислительных ядер и имеет вдесятеро более высокую вычислительную мощность по сравнению с двумя четырехъядерными процессорами при примерно одинаковом уровне энергопотребления.
В настоящее время Nvidia поставляет Tesla в составе двух изделий — 1U-сервера Tesla S1070 (примерная цена 8000 долл.) и платы C1060, устанавливаемой в слот PCI Express (1700 долл.). Для использования возможностей Tesla разработчики должны модифицировать свои приложения с помощью фирменного инструмента CUDA.
Потоковые ускорители, или графические процессоры общего назначения (General-Purpose GPU, GP-GPU), продаются менее года, поэтому эксперты пока затрудняются с оценкой их востребованности на рынке. В AMD, например, рассчитывают, что в ближайшую пару лет популярность GP-GPU начнет заметно расти.