В 1970—80-е годы развитие высоких технологий определялось щедрыми заказами военных, государственных ведомств, научных учреждений и крупных корпораций. Массовый потребительский рынок получал лишь “обноски с барского плеча”, да и то с задержкой. Так, например, подходы к построению многопроцессорных и многозадачных систем были сначала отработаны на больших ЭВМ и лишь десятилетия спустя стали доступны каждому на персональных компьютерах.
В 1990-е ситуация кардинально изменилась. Основным двигателем прогресса стал стремительно растущий потребительский рынок. А военные и научные заказчики начали выбирать себе гражданские решения и технологии, наиболее пригодные для адаптации под их специфические требования. Благодаря тому что тиражи компьютерных компонентов вышли на уровень сотен миллионов единиц, массовый потребитель стал главным финансистом технического прогресса в сфере ИТ.
От нового положения вещей выигрывают все. Это видно хотя бы на примере компании Nvidia. С одной стороны, она выпускает массовые платы 3D-акселераторов семейства GeForce, которые продаются тиражами в десятки миллионов — именно такие тиражи нужны для возврата инвестиций в производство микросхем GPU нового поколения (до миллиарда долларов), а с другой — Nvidia одновременно предлагает целую серию профессиональных изделий и даже кластерные вычислители для специализированных задач, основанные на тех же микросхемах GPU.
Как рассказал руководитель отдела продаж Nvidia по Восточной Европе Алексей Лагуненко, новая модель кластерного вычислителя Quadro Plex 2200 S4 исполнена в виде модулей высотой 1U для монтажа в стандартную 19-дюймовую промышленную стойку. Модуль содержит четыре процессора Tesla FX 5800, каждый из которых имеет 240 ядер, оснащен 4-Гб памятью и обеспечивает производительность около терафлопса. Для соединения вычислителя с хост-системой используется коммутатор пакетов PCI Express второго поколения.
Кластерные вычислители Quadro Plex 2100 могут использоваться как мини-башенные приставки к рабочим станциям или монтироваться в промышленные стойки. Конфигурация варьируется в зависимости от модификации вычислителя. Так, в моделях D2 и D4 применяются два процессора Tesla FX 5800 G-Sync II или четыре Tesla FX 4700X2 G-Sync II с памятью объемом 4 либо 1 Гб на каждый. Для синхронизации расчётов в элементах кластера (необходима в сфере видео- и телевещания) предусмотрены аппаратные схемы Frame Lock и Genlock.
Пользователям доступны и отдельные вычислительные платы Tesla, которые можно установить практически в любую современную рабочую станцию, превратив ее в персональный суперкомпьютер.
Поддержка кластерных вычислителей Tesla уже организована в пакете Adobe Creative Suite 4. Благодаря ей, например, в Photoshop можно в реальном времени вращать большие изображения, масштабировать и сдвигать картинки без рывков и задержек. В программах Adobe Premiere Pro и After Effects многократно ускоряются просчет видеоэффектов и сжатие фильмов высокого разрешения по стандарту H.264. Подключение GPU-вычислителей в пакете двухмерного проектирования AutoCAD обеспечивает сокращение времени некоторых ресурсоемких операций на две трети.
Важно иметь четкое представление о возможностях вычислителей семейства Tesla и о существующих ограничениях этих возможностей. Фирменная архитектура CUDA (Compute Unified Device Architecture) рассчитана на решение “однородных” хорошо распараллеливаемых задач. Будучи заложена во все процессоры Nvidia начиная с 48-й серии, она позволяет программировать графические процессоры на языках высокого уровня, не ограничиваясь командами графического API. На сегодняшний день реализована поддержка программирования на Си и Фортране. Перечень языков скоро будет расширен.