Процессоры мобильных устройств за последние годы преодолели рубеж в 1,5 ГГц, обрели многоядерность, научились декодировать видео, ускорять флэш и поставили под вопрос доминирование архитектуры х86 на рынке персональных вычислений. Смартфон, который легко умещается на ладони, по уровню производительности вплотную подобрался к нетбуку.
В отличие от своих настольных собратьев мобильные платформы — это вещь в себе. Все компоненты системы, включая CPU, GPU и многое другое, размещены на единственной интегральной микросхеме. Подобная конструкция обрела название System-On-Chip (SoC, “система-на-чипе”). Использование SoC позволяет упростить разводку системной платы, уменьшить производственные затраты, а также оптимизировать энергопотребление и тепловыделение системы в целом.
С SoC MSM8260 компании Qualcomm ознакомимся более детально. Эта ситсема представляет собой второе поколение чипов Qualcomm Snapdragon, выполненное по 45-нм технологическому процессу.
System-on-Chip Qualcomm Snapdragon состоит из следующих функциональных блоков:
- Application Processor / CPU — центральное процессорное ядро, на котором работает операционная система. В чипсетах Snapdragon работает процессорное ядро Scorpion компании Qualcomm;
- GPU — видеоускоритель Adreno с поддержкой унифицированной шейдерной архитектуры и OpenGL ES 2.0. Помимо своих прямых обязанностей Adreno (205 и выше) выполняет также аппаратное ускорение Adobe Flash, SVG и т. д.;
- Baseband/Modem — микропроцессор, на плечи которого ложится работа с GSM/UMTS/CDMA. Трансиверы и усилители сигнала, как правило, выполнены в виде отдельных микросхем;
- DSP — специализированный микропроцессор, выполняющий задачи по кодированию видео, обработке изображений, mp3 и других аудиопотоков. Таким образом DSP разгружает основной процессор от выполнения слишком затратных мультимедийных операций. В семействе Snapdragon работает сопроцессор QDSP6000 с частотой 595 МГц.;
- GPS — микропроцессор для выполнения логики, связанной с определением текущего местоположения. Технология, применяемая в SoC компании Qualcomm, называется gpsOne и использует сигналы от спутников системы GPS, GLONASS, а также с вышек сотовых операторов.
В то время как большинство производителей лицензируют архитектуру у ARM, в Qualcomm решили создать процессорное ядро самостоятельно, используя лишь набор инструкций ARMv7. Результатом упорной работы подразделения в Северной Каролине стало процессорное ядро Scorpion. Оно совместимо с Cortex-A8 по набору инструкций, но значительно опережает его по возможностям, подходя вплотную к Cortex-A9. Для увеличения производительности и сохранения приемлемого уровня энергопотребления в Scorpion реализована поддержка суперскалярности и механизма внеочередного исполнения команд. Обе технологии давно нашли применение в архитектуре х86, но появились в процессорах ARM совсем недавно. Благодаря механизму суперскалярности процессор, дабы избежать простоя исполнительных блоков, может загружать две инструкции за один такт. Поддержка внеочередного исполнения команд позволяет спекулятивно запускать на выполнение команды по мере их готовности, не дожидаясь результата выполнения предыдущих. Процессор Cortex-A8 поддерживает менее “продвинутый” механизм in-order execution, который не столь эффективно использует исполнительные блоки. Конвейер Scorpion имеет 13 стадий и по дизайну схож с Cortex-A8, но при этом процессор компании Qualcomm может работать на больших частотах. Конвейер Cortex-A9 содержит 8 стадий, что при одинаковых частотах позволяет ему быть более производительным, нежели Scorpion, за счет уменьшения накладных расходов при ошибках механизма предсказания ветвлений. Однако Scorpion при этом остается более экономичным процессором, да и запас по частотам у него больше.
Времена, когда операции с плавающей точкой выполнялись на процессорах ARM исключительно с помощью программой эмуляции, уже далеко в прошлом. В Scorpion, как и в Cortex A8/A9, реализован блок FPU VFP (Vector Floating-point Architecture). Scorpion и Cortex A9 имеют паритет по производительности FPU, а вот A8 уступает своим собратьям. В A8 ARM решили не использовать конвейерную обработку для VFP и сильно прогадали.
Отдельно следует упомянуть блок SIMD-расширений NEON, который впервые появился в процессорах Scorpion (128-разрядный) и Cortex A8 (64-разрядный). NEON — исполняющее устройство для обработки целочисленных данных и данных с плавающей точкой. Любопытен факт, что в A9 наличие NEON совершенно не обязательно, и, к примеру, в nVidia Tegra 2 этого блока нет! Как вы, наверное, уже догадались, SIMD-инструкции NEON используются для оптимизации приложений по обработке мультимедиа-данных. Скажем, RockPleer использует NEON для декодирования видео, и количество подобных приложений в будущем будет только расти.
Долгое время Qualcomm лицензировала у ATI/AMD видеопроцессор Imageon, а в начале 2009 г. AMD объявила о продаже подразделения по разработке мобильных GPU компании Qualcomm. Результатом работы специалистов Qualcomm и AMD стал видеоускоритель Qualcomm Adreno.
Производительность Adreno растет огромными темпами: если Adreno 2xx может обеспечить уровень графики, сравнимый с PS2, то в серии Adreno 3xx Qualcomm обещает совершить качественный скачок и по уровню графики сравняться с PS3 и XBox 360. К примеру, аппаратная тесселяция появилась в современных видеоускорителях совсем недавно, но ее поддержка уже имеется в Adreno 205 и выше.
Qualcomm намерена начать поставки следующего поколения процессоров Snapdragon серии S4 своим партнёрам уже в конце 2011-го. Эти сведения сообщил 14 сентября старший вице-президент по управлению продуктами Кристиано Амон.
Чипы, работающие на частоте до 2,5 ГГц, могут появиться в смартфонах в начале следующего года, возможно в феврале, к Mobile World Congress. К тому времени на рынке должны появиться и первые решения на основе 4-ядерной системы на чипе NVIDIA Kal-El.
28-нм чипы семейства S4 могут предложить двух- или четырёхядерную графику Adreno, одно, два или четыре ядра CPU с архитектурой Krait, работающих на впечатляющей частоте до 2,5 ГГц, то есть почти вдвое более высокой в сравнении с самыми мощными современными чипами ARM. Впрочем, такая высокая частота будет достигнута наверняка только в одно- или двухъядерных чипах. Кроме того, процессоры серии S4 будут поддерживать кодирование и декодирование видео в формате Full HD и сети 3G и LTE.
Японские производители с опасением смотрят на доминирующую позицию Qualcomm и на то, что доля ее чипов продолжает расти. Это, по их мнению, может создать препятствия на пути разработки решений для сетей четвертого поколения. Японский оператор NTT DoCoMo планирует объединиться с рядом местных производителей и корейской компанией Samsung Electronics с целью создания новых чипов для смартфонов, которые будут работать в сетях нового поколения. В число местных партнеров вошли Fujitsu, NEC и мобильное подразделение Panasonic; совместными усилиями они создадут новую платформу для обработки “беспроводных и мобильных сигналов” и тем самым уменьшат влияние доминирующей на этом рынке компании Qualcomm. Крупнейшее японское профильное издание Nikkei сообщило, что NTT DoCoMo будет крупнейшим участником совместного предприятия: инвестиции оператора в проект составят 30 млрд. иен (примерно 390 млн.долл.), что больше половины общего бюджета.