Блокчейн Искусственный интеллект Open Source Интернет вещей Big Data/Аналитика Цифровая трансформация Инновации	Сети/Серверы/СХД/ЦОД ПК и периферия Мобильные решения Инфраструктура	Документооборот/ECM Идеи и практики автоматизации Промышленная автоматизация ИТ-менеджмент Автоматизация	Государство и ИТ ИТ-бизнес ИТ-индустрия	Облака	Безопасность
Сети/Серверы/СХД/ЦОД: Статьи Новости компаний Решения

Панорама
Российский суперапп для бизнеса eXpress: новые фичи в 2024 году и планы по развитию В 2024 году рынок корпоративных коммуникаций продолжил …

Тестирование HPC-систем для "больших данных"

Салваторе Саламон | 10.01.2012

Перечень Graph500 ранжирует суперкомпьютерные системы, основываясь на их способности выполнять приложения, активно работающие с данными.

Хорошие ИТ-менеджеры знают, что на социальных тусовках не принято обсуждать вопросы религии, проблемы политики и сравнительную производительность суперкомпьютерных систем. Но, возможно, ситуация может измениться в будущем.

Проблема со сравнением показателей различных суперкомпьютеров состоит в том, что чем более специфичен критерий оценки (например, производительность некой особенной версии прикладной системы, выполняемой на хорошо просчитанной конфигурации компьютера), тем менее этот тест подходит для использования в развернутом сравнении.

Конечно, уже много лет существуют сравнительные тесты для транзакций применительно к большим базам данных и серверам, выполняющим серьезные приложения, работающие с базами данных. Во многих компаниях оценка, сравнение и выбора аппаратной платформы для выполнения производственных задач опираются на распространенные тесты Transaction Processing Performance Council (TPC) и Standard Performance Evaluation Corporation (SPEC).

И хотя по-прежнему не кончается старый спор о значении сравнительных тестов, которые, например, тестируют только один аспект системы, такие тесты доказали свою полезность в выявлении ключевых технологических трендов. Это особенно видно на примере выполняемого дважды в год тестирования в рамках проекта Top500.org, которое сравнивает показатели наиболее мощных суперкомпьютеров в мире.

На протяжении многих лет, список Top500 составлялся на основе теста Linpack, измеряющего уровень производительности суперкомпьютеров при выполнении операций с плавающей точкой. В этом случае производительность определялась по данным выполнения программы решения определенной системы линейных уравнений. Такие уравнения часто используются при моделировании физических процессов или построении сложных финансовых моделей.

Более современный подход к сравнительному тестированию суперкомпьютеров, выдвинутый организацией Graph500, предлагает оценивать производительность компьютерных платформ по результатам выполнения приложений, интенсивно работающих с данными. Составленный этой группой список Graph500 может использоваться для помощи в выработке направлений развития архитектуры суперкомпьютерных и программных систем, создаваемых для выполнения таких приложений. Список Graph500 предназначен для дополнения других программ сравнительного тестирования, таких как список Top500.

Подход к тестированию, предложенный Graph500, оценивает производительность суперкомпьютеров по эффективности работы с крупными масштабируемыми объемами данных, а не просто по скорости выполнения чисто арифметических операций.

Конкретнее, при использовании методики Graph500 компьютеры проверяются на способность решения сложных проблем, включающих обработку динамически создаваемых графов, вместо просто замера скорости решения сложных задач. По мнению специалистов, выдвинувших инициативу создания новой методики Graph500, такие проблемы встречаются в мире медицины, где иногда необходимо выявить корреляцию между множеством медицинских показателей; при анализе социальных сетей с присущим им чудовищным количеством связанных между собой участников; и даже в области международной безопасности, где одной из задач является, например, отслеживание перемещения огромной массы контейнеров, перевозимых на морским судах из порта в порт по всему миру.

“Компании заинтересованы в демонстрации хороших показателей по методике Graph500, поскольку анализ крупномасштабных массивов данных становится все более важной проблемой и может затмить традиционные характеристики высокопроизводительных компьютерных систем в общей оценке важности таких систем для общества”, — заявил Ричард Мерфи, научный сотрудник компании Sandia National Laboratories, входящий в управляющий комитет Graph500.

Печать

Тестирование HPC-систем для "больших данных"

Комментарии