Роль Quality Assurance, или Шпионские страсти ЦОДостроения
Сергей Андронов, руководитель департамента проектирования, внедрения и сопровождения компании «Инфосистемы Джет»
Я помогаю людям с проблемами... Устраняю
Джеймс Бонд
Спасите наши ЦОДы
Если поностальгировать и вспомнить Центры обработки данных конца
Казалось бы, вопрос обеспечения производительности ЦОД снят с повестки дня. Но здесь перед бизнесом остро встает другая проблема — выбора: как из нескольких десятков вендоров и сотен рекомендуемых ими решений выбрать наиболее подходящие для себя? Обычно эти технологии слишком сложны, чтобы заказчик мог адекватно оценить их на этапе планирования ЦОД. Причины этого различны: от банальной нехватки времени до отсутствия соответствующей квалификации. В любом случае компания сильно рискует своими средствами: ошибки, возникшие на любом из этапов строительства ЦОД, могут в прямом смысле слова дорого ей обойтись.
В такой ситуации весьма актуальной становится консультационная услуга, состоящая в контроле качества построения Центра обработки данных. Она подразумевает, что в процессе создания ЦОД участвуют уже не две, а три стороны. К классическим участникам — заказчику и подрядчику — присоединяется новый игрок — Quality Assurance-консультант (консультант по качеству). Его роль заключается в контроле качества всех выполняемых подрядчиком работ на каждом этапе строительства — от проектирования и выбора технических решений до сдачи дата-центра в промышленную эксплуатацию. И подобно Джеймсу Бонду от ЦОДостроения, он минимизирует риски и спасает бизнес от лишних затрат.
Откуда ЦОДы растут...
Что же сделало услугу Quality Assurance актуальной для рынка? Прежде всего, появление стандартов, формализующих правила построения ЦОД. Так, в 2005 году появился стандарт TIA-942, ставший первым с
Тем не менее, появление TIA-942 в свое время привело к образованию значительного числа компаний, готовых проводить определенный набор аудиторских проверок, направленных на упрощение сертификации в Uptime Institute, без каких-либо гарантий получения заказчиком сертификата соответствия. Сегодня их количество на рынке, несмотря на рекомендательный статус стандарта и угасающий спрос на подобные услуги, осталось прежним.
Не так давно появился второй критерий для оценки эффективности дата-центров. Он существует параллельно с TIA-942, не исключая его параметров и не противореча им. Это коэффициент Power Usage Effectiveness (PUE). Он официально признан мировым сообществом, базируется на оценке энергоэффективности дата-центра и позволяет перевести ее измерение в четкие числовые показатели. PUE также оставляет владельцам ЦОД некоторую свободу действий: сам по себе коэффициент измеряется конкретными цифрами, но рекомендованных способов его достижения нет. В итоге сегодня мы имеем массовый всплеск интереса заказчиков к энергоэффективным технологиям, которые могут способствовать снижению PUE. А это, в свою очередь, увеличивает потребность компаний в услугах квалифицированного Quality Assurance-консультанта.
Высокотехнологичный обман
Так что же, «золотая пуля» ЦОДостроения найдена? Отчасти да, но лишь отчасти: дело в том, что не все Quality Assurance-консультанты одинаково полезны.
На сегодняшний день российский рынок перенасыщен компаниями, позиционирующими себя в качестве квалифицированных консультантов на проектных стадиях. Причина такого изобилия состоит в том, что игра в проект на бумаге ничего им не стоит (особенно материальных затрат в случае возникновения проблем на последующих этапах строительства ЦОД). Компаний, предлагающих свои услуги в том числе на стадиях приемки оборудования, внедрения, тестирования и т.д., несколько меньше. Обычно они могут подтвердить свою квалификацию соответствующими сертификатами — так называемым «бумажным» опытом. Но он совершенно не гарантирует их умение эффективно действовать в боевых условиях — на реальной площадке заказчика. В итоге вместо опытного «разведчика», обладающего практическими знаниями и контролирующего ситуацию на местах, мы получаем теоретика, вводящего в заблуждение показателями на бумаге.
Выбирая компанию-консультанта, важно не ошибиться и остановить свой выбор на организации, которая сможет оказать услугу «сквозной» оценки качества. Полагаться при этом только на наличие сертификатов и иных документов, подтверждающих ее знания, — не самый правильный ход. Прежде всего, следует оценивать успешный опыт выполнения аналогичных работ и наличие действующих контрактов. Отметим, что Quality Аssurance-консультантов, действительно компетентных на всех этапах создания дата-центра — от написания технического задания на построение ЦОД до его тестирования и ввода в эксплуатацию, — в прямом смысле слова единицы.
Как лучше контролировать
Предположим, что процесс выбора конкретной компании-консультанта успешно завершился. В этом случае возникает целый ряд вопросов. Например: как оптимально организовать его работу? Какие документальные подтверждения о выполненных работах следует ожидать? Как оценить количество затраченных консультантом усилий? Как оптимизировать расходы на консультанта без ущерба для качества работ?
Здесь нужно понимать, что существуют три способа проведения работ по Quality Аssurance: Full Time, этапный и этапный с промежуточными отчетами. Самый простой вариант работ — этапный. Для него характерно участие консультанта на каждой стадии создания ЦОД. Основной минус этого варианта состоит в том, что выявление допущенных подрядчиком ошибок происходит только в конце каждой стадии. С одной стороны, этот подход наиболее дешев, так как затрат со стороны консультанта относительно немного. С другой — он может повлечь за собой существенные работы по устранению ошибок и, соответственно, дополнительные расходы заказчика.
Второй вариант — когда консультант глубоко погружен в специфику создания ЦОД и сотрудничает с исполнителем в формате Full Time: разрабатывает документацию, сотрудничает с инженерами-разработчиками, принимает участие в рабочем процессе. Фактически это можно считать «продажей» консультантов на полный аутсорсинг. Поэтому эта схема оказывается самой дорогостоящей.
Наиболее удачен, на наш взгляд, третий вариант, при котором за экспертом Quality Аssurance остаются финальный контроль этапов построения ЦОД и написание промежуточных отчетов в процессе выполнения каждого из них. На каждой стадии создания дата-центра должны быть определены реперные точки, в которых принимаются принципиальные решения и разрабатываются промежуточные отчеты. Таким образом, этот подход включает в себя полномасштабные финальные заключения и
Будни Quality Аssurance-консультанта
Контроль выполняется на всех стадиях создания ЦОД, и можно выделить несколько его этапов. В частности, проектный контроль, который осуществляется в ходе выполнения одноименных работ. Он нацелен на своевременное выявление ошибок в проектной документации. При проектном контроле проверяется соблюдение полноты документации, её непротиворечивости и соответствия техническим требованиям заказчика и существующим стандартам.
Основная проблема, возникающая еще на стадии проектирования, — это «междувластие» нескольких подрядчиков на границах зон их ответственности. Нередко компания, стремясь сэкономить на строительстве ЦОД, приглашает разных исполнителей на реализацию отдельных компонентов дата-центра. В результате может не учитываться необходимость некоторых подсистем (в том числе и критических). Например, мы являлись консультантами в проекте строительства достаточно крупного ЦОД. Один исполнитель отвечал за построение инженерной инфраструктуры, второй — за разработку системы бесперебойного электроснабжения, третий — за общестроительные решения. При этом источники бесперебойного питания по проекту размещались в отдельном здании. И мы установили, что это помещение не было оснащено системой кондиционирования — критичная система стоимостью в несколько сотен тысяч долларов выпала из рассмотрения компании и оказалась в «серой зоне» безответственности.
Второй этап — так называемый входной контроль. Под ним подразумевается контроль поставляемых материалов и оборудования для создания ЦОД. Он заключается во внешнем осмотре оборудования и материалов на их соответствие требованиям проекта (комплектность, сертифицированность, наличие сопроводительных документов). Входной контроль позволяет исключить возможные ошибки поставок, которые впоследствии могут повлечь за собой, к примеру, остановку работ по монтажу.
Например, если один из компонентов «тяжелой» подсистемы ЦОД (кондиционирования, пожарной сигнализации и т.д.) оказывается бракованным, его замена может достигать нескольких месяцев. Это очень большой срок относительно общего времени проекта, поэтому чем раньше дефект будет обнаружен, тем меньше временных и материальных затрат понесет компания.
В нашей практике Quality Аssurance-консультирования был случай, когда своевременное выявление неисправности сэкономило заказчику недели ожидания. При входной проверке оборудования зарубежного вендора выяснилось, что из строя вышел ряд интерфейсных карт. Мы нашли им функциональную замену — аналог у российского производителя, что позволило быстрее запустить оборудование.
Третий этап — операционный контроль. Он позволяет оценить соблюдение технологии выполнения монтажных работ, выявить как явные, так и скрытые дефекты монтажа, своевременно разработать комплекс мер и рекомендаций по их устранению и значительно сэкономить затрачиваемое на это время. Вторая составляющая операционного контроля — оценка соответствия стандартам и нормам, принятым для построения ЦОДов. Операционный контроль длится на протяжении всех монтажных, инсталляционных и пусконаладочных работ и именно для его осуществления чаще всего необходимо присутствие консультанта, работающего на площадке в формате Full Time.
Здесь можно вспомнить наглядный пример нарушения технологического цикла монтажных работ. Специалисты подрядчика установили в дата-центре заказчика монтажные шкафы, при этом в тех местах, где их разместили, не были закончены потолочные работы. В результате монтажникам для их завершения пришлось вставать на шкафы. Эта простая, казалось бы, ситуация обернулась значительной потерей средств заказчика: пластиковые крышки шкафов не выдерживали нагрузки и проламывались. Потребовалась замена оборудования.
Можно вспомнить и другой случай. Мы выступали в качестве Quality Аssurance-консультанта в проекте строительства ЦОД для одного из заказчиков. На одном из его этапов монтажники начали выполнять расключение кабеля не специализированным прибором, а буквально с помощью обычного молотка и деревянных колышков. Наши специалисты заметили и остановили этот процесс, но результатом такого «профессионализма» исполнителя все же стала потеря части кроссовых панелей.
После того, как монтаж закончен, приходит очередь приемочного контроля, направленного на оценку качества выполненных работ по тестированию комплексных инженерных систем ЦОД, их соответствие проектной документации. Во время приемочного контроля также проверяется, ликвидированы ли те недостатки, которые Quality Аssurance-специалисты выявили и рекомендовали к устранению на этапе операционного контроля.
Так, один из наших заказчиков не планировал полностью заполнять ЦОД оборудованием сразу после его сдачи в промышленную эксплуатацию. Это предполагалось сделать значительно позже — через несколько лет. На этапе ввода в эксплуатацию система кондиционирования дата-центра работала исправно. Но возник логичный вопрос — выдержит ли она 100%-ную загрузку ЦОД? Заказчик не мог ответить на него самостоятельно. Мы смоделировали эту ситуацию с помощью установки дополнительных тепловых агрегатов и проверили на деле, возникнут ли зоны перегрева.
Мы как Quality Аssurance-консультанты также проверяем в дата-центрах срабатывание автоматики при возникновении аварийных ситуаций. В первую очередь, это касается пропадания городского электропитания или выхода из строя критичных компонентов комплекса — кондиционеров, ИБП. В результате компания получает ответы на вопросы: как быстро заработает дизельный двигатель, насколько система электроснабжения отказоустойчива при переходе ИБП в режим by-pass, выдержит ли система кондиционирования «падение» одного-двух кондиционеров и т.д.
В заключение отметим, что главная цель услуги Quality Аssurance — качественное построение дата-центра в соответствии с заявленными требованиями компании (в том числе в части стандарта TIA-942 и коэффициента энергоэффективности). Квалифицированные консультанты никогда не ставят во главу угла формальную подготовку ЦОД к сертификации.
Ничего не забыли?
Сергей Барышев, заместитель директора департамента проектирования, внедрения и сопровождения компании «Инфосистемы Джет»
Существует еще одна серьезная область «жизнедеятельности» ЦОД, о которой зачастую многие если и не забывают, то не воспринимают ее в качестве важной, а это, на наш взгляд, наиболее ответственный и критический для заказчика этап — стадия эксплуатации дата-центра.
Наш, уже многолетний, опыт организации эксплуатации и сервисного обслуживания инженерных и слаботочных систем позволяет сделать определенные выводы относительно этой области жизнедеятельности дата-центров. Первое: ЦОД, спроектированных и построенных в соответствии со всеми правилами и стандартами, практически не существует (в области корпоративного сектора пока не встречались вообще). Второе: ЦОД, эксплуатируемых и обслуживаемых на уровне, который минимизирует риски различного рода аварий, — крайне мало.
К сожалению, владелец дата-центра часто сталкивается с неожиданными проблемами практически сразу после его сдачи в эксплуатацию. В результате он несет дополнительные финансовые издержки либо на исправление этих конструктивных недочетов, либо на их «сервисную» компенсацию в случаях, когда изменить архитектуру либо слишком дорого, либо уже невозможно. При этом, в отличие от этапов проектирования и строительства, для стадии эксплуатации ЦОД практически не существует регламентирующих и стандартизующих документов, а также формализованной общепринятой практики.
Осложняет положение и тот факт, что на рынке присутствует значительное число сервисных компаний: начиная с небольших
- Какого типа компанию выбрать?
- Как составить сервисный контракт (в том числе определить SLA), чтобы по итогам «ЦОД функционировал всегда, а проблемы решались быстро»?
- Как обеспечить сервисное обслуживание, соответствующее требованиям непрерывности бизнеса?
- Как оценить эффективность, качество и адекватность стоимости уже получаемых или предлагаемых заказчику услуг?
Конечно же, единственно верного и правильного решения у этой задачи нет. Однако, в первую очередь, стоит рассматривать компании, которые имеют соответствующий опыт и квалификацию: как в проведении аудитов эксплуатации и сервисного обслуживания, так и в предоставлении комплексных сервисных услуг. Фактически проведение экспресс-аудита — это один из немногих вариантов обеспечить дальнейший контроль качества процессов эксплуатации ЦОД и сервисного обслуживания инженерных систем. Совместная работа также поможет определить, какие аспекты эксплуатации ЦОД важны в первую очередь, какие — во вторую. Ведь правильно поставленные вопросы — это половина решения проблемы.
Контактная информация
Наши сайты: www.jet.su, www.jetinfo.ru. Электронная почта: info@jet.su.
Другие статьи раздела «Тонкости ЦОДостроения»