Недавно опубликованные результаты исследований IDC свидетельствуют о развитии ЦОДов в направлении интеллектуального использования ИТ-инфраструктуры в парадигме программно-управляемых ИТ-ресурсов (Software Defined IT).
Обязательными инструментами управления современными ЦОДами при этом становятся системы управления инженерной инфраструктурой ЦОДа (Data Centre infrastructure Management, DCIM) и управления ИТ-услугами (IT Service Management, ITSM), обеспечивающие контроль состояния, гибкость и оперативность управления и эффективность использования ресурсов ЦОДа как современного средства доставки потребителям ИКТ-ресурсов.
О своем видении состояния и развития подходов к управлению вычислительной и инженерной инфраструктурой дата-центров, взаимопроникновении и взаимовлиянии предназначенных для этого инструментов эксперт по DCIM компании Schneider Electric, архитектор решений для управления дата-центрами в регионе EMEA Майкл Крюстович рассказал научному редактору PC Week/RE Валерию Васильеву.
PC Week: Как бы вы охарактеризовали современные тенденции в эксплуатации инженерной инфраструктуре ЦОДов? Чем они отличаются от тенденций 3-4-летней давности?
Майкл Крюстович: Три-четыре года назад несогласованность между подразделениями, обслуживающими инженерную и вычислительную инфраструктуры ЦОДов, была существенно больше, нежели сегодня. Каждое из этих подразделений работало только в своей среде, практически не общаясь с коллегами, обслуживающими другие ресурсы, и не задумывалось о какой-либо единой платформе для совместного управления инфраструктурными составляющими ЦОДа. К тому же у этих подразделений были разные показатели эффективности (KPI), что нередко приводило даже к конфликтам.
Сегодня ситуация меняется, поскольку на функционирование ЦОДа все сильнее влияют бизнес-задачи, объединяющие цели отдельных структурных подразделений дата-центров. Появились специальные инструменты, такие как системы DCIM, которые могут служить платформой для работы специалистов инженерных и ИТ-служб ЦОДа при выполнении единых задач.
Налицо тенденция объединения команд обслуживания инженерной и ИТ-инфраструктур в одну с единым руководством и задачами. Объединенная команда благодаря инструментам, входящим в DCIM, располагает общей информацией о состоянии процессов и ресурсов их поддержки в ЦОДе и действует согласованно при выполнения общих задач.
PC Week: А чем примечательно нынешнее состояние проектирования и эксплуатации инженерной инфраструктуры дата-центров в России? Есть ли важные изменения здесь?
М. К.: В проектировании и эксплуатации ЦОДов в России нет каких-либо технологических особенностей — нет как существенных технологических отставаний, так и прорывов. Стоит, правда, отметить, что наблюдалось некоторое технологическое отставание в проектировании корпоративных ЦОДов крупных российских компаний, однако эти отставания они, обратившись к самым передовым подходам к дизайну, могут обращать (и обращают) в преимущества на очередных этапах модернизации.
Заметно, что владельцы крупных корпоративных ЦОДов в России стали внимательнее относиться к параметрам надежности и к сертификации ЦОДов (за отсутствием внутренних отраслевых стандартов сертификации проводятся в основном по стандартам Uptime Institute). Влияние на эту тенденцию оказывает и стремление корпоративных ИТ-служб оправдать свои бюджеты, ведь перед руководством несложно защитить повышенный бюджет, если мотивировать его инвестициями в надежность, подтвержденную сертификатами авторитетных международных организаций.
В то же время наблюдается тенденция к снижению стоимости строительства российских коммерческих ЦОДов, в частности за счет снижения требований к надежности, которые ранее избыточно завышались. Выясняется, что клиентам сегодня в основном нужны дешевые стойки, простые требования к безопасности, недорогое охлаждение и т. д. Они также возлагают надежды (не всегда обоснованные) не на физическое резервирование, а на средства повышения отказоустойчивости ИТ-систем, в том числе с помощью облачных решений. Возможно, такая стратегия со стороны клиентов не вполне верна, как и не востребованы завышенные владельцами коммерческих ЦОДов прежние оценки требований к надежности. Но пока практика показывает, что при прежних высоких требованиях к надежности не все коммерческие площадки окупаются.
PC Week: Сегодня все больше говорят о стратегии программно-конфигурируемых ЦОДов (SDDC). Можно ли считать DCIM инструментом реализации стратегии SDDC в области инженерной инфраструктуры ЦОДа?
М. К.: Совершенно определенно DCIM становится неотъемлемой частью реализации стратегии SDDC, хотя бы потому, что реализация этой стратегии нуждается в средствах мониторинга инженерной инфраструктуры, позволяющих, во-первых, повысить эффективность эксплуатации ЦОДа в краткосрочной и долгосрочной перспективе, а во-вторых, надежность его функционирования за счет снижения рисков отказов оборудования. Можно даже сказать, что DCIM становится ключевым компонентом реализации концепции SDDC.
PC Week: Насколько глубоко система DCIM должна проникать в управление ИТ-инфраструктурой ЦОДа? Какому критерию выбора «границы полномочий» DCIM вы рекомендовали бы следовать? Должна ли DCIM, например, управлять миграцией виртуальных машин?
М. К.: Для управления ИТ-инфраструктурой ЦОДа для оказания услуг созданы свои системы — ITSM. Оркестратор на стороне ITSM при выборе места для запуска вычислительного сервиса учитывает готовность вычислительных ресурсов к этой процедуре — процессоров, оперативной памяти, системы хранения данных, сетевых ресурсов.
DCIM, контролируя параметры систем охлаждения и электропитания, со своей стороны, может предостерегать оркестратор от принятие неверных решений. Оркестратор дополнительно информируется о наличии в инфраструктуре зон, подходящих или непригодных для размещения конкретного вычислительного сервиса с точки зрения соответствия этих зон минимальным требованиям по надёжности. Это позволит гарантировать уровень качества обслуживания (SLA) верхнего уровня, особенно если для данного сервиса в SLA прописаны специальные условия.
Метрики, предоставляемые ITSM-оркестратору в части корректности оценки физического состояния инженерной инфраструктуры, должны быть достоверными и доступными для оценки. Именно поэтому Schneider Electric стремится сделать свое
PC Week: Как вы оцениваете нынешнюю готовность промышленных систем ITSM и DCIM к взаимной интеграции ради согласованной работы? Можно ли говорить о стандартах в этой области?
М. К.: Думаю, проблема сегодня не в наличии детально проработанных стандартов и готовности этих систем к взаимной интеграции — с обеих сторон уже есть неплохо проработанные интерфейсы прикладного программирования (API). Дело пока в другом: все еще слишком мало заинтересованных бизнес-заказчиков, понимающих перспективы такой прозрачной интеграции, и мало специалистов, способных выработать критерии оценки выбора метрик, важных для поддержки функционирования систем ITSM системами DCIM, способных наладить сбор таких метрик и передачу их через открытые API оркестраторам инфраструктур на решениях Microsoft, VMware, Citrix, OpenStack...
Таким образом, на техническом уровне сегодня нет проблем организовать такую интеграцию. Проблема заключается в готовности понять и оценить эффективность этой интеграции бизнес-заказчиками.
Среди крупных компаний уже появляются такие заказчики, правда, число их пока неспособно переломить ситуацию, хотя тенденция налицо. Как только потребность в интеграции систем ITSM и DCIM приобретет массовый характер, появятся и стандарты на метрики, нужные для такой интеграции.
PC Week: Можете ли вы привести примеры использования DCIM сегодня как бизнес-инструмента?
М. К.: Напомню, DCIM дает информацию о состоянии ресурсов, событиях, тенденциях эффективной работы инженерной инфраструктуры ЦОДа. С помощью этой информации можно установить, состояние каких ресурсов тормозит процесс возврата инвестиций и почему это происходит, обнаружить неиспользуемые запасы ресурсов. Эти данные передаются системой DCIM на панель руководству ЦОДа для принятия решений, влияющих на коммерческие показатели объекта.
Вот свежий пример: операторы коммерческих ЦОДов начали выставлять своим клиентам более гибкие счета за полученные услуги с учетом потребленной электроэнергии. Кстати, для организации такого билинга необходима связь систем ITSM и DCIM.
Другой пример — вывод неэффективных активов их эксплуатации. Программный модуль
PC Week: А не залезает ли при этом DCIM на территорию ITSM?
М. К.: Ну, и там и там в основе всего лишь программный код, и в принципе неважно, в состав какой именно системы он включен, важна выполняемая им функция. Наконец, некоторые функции DCIM можно реализовать в рамках решения ITSM и с помощью других систем и технологий.
Традиционные ITSM-системы используют результаты выполнения функций DCIM для эффективной утилизации вычислительных ресурсов, а DCIM ту же информацию использует для оценки затрат электроэнергии и их минимизации, например для рекомендации перемещения вычислений на сервер с более дешевым энергопотреблением. Точно также с помощью DCIM может быть учтен фактор надежности поддержки вычислений. Так, если один сервер обслуживается по схемам 2N, а другой 2N+1, вычисления с более высокими требованиями к надежности резонно разместить на втором сервере.
В конце концов, глубина интеграции и количество обрабатываемых системами ITSM и DCIM параметров зависит от зрелости ЦОДа.
PC Week: Какие драйверы наиболее сильно влияют сегодня (и будут влиять в ближайшем будущем) на направление DCIM? К каким изменениям в проектировании и эксплуатации инженерной инфраструктуры ЦОДов они ведут?
М. К.: Одним из важнейших факторов влияния в этой области является повышение стоимость электроэнергии, заставляющее использовать методы ее сбережения. В ряде стран для таких энергоемких объектов, как ЦОДы, действуют особые требования к энергоэффективности, и объекты, не удовлетворяющие им, облагаются дополнительными налогами.
Повышение значимости ИКТ-технологий для общества повышает требования к надежности и доступности ИКТ-ресурсов, что невозможно без надежной инженерной инфраструктуры, без надлежащего управления ею, для чего и служат системы DCIM, значимость которых тоже растет.
Повышение допустимым рабочих температур для процессоров и других изделий микроэлектроники позволяет снизить требования к системам поддержки климатических условий, уменьшать энергопотребление на единицу вычислений и одновременно повышать плотность вычислений, а это требует внимательного контроля за эффективностью использования инженерной инфраструктуры, что тоже затруднительно без DCIM.
Заниженная нагрузка на инфраструктуру может замедлить возврат инвестиций, что чревато проигрышем в конкуренции, а завышенная грозит отказами, снижением надежности. Стандартов на эффективность использования инженерной инфраструктуры сегодня нет — только международный опыт, который сильно зависит от бизнес-схемы, по которой работает ЦОД. Владельцы ЦОДа, исходя из своей бизнес-модели, должны сами выбирать рабочий диапазон нагрузки на инфраструктуру: кто-то, например, может позволить себе загрузить систему охлаждения на 80%, а оценивает это как снижение надежности и неоправданный риск.
Система DCIM нужна для того, чтобы контролировать этот самый узкий диапазон допустимой нагрузки на инженерную инфраструктуру, оперативные изменения в ней, влияние ИТ-инфраструктуры, отслеживать качество и выполнение выбранной стратегии окупаемости ЦОДа.
К сожалению, до сих пор нет четкого определения функционала DCIM и по своим возможностям один представленный на рынке продукт может отличаться от другого более чем на 50%. Тем не менее, согласно нашим исследованиям, сегодня в DCIM испытывают потребность и готовы в них инвестировать около 38% владельцев ЦОДов.
PC Week: Благодарю за беседу.