Какие бы радикальные изменения ни происходили в области ИКТ, задачи надежного, бесперебойного электрообеспечения сохранят (во всяком случае в обозримом будущем) своё основополагающее значение, и с их решения будут начинаться все серьезные ИКТ-проекты.
О своем видении состояния и путей развития сферы бесперебойного электрообеспечения ЦОДов научному редактору PC Week/RE Валерию Васильеву рассказывает менеджер по технологиям для комплексных проектов и ЦОДов компании Eaton Янне Паананен.
PC Week: Какими должны быть показатели отказоустойчивости электропитания современного ЦОДа? Зависят ли они от принадлежности площадки — корпоративный ли это ЦОД или дата-центр провайдера услуг?
Янне Паананен: Отказоустойчивость электропитания — всего лишь один из факторов, определяющих отказоустойчивость ЦОДа в целом. Единого показателя надежности, пригодного для любого варианта дата-центра, как мне представляется, не существует, и задача его определения решается комбинацией многих факторов.
Всё зависит от того, как владельцы и пользователи ЦОДов относятся к непрерывности бизнес-процессов и каковы их подходы к её поддержке. Скажем, от каких-то ЦОДов (которые поддерживают особо критичные приложения) ожидается стопроцентная готовность в любое время — там источники бесперебойного питания (ИБП) никогда не выключаются. В других вариантах эксплуатации дата-центров допустимо отключение системы бесперебойного питания на регламентное обслуживание, а случается даже и прерывание функционирования всего ЦОДа с переносом клиентских сервисов в резервные облака, например.
PC Week: Можно ли говорить о стандартах в области отказоустойчивости электропитания ЦОДов?
Я. П.: Скорее стоит говорить о лучших практиках и принципах нежели о стандартах. Некоторые из них обобщены, например, в рекомендациях Uptime Institute, такие как подвод электропитания в ЦОД по двум независимым фидерам. Обычно исходят из предположения, что ту или иную часть инфраструктуры ЦОДа, в частности ИБП, придется время от времени отключать — либо на обслуживание, либо в случае аварии. Максимальная доступность систем бесперебойного питания может быть достигнута при выборе систем, которые сами по себе отказоустойчивы и одновременно с этим приспособлены к техническому обслуживанию и текущему ремонту.
PCWeek: Означает ли это, что вы сторонник высокой гранулярности в обеспечении отказоустойчивости ЦОДов в целом и системы электропитания в частности?
Я. П.: Естественно, с ростом количества элементов в любой системе (что как раз и происходит при высокой гранулярности) возрастает вероятность того, что что-то может пойти не так, как хотелось бы. Однако, используя правильные технологии, вы можете исключить недостатки, которые влечет за собой усложнение и многокомпонентность. И на самом деле умеренная гранулярность может повысить избыточность и отказоустойчивость системы.
PC Week: Какие ключевые тенденции наблюдаются сегодня в обеспечении отказоустойчивости электропитания ЦОДов? Чем они обусловлены?
Я. П.: Использование ИБП в обеспечении отказоустойчивости электропитания давно уже стало традиционным. Однако до сих пор не утихает дискуссия о том, на каком токе целесообразнее строить такие системы — на постоянном или переменном — и какое использовать при этом напряжение. Кто-то считает, что оптимально здесь подходит напряжение 400 В постоянного тока; Facebook в соответствии с продвигаемым ею с 2011 г. подходом Open Compute (OCP) широко применяет постоянное напряжение 48 В, а Google использует серверы с локальной системой отказоустойчивости.
Процесс усовершенствования систем отказоустойчивости электропитания продолжается, и некоторые опробованные подходы уже доказали свою состоятельность, хотя и далеко не для всех безоговорочно.
Мне же представляется, что в этом деле еще долгое время будут доминировать ИБП, использующие на входе и выходе переменное напряжение.
PC Week: И тем не менее, можно ли ожидать в ближайшее время и в длительной перспективе важных технических прорывов или прорывов в управлении обеспечением отказоустойчивости систем электропитания ЦОДов?
Я. П.: Упомянутые мною как доминирующие ИБП с переменным напряжением на входе и выходе достигли очень высоких технических и эксплуатационных показателей, и ожидать здесь заметных усовершенствований сложно.
В настоящее время усилия в значительной мере концентрируются на повышении эффективности систем распределения электроэнергии. Однако в обеспечении отказоустойчивости вычислений в целом следует ожидать смещения фокуса на другие аспекты, такие, например, как использование облачных технологий для резервирования и восстановления после сбоев. Думаю, это позволит добиться большой экономии затрат на инфраструктуру ЦОДов за счет отказа от дизель-генераторных установок и некоторых других традиционных для сегодняшнего дня компонентов, необходимых при обеспечении отказоустойчивости систем электропитания ЦОДов.
PC Week: Как вы оцениваете идею «децентрализации» — стремление разработчиков сделать малопотребляющими и отказоустойчивыми (в смысле электропитания) отдельные компоненты ЦОДа: системы вентиляции и кондиционирования, серверы, серверные стойки?
Я. П.: По моим наблюдениям в этой сфере (как, впрочем и во всех других) процессы централизации и децентрализации идут чередой, сменяя друг друга. Сейчас, на мой взгляд, наступило время поиска альтернатив централизованным решениям. Однако такие методы нужно тщательно продумывать, рассматривая систему целиком и исходя из долгосрочной перспективы, иначе все изначально полученные выгоды могут быть утрачены при попытках расширения или при каких-либо иных инфраструктурных изменениях.
PC Week: Тематика DataCenterInfrastructureManagement (DCIM) за последние года три стала очень актуальной. Можно ли количественно или хотя бы качественно оценить, сколько выигрывает владелец ЦОДа с точки зрения отказоустойчивости электропитания, если он установит и будет эксплуатировать такую систему?
Я. П.: Этот вопрос, наверное, более резонно адресовать тем компаниям , которые уже потратили миллионы долларов на разработку таких систем. По моим данным, большого успеха в продажах они пока так и не добились.
Лично я не особо верю в перспективность DCIM, если под такими системами подразумевать централизованное и детальное управление всеми объектами и устройствами инфраструктуры ЦОДа. Значительно больше доверия у меня вызывает подход, связанный с переносом интеллекта на периферию, в отдельные блоки и устройства с высокой автономностью их оперативного функционирования и возможностями самовосстановления.
За системами централизованного управления следует оставить сбор данных и их аналитическую обработку для принятия решений, не связанных с оперативным реагированием в реальном времени на ситуации на местах — с этим в автоматическом режиме должны справляться интеллектуальные модули, должным образом объединенные в функциональные подсистемы с необходимым резервированием. Прежде всего это относится к критически важным инфраструктурам — они автоматически должны поддерживать свою работоспособность. Ну а DCIM нужны для принятия стратегических решений, касающихся функционирования инфраструктуры, ее оптимизации в длительной перспективе и поддержки процессов высокого уровня управления инфраструктурой (например, для запуска аварийного восстановления).
PC Week: Какие требования к обеспечению отказоустойчивости электропитания ЦОДов выдвигает новая парадигма гибкого управления ИТ-инфраструктурой ЦОДа, которая называется SoftwareDefinedDataCenter (SDDC)?
Я. П.: Все концепции, построенные на программно-определяемых архитектурах, — SDDC, SDN, SDS, конвергентные платформы — работают с использованием электроэнергии, а потому доступность бесперебойного питания остается для них критически важной.
Однако чтобы создать гибкую, адаптируемую и надежную программно-определяемую систему, необходимо четко понимать состояние поддерживающей инфраструктуры в каждый момент времени. И тут возникает проблема (которую следует адресовать в том числе и к системам DCIM): на сегодняшний день нет (пока) общепринятого способа определения статуса надежности компонентов системы бесперебойного электропитания — программному обеспечению приходится собирать и интерпретировать тысячи сообщений о статусе, чтобы постараться сделать это.
В концепции программно-определяемой инфраструктуры мне представляются наиболее важными для системы обеспечения бесперебойного электропитания два аспекта. Первый — возможность четко представлять, в каком состоянии находятся блоки этой системы: в резервном или рабочем, видеть уровень избыточности и т. д., что позволяет принимать более взвешенные решения относительно распределения критических процессов. И второй — автоматическая адаптация её режима работы к изменениям нагрузки, чтобы уйти от необходимости вести микроменеджмент через ПО на более высоком уровне.
PC Week: Энергосбережение против отказоустойчивости: высокая эффективность использования энергии (низкий PUE) или высокий коэффициент надежности — какая тенденция сегодня побеждает?
Я. П.: Думаю, что сегодня больше стремятся к низкому значению коэффициента PUE. Однако подчеркну, что оба эти требования — энергосбережение и надежность — вовсе не противоречат друг другу. Просто если мы хотим добиться максимальной экономии средств в ЦОДе за счет экономии электроэнергии с помощью современных технологий, то следует использовать такие решения, в которые высокая надежность заложена. Не стоит экономить за счет надежности. Практика показывает, что это возможно учесть оба требования — и энергосбережение, и надежность.
PC Week: Благодарю за беседу.