До недавнего времени компании могли довольно легко приобрести сервер необходимой производительности под поставленные задачи и с ограничениями по бюджету. Несмотря на то, что главная задача любого сервера — обеспечение непрерывности бизнес-операций, долговечность не имела первостепенного значения. С учетом гарантии и постгарантийных услуг производителя требования к бесперебойной работе ограничивались
С уходом иностранных вендоров с российского рынка и отменой их гарантийных обязательств, с логистическими трудностями при доставке комплектующих для серверов, а также сильным ростом их стоимости все актуальнее становится вопрос — как продлить срок службы серверов, сохранив производительность и работоспособность?
Стоит отметить, что те компании, которые взяли курс на импортозамещение и внедряют у себя серверные решения отечественных производителей, находятся в более благоприятных условиях. У них есть доступ к стандартным гарантиям, а также к постгарантийному обслуживанию. Например, передовые российские вендоры предлагают несколько уровней расширенной гарантии, которая включает в себя замену комплектующих на следующий рабочий день и техническую поддержку инженеров в сложных случаях, если вдруг оборудование выйдет из строя. Совсем в другой ситуации находятся владельцы серверов ушедших или «no name» производителей.
Именно для них, в первую очередь, мы составили несколько советов, которые помогут увеличить срок службы серверов. Хотя эта информация может быть полезна и компаниям, у которых с гарантийным обслуживанием «все хорошо».
Гигиена превыше всего
Физическая чистота — важный аспект обслуживания серверов. Практически во всех серверных по углам можно встретить скопление пыли. Это заставляет задуматься, что же накапливается внутри самого сервера. Пыль в сервере может привести к перегреву и повреждению оборудования. Она может засорять вентиляторы и вентиляционные отверстия, что приводит к снижению потока воздуха и повышению температуры. Перегрев может вызвать тепловую нагрузку на аппаратные компоненты и привести к их преждевременному выходу из строя.
Важно чистить серверы один-два раза в год — выключать их, продувать сжатым воздухом и пылесосить. Одновременно с этим необходимо следить за чистотой фильтров кондиционеров.
Стабильное электропитание
Короткие перебои в электропитании, перегрузки и колебания напряжения практически всегда вызывают повреждение сервера или его компонентов, а в некоторых случаях приводят к потере данных. Один из возможных способов защиты — это использование источников бесперебойного питания и стабилизаторов напряжения. Первые обеспечивают плавный переход с электросети на батарейное питание, что позволяет сохранить работу серверов в течение определенного времени. Вторые спасают от перегрузок и колебаний напряжения.
Правильное охлаждение
Хорошее охлаждение является ключевым фактором продления срока службы серверов. Компоненты сервера, такие как процессоры и память, генерируют большое количество тепла во время своей работы. Перегрев сервера может привести к сбоям и сокращению срока службы оборудования. Чтобы избежать этого, необходимо обеспечить правильную организацию системы «холодных» и «горячих» коридоров.
Существует несколько методов охлаждения серверов. Один из наиболее распространенных — использование вентиляторов и системы кондиционирования воздуха. Кондиционеры помогают охлаждать воздух в помещении, где расположен сервер, а вентиляторы перемещают этот холодный воздух через сервер. Используя такой способ, очень важно поддерживать систему охлаждения сервера в рабочем состоянии. Даже частичный ее выход из строя приведет к перегреву. Также рекомендуется наладить температурный мониторинг, который будет отслеживать температуру сервера и оповещать администраторов о выходе ее за пределы рекомендуемого диапазона.
Замена устаревших компонентов
Известно, что срок службы жестких дисков ограничен. Чаще всего они выходят из строя без предупреждения, что приводит к потере данных и простою системы. Это же касается и блоков питания и вентиляторов, которые выходят из строя из-за износа. Предотвратить это позволяет регулярное техническое обслуживание. Оно может снизить вероятность аппаратных сбоев и вовремя выявить потенциальные проблемы — до того, как они станут критическими и потребуют дорогостоящего ремонта.
Выявить устаревшее и «уставшее» оборудование помогает и специализированное ПО мониторинга производительности сервера, а также анализ журналов. Они позволяют обнаружить аномалии и ошибки, которые могут указывать на проблемы с аппаратным или программным обеспечением.
Обновление и модернизация
Обновление компонентов в середине срока службы — это, возможно, самый главный и самый трудновыполнимый совет. Компании часто покупают серверы с конфигурацией, учитывающей предполагаемую рабочую нагрузку. Однако через год или два после развертывания рабочие нагрузки обычно меняются в большую сторону, что сразу же отражается на работе сервера.
Чтобы провести модернизацию сервера, начните с определения того, какие серверы нуждаются в новом оборудовании. Используйте программы мониторинга серверов для измерения времени безотказной работы, успешности процессов, количества потоков и скорости отклика приложений. Эти показатели демонстрируют, сколько аппаратного и дискового пространства требуется приложениям для нормальной работы.
На какие компоненты стоит обратить внимание в первую очередь:
Диск. Выше уже отмечалось, что проблемы с жесткими дисками на серверах возникают, как правило, чаще всего. Поэтому обновление и модернизация этих компонентов — вопрос первостепенной важности.
Прежде всего, при появлении такой возможности лучше заменить HDD на SSD. Помимо более высокой скорости чтения и записи, меньшей задержки и улучшенной скорости передачи данных, твердотельные накопители не имеют движущихся частей, а значит менее подвержены механическим поломкам. Срок службы SSD значительно выше, чем у традиционных жестких дисков, а значит они требуют более редкой замены.
Если возможности перехода на SSD нет, то выбирайте HDD с учетом будущих рабочих нагрузок, т. е. «берите с запасом». После замены обязательно протестируйте новые компоненты, чтобы убедиться в их правильном функционировании и избежать возможных серьезных сбоев в последующей работе сервера.
Оперативная память. Добавить оперативную память в сервер можно, заполнив пустые слоты для двойных встроенных модулей памяти (DIMM) или заменив все DIMM на модули большей емкости. В идеале DIMM должны иметь одинаковый размер и скорость работы, а также быть одного производителя. При добавлении оперативной памяти старайтесь, чтобы все новые модули были в одном сервере, а старые — в другом. Такая практика обеспечивает наиболее эффективную работу системы; если смешивать и подбирать слишком много различных характеристик DIMM, то качество обработки данных со временем может ухудшиться.
Использование сервера по назначению
Иногда об этом забывают, особенно небольшие компании. Если ваш сервер не сконфигурирован для хранения архивов, то убедитесь, что ненужное ПО, старые журналы и другие данные (например, электронные письма) удалены и не занимают лишнего места в памяти. Регулярно проводите сканирование серверов и удаляйте устаревшие версии ПО и старые файлы.
Проверка работоспособности программного обеспечения
Обновление версий ПО и микропрограмм является обязательной частью модернизации серверов. Регулярность этого процесса помогает предотвратить перебои в работе серверной инфраструктуры. Обычно обновления операционных систем и гипервизоров проходит в штатном режиме, но очень часто компании упускают из виду основные обновления систем ввода-вывода и микропрограммного обеспечения. Убедитесь, что вы применяете все возможные обновления, чтобы поддерживать ваши серверы в рабочем состоянии.
Оптимизация операций ввода-вывода
Если вы используете Windows, то наверняка знаете, что их файловая система создает небольшие, дробные и случайные операции ввода-вывода в качестве штатного метода работы с данными. Это означает, что ОС должна обрабатывать несколько операций ввода-вывода там, где была бы гораздо эффективнее одна операция. Последовательный ввод-вывод вместо случайного также позволяет экономить значительные ресурсы — как виртуальные, так и физические. Для обеспечения большой и чистой непрерывной записи необходимо внедрять решение по оптимизации ввода-вывода.
Поддержание наличия ЗИПа (запасных частей)
Лучше пока забыть про стратегию начинать что-либо делать, только когда проблема уже случилась (например, выделять бюджеты, когда диски уже износились, или бежать в магазин, когда блок питания сгорел). При любой возможности закупайте комплектующие, которые чаще всего выходят из строя. О сроках хранения можно не беспокоиться, а при возникновении форс-мажорных ситуаций или в случае внеплановой модернизации такие запасы позволят гарантировать непрерывность работы серверов и не зависеть от ситуации на рынке.
Помните, при правильном уходе и обслуживании серверы могут служить бизнесу значительно дольше своих паспортных показателей. Но не стоит строить долгосрочную стратегию развития ИТ-парка компании на устаревшем оборудовании. Рано или поздно его все равно придется менять. И в этом случае лучше обратить внимание на серверы отечественных производителей. Такие серверы конфигурируются с учетом российских реалий и требований, а производители дают гарантии на свое оборудование и обеспечивают необходимую техническую поддержку.