Каждый сетевой руководитель стремится к быстрой и надежной работе сети. Когда конечные пользователи начинают жаловаться на медленную или вообще ненадежную работу сети, он должен немедленно принять меры. Но с чего начать? В большинстве случаев ответ можно найти, изучив ряд ключевых метрик, отмечают опрошенные порталом Network Computing эксперты.
Ключевые сетевые метрики для рассмотрения
Время безотказной работы
Время безотказной работы — самая важная сетевая метрика, считает Гаурав Катария, инженер-программист компании Meta (признана экстремистской и запрещена в РФ). «Это фундамент, на котором строятся все остальные метрики, — утверждает он. — Без высокого времени безотказной работы вы не можете рассчитывать на надежную и эффективную сеть».
Время безотказной работы напрямую влияет как на производительность, так и на эффективность. «Когда ваша сеть не работает, все приходит в упадок, — предупреждает Катария. — Сотрудники не могут работать, клиенты не могут получить доступ к услугам, и доходы падают. Высокое время безотказной работы гарантирует, что пользователи смогут получать доступ к ресурсам, общаться и выполнять задачи без перебоев».
Потеря пакетов
Потеря пакетов по важности стоит на втором месте после времени бесперебойной работы. «Это ключевой показатель производительности сети, который может оказывать значительное влияние на работу пользователей», — говорит Катария. Высокий уровень потери пакетов может привести к ухудшению качества передачи голоса и видео, медленной передаче файлов и снижению общей производительности сети. Эта метрика дает ценную информацию о производительности сети в целом. «Мониторинг потери пакетов позволяет выявить узкие места, устранить неполадки и оптимизировать производительность сети», — отмечает Катария. Это важный показатель для обеспечения качественной голосовой и видеосвязи, а также быстрой и надежной передачи данных.
Потеря пакетов — это тихий убийца эффективности сети, говорит Анбанг Сюй, основатель JoggAI, видеоплатформы на основе ИИ. «Здесь работает аналогия с дырявой трубой — данные теряются при передаче, а те, что поступают, оказываются неполными или запоздавшими, — объясняет он. — Это приводит к неэффективности, которая может привести к увеличению времени обработки или снижению качества результатов, особенно в приложениях, требующих большой пропускной способности, таких как потоковое видео или платформы для совместной работы».
Даже относительно небольшая потеря пакетов может привести к снижению производительности в чувствительных приложениях, таких как VoIP, где потеря пакетов приводит к пропаданию звука, или потоковое вещание, где это проявляется в виде буферизации, говорит Владислав Билай, DevOps-инженер компании Aquiva Labs, предоставляющей ИТ-услуги, и архитектор решений AWS. «Решайте эти проблемы оперативно, обеспечивая надежность и стабильность работы сети», — советует он.
Время безотказной работы (снова)
Когда речь идет о надежности, время безотказной работы остается стандартом, говорит Джефф Мейнс, основатель тренинговой и консалтинговой компании Champion Leadership Group. «Это самый простой показатель надежности сети, — отмечает он. — Если клиенты не могут получить доступ к вашим услугам, когда они в них нуждаются, то никакие инновации и оптимизации не имеют значения».
Надежность — это не только предотвращение простоев, но и создание доверия. «Одна из компаний, использующая SaaS-платформу для оказания медицинских услуг, столкнулась с трудностями при показателе надежности в 98%. Эти два процента простоев привели к серьезным сбоям в работе их пользователей, — рассказывает Мейнс. — Благодаря внедрению протоколов резервирования и усиленному мониторингу компания смогла достичь 99,99% времени безотказной работы, что напрямую связано с повышением удовлетворенности пользователей на 30%. Надежность повышает доверие, а доверие способствует удержанию персонала».
Латентность и многое другое
«Вспомните, когда вы в последний раз пытались транслировать видео или организовать живой разговор, но столкнулись с досадными задержками — это и есть латентность, — говорит Сюй. — В стремительно развивающемся цифровом мире, где миллисекунды могут создать или разрушить пользовательский опыт, латентность — это не просто цифра, это основа коммуникации и совместной работы в реальном времени».
По его словам, если сложить вместе показатели задержки и потери пакетов, то получится целостная картина состояния сети. «Латентность отражает скорость реакции, а потеря пакетов — стабильность, — объясняет Сюй. — Игнорировать любую из этих проблем — все равно что не замечать трещины в фундаменте: сейчас они могут казаться небольшими, но со временем могут поставить под угрозу всю конструкцию».
По словам Катарии, важно отслеживать латентность, а также пропускную способность, уровень ошибок и доступность. Эти метрики, если рассматривать их в комплексе, дают полное представление о производительности сети и помогают выявить области, требующие улучшения. «Следя за этими показателями, вы сможете обеспечить бесперебойную работу сети, выявить потенциальные проблемы до того, как они станут серьезными, и принять обоснованные решения о модернизации и обслуживании сети», — считает Сюй.
Среднее время обнаружения
MTTD измеряет скорость обнаружения проблем, что позволяет командам быстро устранять проблемы, в идеале даже до того, как пользователи начнут их замечать. «Этот показатель не часто обсуждается, но он имеет огромное значение», — говорит Мейнс.
Он рассказывает, что однажды работал с SaaS-клиентом из финансового сектора, сеть которого испытывала скачки латентности, которые не были сразу заметны: «Сфокусировавшись на MTTD, их команда внедрила мониторинг на основе ИИ, чтобы выявлять аномалии в течение нескольких минут, а не часов. Этот шаг позволил сократить отток высокоценных клиентов, которые в противном случае были бы разочарованы постоянными задержками. MTTD демонстрирует, насколько хорошо ваша команда предвидит и решает проблемы».
Заключительные соображения
Мейнс говорит, что метрики лучше всего работают, когда привязаны к поведению пользователей. «Сопоставьте их с отзывами клиентов и данными об использовании, чтобы понять реальное влияние технических проблем, — советует он. — Метрики должны определять стратегию, а не просто измерять прошлую производительность».