Мало кто доволен тем, как осуществляется управление сетью и ИТ. Мониторинг производительности приложений (APM), или «наблюдаемость», может стать ключом к успеху, пишет на портале No Jitter Том Нолле, президент, основатель и главный консультант/аналитик корпорации CIMI.
Согласно опросу почти 100 CIO, 39% линейных руководителей не полностью удовлетворены приложениями, которые предоставляет ИТ-служба. Наибольшие проблемы создают нарушения в работе приложений, под которыми они понимают как фактические перебои в работе, так и ситуации, когда производительность не соответствует бизнес-целям. Чуть менее трех четвертей тех же CIO утверждают, что за удовлетворение потребностей линейных руководителей отвечают их системы и персонал по управлению сетями и ИТ, и только 10% CIO говорят, что они удовлетворены тем, как выполняется эта работа. Почему? Потому что, по мнению CIO, они управляют не тем, чем нужно.
Отчасти это обычная проблема, связанная с согласованием целей управления сетями и ИТ с тем, что важно для пользователей. Пользователей волнует, насколько хорошо работают их приложения. Можете ли вы представить себе, что руководители высшего звена сидят и рассуждают о ключевых показателях эффективности (KPI) и качестве обслуживания (QoS), а операционные работники говорят о таких вещах, как качество опыта (QoE) и время безотказной работы? Скорее всего, нет, поскольку изначально трудно найти некий коэффициент, который бы преобразовывал показатели управления операциями в показатели удовлетворенности пользователей. Лишь треть CIO считают, что им это удалось, а еще треть вообще не уверена, что это возможно. Я не располагаю обширными данными об отношении линейных руководителей, но то, что мне известно, говорит о том, что более 80% из них считают, что ИТ- и сетевые команды не «видят» всех проблем, влияющих на их работу.
Я не хочу говорить здесь о том, насколько QoS можно сопоставить с KPI; этот спор практически бесполезен для обеих сторон. Вместо этого я хочу сосредоточиться на последнем пункте, а именно на том, что операционные работники просто не видят тех вещей, которые имеют значение. Как такое может быть, если учесть, что все эти данные собираются в системах управления и журналах? На многих предприятиях, как ни странно, никто не задается этим вопросом. Действительно, только 35 из 198 предприятий, которые сообщили мне о наличии разрыва между линейными и ИТ-подразделениями, указали, что у них существует конкретная команда или хотя бы человек, который должен преодолевать этот разрыв. Причем в качестве основной причины неудовлетворенности линейных подразделений они назвали одну проблему — поляризацию системы управления.
Эти 35 предприятий заявили, что у них (в среднем) имеется пять различных систем управления и соответствующих операционных сотрудников: первая управляет оборудованием дата-центра, вторая — облаком, третья — глобальной сетью, четвертая — поддержкой подключенности удаленных офисов, пятая — приложениями. При этом большинство из них признали, что перечисляли системы по мере того, как они приходили на ум, то есть в порядке их внутренней важности. Проблема, по мнению почти всех 35 респондентов, заключается в том, что нет единой системы, отражающей состояние основных ИТ-ресурсов пользователя, и не существует последовательной стратегии создания представления о них со стороны пользователя.
Причина этого, конечно, есть. Практически все специалисты по ИТ- и сетевым операциям согласны с тем, что их процессы управления определяются оповещениями о проблемах. Эти специалисты получают предупреждение, сообщение об ошибке, в котором говорится о том, что с ИТ-элементами, находящимися под их контролем, что-то не так. Они выполняют определение/изоляцию проблемы и устраняют ее. Для большинства предприятий это ежедневный процесс, и неудивительно, что он определяет как выбор инструментальных средств, так и методы работы. Конечно, подавляющее большинство этих предупреждений лишь косвенно связано с качеством обслуживания пользователей, и многие вещи, влияющие на QoE, не генерируют предупреждений. Более того, проблемы с качеством обслуживания вызывают некоторые условия, видимые персоналу ИТ- и сетевых операций, однако эти условия не распознаются, поскольку не коррелируют из-за разделения управления.
Значит, как говорится, нужно «единое стекло»? Проблема с этим, по мнению 35 предприятий, заключается в том, что оно обычно оказывается матовым. Или, может быть, проблема в том, что через него смотрят матовые глаза? Общая консоль управления, получающая уведомления о тревогах от наших пяти гипотетических систем управления, вероятно, сможет их отображать, но кому? Кто, как говорится, будет следить за самими охранниками? По мнению 35 предприятий, в которых есть реальные люди, отвечающие за общее качество обслуживания, это не означает, что у них есть люди, способные разобраться во всех этих управленческих представлениях. Им нужна другая стратегия, а еще лучше — несколько стратегических шагов.
Где можно получить наилучшую видимость QoE? По мнению наших 35 предприятий, она находится на уровне приложений, а это означает, что мониторинг производительности приложений (APM), или «наблюдаемость», должен быть ключом ко всему. Мы должны иметь возможность мониторинга с помощью APM работы по мере ее прохождения через сеть, облако и дата-центр, видя каждую точку сбоя или задержки, отслеживая каждую тенденцию. С точки зрения пользователя видимость — это способ измерения опыта, определяемого QoE.
Хорошая новость заключается в том, что специалистам не нужно отслеживать пять различных APM-систем. Плохая новость заключается в том, что в каждой из технологических областей, о которых я говорил выше, обычно есть по одной системе, и ни одна из них не имеет полной видимости. Хорошая APM должна основываться на «зондах», вставляемых в ПО для регистрации активности и поддержки временнóго анализа реальных рабочих процессов приложений. Многие предприятия говорят, что используют APM, но менее пятой части из них утверждают, что имеют во всех своих ключевых приложениях зонды, позволяющие отслеживать работу через домены остальных четырех систем управления. Великая объединительная стратегия APM по большей части слепа, поэтому единые панели не приносят большой пользы.
Ситуация, в которой оказались предприятия, проста и печальна. Даже те 35 предприятий, которые имеют некоторое представление об общей производительности линейных пользователей, говорят, что они получают его от... линейных пользователей. Кто-то звонит в службу поддержки. В какую именно? Это зависит от мнения звонящего. Они не могут подключиться к своему приложению, так что, возможно, не работает сеть, или приложение, или облако, или дата-центр... или, может быть, это инопланетяне стреляют космическими лучами? Дело в том, что «тревога» здесь генерируется техническим дилетантом и почти наверняка обрабатывается тем, кого этот дилетант сочтет ответственным. Сделайте паузу, пока хор 35 предприятий поет: «Два разных мира, мы живем в двух разных мирах», говоря о сети и ИТ — или даже «Пять разных миров», если мы хотим быть точными.
Раздельные стратегии управления приводят к раздельным неудачам. Невозможно объединить управление сетью и ИТ без того, чтобы было на чем объединяться, а это значит, что мы должны сделать APM реальным и полным, способным быть универсальной справочной службой для пользователей и координатором реагирования для всех этих разрозненных команд управления. Сколько из этих 35 предприятий предлагают своим командам реагирования на запросы пользователей такую APM-ориентированную перспективу? Вы угадали... ноль. Ситуация должна измениться, иначе мы просто пробуксовываем, когда говорим о поддержке конечных пользователей с помощью наших сетей и ИТ.