Искусственный интеллект для ИТ-операций (AIOps) обеспечит поддержку ИТ-операций за счет интеллектуального анализа больших объемов данных, изучения поведения систем и автоматических рекомендаций по действиям, пишет на портале The New Stack Джозеф Джордж, вице-президент BMC по продуктам для управления цифровыми услугами и операциями.
Стали ли ваши системы проще за последний год? Получаете ли вы из них меньше операционных данных? Мы все хотели бы ответить на оба вопроса утвердительно, но мы знаем, что это не так.
По мере внедрения гибридных облачных сред и передовых технологий ИТ-отделам становится все труднее справляться со сложностью и огромным объемом данных, которые генерируют цифровые системы.
Сегодня заказчики стремятся получать миллионы показателей в секунду от множества инструментов. Без возможностей AIOps не было бы практического способа масштабирования операционных команд для эффективной обработки такого объема данных.
Ставки также продолжают расти. По мнению подавляющего большинства (91%) респондентов исследования ITIC «2022 Global Server Hardware Security», один час простоя может стоить организации более 300 тыс. долл.; 44% респондентов заявили, что один час простоя обходится им более чем в миллион долларов.
Неудивительно, что AIOps является такой актуальной темой. Организации, которые правильно внедряют эту технологию, высвобождают квалифицированных сотрудников для работы над инновационными проектами, тогда как ПО на базе ИИ/МО обрабатывает растущий объем метрик, событий и журналов, обеспечивая при этом бесперебойную работу бизнеса.
Как и в случае с любым другим корпоративным ПО, внедрение AIOps без плана не является рекомендуемым путем к успеху. Как добиться успеха? Начните с этих пяти сценариев использования.
Обнаружение аномалий
Расширенное обнаружение аномалий на основе ИИ позволяет находить отклонения в данных, что помогает динамически выстраивать базовую линию сервисов — поведение системы автоматически устанавливает пороговые значения для генерации событий.
Расширенное обнаружение аномалий обычно включает в себя многомерные алгоритмы и может автоматически подстраиваться под поведение системы, которое оно изучает с течением времени. Благодаря полученным результатам вы можете осуществлять более интеллектуальный мониторинг своих систем с порогами оповещения, автоматически адаптированными к нормальным поведенческим характеристикам систем.
Корреляция событий
AIOps уменьшает шум от множества событий в среде. И разрушает разрозненность данных, получая данные в виде журналов, событий, трассировок и метрик.
Передовые технологии AIOps могут коррелировать события по нескольким измерениям времени, текста и топологии, помогая устранить шум, такой как дублирующиеся и зависимые события, и объединяя несколько базовых событий в ситуации более высокого уровня.
Изоляция корневой причины
Понимание первопричины проблемы требует точного представления о взаимосвязях между различными элементами вашей среды. Используя ИИ/МО, основанные на топологии и графе знаний, можно более точно определять первопричины, сокращая тем самым время на обнаружение источника проблемы.
Применяя этот тип расширенного анализа к операционным показателям инфраструктуры и приложений, AIOps может определять истинную проблему, экономя время и энергию ИТ-команд, которые можно было бы потратить на другие цели, и снижая операционные затраты для бизнеса.
Интеллектуальная автоматизация и устранение проблем
Хотя уменьшение шума событий и поиск первопричины проблем очень важны, в конечном итоге все сводится к принятию мер по устранению проблемы. Современные AIOps-решения могут поддерживать автоматизированные действия, которые должны быть предприняты в ответ на возникшие проблемы — в идеале они должны быть интегрированы с широким спектром платформ и инструментов автоматизации.
Когда операционные команды освоят автоматизацию, основанную на истории успеха устранения проблем, они могут определить политики, чтобы эти действия автоматически выполнялись на основе обнаруженной первопричины. Со временем AIOps-решения могут уже знать, насколько успешной была автоматизация в различных ситуациях, чтобы проактивно рекомендовать возможности автоматизации.
Предиктивные инсайты
В идеале, AIOps может вывести ИТ-операции на новый уровень, заглядывая вперед, чтобы предсказывать потенциальные проблемы и предпринимать корректирующие действия до их возникновения. Это включает в себя выявление ситуаций перенасыщения ресурсов и ограничения мощностей путем прогнозирования органического роста системы и изучения прошлого поведения. Затем операционные команды могут определить действия, включая предоставление дополнительных мощностей или ресурсов до того, как это станет проблемой.
Системы AIOps также могут просматривать данные на предмет исторических закономерностей и определять, где ожидается сбой системы или снижение производительности. Такой тип предиктивного оповещения в реальном времени избавляет ИТ-отдел от потенциальной реакции на проблему и позволяет бизнесу предотвратить перебои в обслуживании.
Предприятия не могут предоставлять цифровые услуги на фронтенде, не имея при этом необходимых инструментов для цифровой трансформации бэкенда. AIOps позволит ИТ-операциям поддерживать все более цифровой бизнес за счет интеллектуального анализа больших объемов данных, изучения поведения систем и автоматических рекомендаций по действиям как на упреждение для предотвращения сбоев системы, так и в ответ для быстрого устранения первопричин проблем, которые не удалось предотвратить.
Сосредоточение внимания на этих сценариях позволит организациям использовать новые архитектуры приложений и все более сложные гибридные экосистемы, обеспечивая при этом соответствие ИТ-операций потребностям бизнеса и меняющимся требованиям клиентов.