19 августа на семь часов сервисы “Яндекса” оказались недоступны. Кумулятивный комментарий происшествия со стороны “Яндекса” таков: это произошло из-за проблемы с маршрутизацией в сети компании; с работой дата-центров, DDoS-атаками, пожарами, а также с любыми другими внешними факторами это никак не связано; основные последствия проблемы к настоящему времени устранены; никакие пользовательские данные не потеряны.
Из более развернутых объяснений, сделанных представителями провайдера, следует, что причиной сбоя стала ошибка программного обеспечения в маршрутизаторе, расположенном в новом дата-центре “Яндекса” в Амстердаме. Поскольку внутренняя сеть тоже не работала, специалистам “Яндекса” потребовалось много времени для того, чтобы добраться до источника проблемы и устранить ее.
Выяснить, с какой именно моделью маршрутизатора, чьей разработки и производства произошел инцидент, нашему еженедельнику не удалось.
Комментируя этот инцидент, ведущий специалист по ИБ компании Positive Тechnologies Дмитрий Курбатов в оценке причины отказа маршрутизатора больше склоняется к человеческому фактору, а именно к неправильной настройке устройства, нежели к ошибке в ПО.
По мнению заместителя генерального директора, руководителя направления центров обработки данных компании КРОК Руслана Заединова, подобный сбой характерен для ошибок конфигурирования сетевой подсистемы. Как он выразился, характеризуя сбой, “все работает, но никто не может достучаться”.
В оценках оперативности восстановления провайдером своей сети после сбоя наши эксперты придерживаются противоположных позиций. Согласно расчетам Дмитрия Курбатова, семь часов на реагирование и устранение причин слишком много: “Обычно отказоустойчивая инфраструктура дата-центра предусматривает период работоспособного состояния оборудования (uptime) 99,999% времени эксплуатации в год. Даже если в этом дата-центре в течение года больше ничего не случится, статистика уже всё равно не дотягивает до пяти девяток и равна 99,921% (7 часов в год ~ 0,079%)”. В то же время Руслан Заединов считает, что восстановление было проведено очень быстро, и несколько часов, ушедших на это, — очень хороший результат.
Согласно предположениям Руслана Заединова, основной ущерб клиенты могли понести от того, что несколько часов не работала онлайновая реклама. “Однако потери от этого простоя не должны быть большими, так как все произошло вечером пятницы: Дальний Восток уже спал, Сибирь засыпала, на Урале все уже уехали с работы, а в европейской части — выдвигались за город. Наступало интернет-затишье, когда количество показов рекламы существенно падает, а значит доходы от нее и, соответственно, потери от ее отсутствия невелики”, — полагает он. Как следствие, по его мнению, говорить о каких-либо штрафных санкциях к провайдеру не приходится. И даже имиджевые потери, по его мнению, “Яндексу” не грозят, поскольку, проблема сбоя была устранена, как считает Руслан Заединов, профессионально и оперативно.
Отвечая на вопрос, какую ответственность понесет “Яндекс” перед пострадавшими клиентами, руководитель группы по работе с российскими медиа компании Яндекс Татьяна Комарова пояснила, что ее компания “оказывает рекламные услуги в соответствии с условиями заключаемых с клиентами договоров и полностью их соблюдает”. Яндекс принес извинения своим пользователям, и на сегодняшний день нам не известно о каких-либо претензиях клиентов к этому провайдеру по поводу произошедшего инцидента.