После произошедшего вчера сбоя в работе Яндекса пресс-служба компании разослала информацию о причинах случившегося. Сервисы Яндекса, как заметили все его пользователи, примерно с 17 часов по московскому времени 19 августа полностью ушли в офлайн на несколько часов.

Согласно информационному письму Яндекса, сбой произошел из-за ошибки программного обеспечения на маршрутизаторе, расположенном в новом дата-центре компании в Амстердаме. С работой дата-центров, DDoS-атаками, пожарами, а также любыми другими внешними факторами происшествие, по заявлению Яндекса, не связано.

В более подробном описании проблемы сказано, что в Яндексе используются протоколы маршрутизации – внутренний протокол OSPF и внешний протокол BGP. «Из-за ошибки информация обо всех внешних маршрутах оказалась во внутренних таблицах маршрутизации. Это примерно на три порядка больше маршрутов, чем обычно. Протокол OSPF не рассчитан на такое количество. В результате у всех маршрутизаторов кончилась память, и они перестали работать. Нарушилась работа сети, и через несколько минут Яндекс стал полностью недоступен» - поясняет пресс-служба поисковика.

Сотрудники компании довольно долго добирались по цепочке до источника проблемы, потому что внутренняя сеть тоже перестала работать. После исправления ошибки на маршрутизаторе яндексоиды сняли нагрузку с остальных маршрутизаторов (а их у компании более сотни), разделив сеть на несколько частей.

«Количество трафика снизилось, у маршрутизаторов появилось больше свободной памяти, и они смогли самостоятельно восстановить связность сети. Сеть начала постепенно подниматься. Через некоторое время сервисы Яндекса стали доступны большей части пользователям», - так описывают последнюю фазу восстановления работы сервисов сотрудники Яндекса, принося извинения пользователям за произошедший сбой.