Пока все удивляются избирательности познаний истории одного финского парня, из яндекса доложили касательного главного недавнего падения.
Лучшая фраза в репорте, несомненно, это: "В дальнейшем, в ходе починки возникла нештатная ситуация, которая привела к нарушению связности уже и существующих ВМ".
Ну ладно, хоть что-то объяснили. Хотя понятней не стало.
16 октября команда сервиса VPC проводила в зоне ru-central1-b обновления контроллеров VPC, отвечающих за распространение маршрутной информации. После обновления мы обнаружили, что аналогичные компоненты зоны ru-central1-a перешли в нестабильное состояние, в котором наблюдалась существенная деградация распространения маршрутной информации по компьют-нодам, на которых запущены и работают виртуальные машины (ВМ). Отсутствие маршрутов привело к сетевой недоступности вновь создаваемых ВМ, при этом уже работающие к тому моменту ВМ продолжали быть доступными.В дальнейшем, в ходе починки возникла нештатная ситуация, которая привела к нарушению связности уже и существующих ВМ - примерно пятой части всех ВМ зоны. Далее мы расскажем, как эта ситуация сказалась на сервисах, как мы сумели решить ситуацию, и какие шаги предпринимаем, чтобы минимизировать риск повторения в будущем.
https://status.yandex.cloud/ru/incidents/972