В Cloudflare раскрыли причину часового глобального сбоя в работе публичного DNS-резолвера 1.1.1.1
В инженерной команде Cloudflare раскрыли причину часового глобального сбоя в работе публичного DNS-резолвера 1.1.1.1 и сетевого сервиса Gateway plain text DNS. Инцидент произошёл 14 июля 2025 года и затронул всех пользователей. В качестве временной меры для решения сетевых проблем клиентам Cloudflare и всем остальным пользователям предлагалось выполнять DNS-запросы с помощью другого провайдера.
Сбой произошёл из-за неправильной настройки устаревших систем, используемых для поддержки инфраструктуры, которая объявляет IP-адреса Cloudflare в Интернете.
Спустя чуть более часа после начала инцидента инженеры Cloudflare смогли восстановить работу DNS-резолвера 1.1.1.1 в полном объёме. Оказалось, что сетевая проблема в виде ошибки конфигурации была в IT-инфраструктуре компании с 6 июня, но не проявляла себя из-за локальных ограничений в системе.
Почти все сервисы Cloudflare доступны в Интернете с помощью метода маршрутизации anycast. Эта технология позволяет обслуживать трафик популярных сервисов в различных местах Интернета, увеличивая пропускную способность и производительность. Это лучший способ обеспечить глобальное управление трафиком, но также означает, что проблемы с объявлением этого адресного пространства могут привести к глобальному сбою.
Cloudflare анонсирует маршруты anycast в Интернет, чтобы трафик по адресам доставлялся в центр обработки данных Cloudflare, предоставляя услуги из множества разных мест. Большинство сервисов Cloudflare, например, публичный DNS-резолвер 1.1.1.1, предоставляются глобально, но некоторые сервисы компании ограничены определёнными регионами.
Эти сервисы являются частью услуги Data Localization Suite (DLS), который позволяет клиентам настраивать Cloudflare различными способами для соответствия
Читать на habr.com