AWS внедряет в своих ЦОД квазислучайную архитектуру на базе отказоустойчивых сетевых графов
В AWS описали новое техническое устройство сетевой архитектуры ЦОД, которую внедряют с конца 2024 года. Она базируется на отказоустойчивых сетевых графах (Resilient Network Graphs, RNG) и уже стала стандартом для большинства новых ЦОД AWS по всему миру.
В Amazon отмечают, что традиционная топология Fat-Tree с многоуровневой структурой становится неэффективной. Когда данные передаются только по ограниченному числу сетевых путей, в случае перегрузки увеличивается задержка, а потеря одного маршрутизатора верхнего уровня может разорвать связь для больших сегментов сети под ним. Также архитектура требует сложной кабельной разводки.
В качестве альтернативы Amazon предложила архитектуру RNG, которая увеличивает количество путей передачи между узлами, вдвое сокращает количество сетевых устройств и повышает надёжность соединения. В итоге система может просто перенаправить трафик на один из множества других доступных ей путей.
Кроме того, инженеры AWS описали квазислучайную топологию. Некоторые сегменты в ЦОД проложены и подключены по определённой схеме, в то время как другие объединяются случайным образом, и эта случайность делает сети RNG более гибкими, чем Fat-Tree.
Для поиска среди большого количества доступных сетевых путей оптимального маршрута используется собственный распределённый протокол маршрутизации Spraypoint. Он работает в два этапа. Сначала исходный маршрутизатор распределяет свой исходящий трафик случайным образом между всеми своими ближайшими соседями, а затем для каждого пакета использует классический алгоритм поиска кратчайшего пути для достижения промежуточной точки в виде маршрутизатора, который был предварительно назначен для передачи трафика к определённому пункту назначения. Промежуточные точки перенаправляют
Читать на habr.com
