Агент ALE от Sakana AI входит в топ-21 среди 1000 экспертов по кодированию
Японская компания Sakana AI создала ИИ-агента, способного решать сложные задачи оптимизации, используемые в промышленности. В ходе соревнования в реальном времени ИИ соревновался с более чем 1000 программистов-людей.
Агент ALE от Sakana AI занял 21-е место на 47-м эвристическом конкурсе AtCoder, который проводит соревнования по программированию в Японии, где участники решают сложные математические задачи с помощью кода. У этих «NP-сложных» задач нет известных эффективных решений, что делает их особенно трудными.
Задания отражают реальные проблемы в промышленности: планирование маршрутов доставки, организация рабочих смен, управление производством на заводе и балансировка энергосетей. Участники-люди обычно тратят недели на поиск оптимальных решений.
Работа основана на ALE-Bench, который Sakana AI называет первым эталоном для алгоритмического программирования на основе баллов. Этот эталон включает в себя 40 сложных задач по оптимизации из прошлых конкурсов AtCoder. В отличие от традиционных тестов, которые просто определяют правильность или неправильность ответов, ALE-Bench требует постоянного улучшения в течение длительного времени.
Агент ALE работает на базе Google Gemini 2.5 Pro и сочетает в себе две основные стратегии. Во-первых, он использует экспертные знания о проверенных методах решения непосредственно в своих инструкциях. Это включает в себя такие методы, как имитация отжига, которая тестирует случайные изменения в решениях и иногда принимает худшие результаты, чтобы избежать локальных тупиков.
Во-вторых, система использует алгоритм систематического поиска под названием «поиск с приоритетом», который всегда выбирает наиболее перспективное частичное решение и развивает его дальше. Агент дополняет этот подход методом «лу
Читать на habr.com