Об этом же в других СМИ

habr.com / 1 год назад

МТС представил ИИ-агента для корпоративных данных

habr.com / 1 год назад

Goldman Sachs тестирует вирусного ИИ-агента Devin в качестве «нового сотрудника»

habr.com / 1 год назад

AWS запускает маркетплейс ИИ-агентов при участии Anthropic в качестве партнёра

habr.com / 1 год назад

MuleSoft и новые стандарты для ИИ-агентов в корпоративных IT-системах

habr.com / 1 год назад

Новый алгоритм Sakana AI позволяет большим языковым моделям работать сообща для решения сложных задач

Больше по теме

26.06.2025 - 20:34 / habr.com

Агент ALE от Sakana AI входит в топ-21 среди 1000 экспертов по кодированию

Японская компания Sakana AI создала ИИ-агента, способного решать сложные задачи оптимизации, используемые в промышленности. В ходе соревнования в реальном времени ИИ соревновался с более чем 1000 программистов-людей.

Агент ALE от Sakana AI занял 21-е место на 47-м эвристическом конкурсе AtCoder, который проводит соревнования по программированию в Японии, где участники решают сложные математические задачи с помощью кода. У этих «NP-сложных» задач нет известных эффективных решений, что делает их особенно трудными.

Задания отражают реальные проблемы в промышленности: планирование маршрутов доставки, организация рабочих смен, управление производством на заводе и балансировка энергосетей. Участники-люди обычно тратят недели на поиск оптимальных решений.

Работа основана на ALE-Bench, который Sakana AI называет первым эталоном для алгоритмического программирования на основе баллов. Этот эталон включает в себя 40 сложных задач по оптимизации из прошлых конкурсов AtCoder. В отличие от традиционных тестов, которые просто определяют правильность или неправильность ответов, ALE-Bench требует постоянного улучшения в течение длительного времени.

Агент ALE работает на базе Google Gemini 2.5 Pro и сочетает в себе две основные стратегии. Во-первых, он использует экспертные знания о проверенных методах решения непосредственно в своих инструкциях. Это включает в себя такие методы, как имитация отжига, которая тестирует случайные изменения в решениях и иногда принимает худшие результаты, чтобы избежать локальных тупиков.

Во-вторых, система использует алгоритм систематического поиска под названием «поиск с приоритетом», который всегда выбирает наиболее перспективное частичное решение и развивает его дальше. Агент дополняет этот подход методом «лу

люди Amazon промышленность общество google gemini mefdayy Япония

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

«Масштабировали рынок в 12 раз». Ajax Systems выросла из сигнализаций в «оркестр» охранных продуктов, посягающих на $50 млрд спроса. Что строит Конотопский? forbes.ua / 1 год назад

Почему наблюдаемость так важна для экосистем ИИ-агентов? habr.com / 1 год назад

Команда ПСБ провела техмитап в Севастополе habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

24.07 / 11:11

золото животный мир Представлен почти невидимый микродрон Phantom Twist

Инженеры Северо-Западного университета создали дрон Phantom Twist, который почти незаметен человеческому глазу за счёт быстрого вращения.

24.07 / 11:11

технологии происшествия общество самит расследование За атакой на Hugging Face стояла GPT-5.6 Sol и предрелизная LLM от OpenAI

Да, теми самыми злостными хакерами оказались OpenAI. Ну почти. Компания раскрыла подробности инцидента, о котором ранее сообщила Hugging Face. Они подтвердили, что за атакой на инфраструктуру платформы стояли две модели OpenAI — публичная GPT-5.6 Sol и более мощная предрелизная модель, проходившие внутреннее тестирование на кибербезопасность.

24.07 / 11:11

технологии общество прогноз Хакеры применили исправленные ошибки WordPress для взлома веб-сайтов

По данным нескольких компаний, занимающихся кибербезопасностью, хакеры взламывают веб-сайты, работающие на уязвимых версиях WordPress. Число таких ресурсов достигло десятков миллионов.

24.07 / 11:11

СМИ закон общество Booking книги ИИ-компании начали скупать старые книги из-за нейрослопа в сети

Компания ISBNdb объявила о создании «крупнейшей в мире базы данных книг» и предлагает услуги по закупке больших объёмов печатной продукции для компаний, занимающихся ИИ. Это позволит разработчикам избежать обучения искусственного интеллекта на нейрослопе, объясняют авторы проекта.

24.07 / 11:11

технологии общество Enterprise Canonical запустила корпоративный магазин для Ubuntu Pro

Canonical представила новый способ управления программным обеспечением за брандмауэрами и в изолированных от сети средах — Enterprise Store. Доступный по подписке Ubuntu Pro, он соблюдает протоколы безопасности строгих сред, обеспечивая контролируемость, возможность аудита и предсказуемость.

24.07 / 11:06

ученые наука NASA космос климат Хокинг был прав: NASA предупреждает о скором конце света

Глобальное потепление и парниковый эффект разрушают экологию Земли. Хокинг видел в этих процессах главную причину возможного конца света.

24.07 / 10:41

технологии книги Вышел открытый проект NeeView 46.0 — просмотрщик изображений и видео для Windows

Во второй половине июля 2026 года состоялся релиз открытого проекта NeeView 46.0. Это бесплатный просмотрщик изображений и видео для Windows 10/11, предлагающий интерфейс просмотра в стиле книги. Решение разработано для пользователей, которые часто просматривают изображения, комиксы, электронные книги или видео. Исходный код проекта написан на C# и опубликован на GitHub под лицензией MIT. Это решение находится в разработке с 2016 года. Выпуск NeeView 44 с поддержкой русского языка случился в середине августа 2025 года. Сборка NeeView 45 вышла в феврале 2026 года.

24.07 / 10:41

технологии дети криминал общество политика Минцифры представило доктрину по борьбе с ИТ-преступлениями

Минцифры РФ представило «Доктрину развития системы противодействия правонарушениям, совершаемым с использованием информационно‑коммуникационных технологий». Документ опубликован для общественного обсуждения.

24.07 / 10:37

технологии самит доллар tiktok мода и стиль HMD Touch AI: Ностальгия по Lumia и китайский ИИ в корпусе за 70 долларов

Компания HMD (Human Mobile Devices) продолжает свои странные, но по-своему захватывающие эксперименты в области некромантии мобильного дизайна. На этот раз под нож (или под кисть) попал легендарный стиль Nokia Lumia. Новое устройство под названием HMD Touch AI выглядит так, словно оно только что выпало из кармана хипстера из 2012 года, но внутри у него «мозги» от создателей TikTok. Это попытка скрестить минимализм прошлого десятилетия с агрессивным маркетингом нейросетей.

24.07 / 10:37

технологии Amazon история общество Шоу бизнес Первые кадры сериала “Бегущий по лезвию 2099” показали умирающего репликанта и грозную охотницу за головами

Amazon продолжает работу над сериалом по мотивам культовой киберпанк-франшизы “Бегущий по лезвию”, в основе которой лежит не менее значимый роман Филипа Дика “Мечтают ли андроиды об электроовцах?” (Do Androids Dream of Electric Sheep?). Это будет неформальный сиквел фильма 2017 года “Бегущий по лезвию 2049” (Blade Runner 2049), а события развернутся спустя 50 лет после его финала.

Лента новостей

На главную страницу