Об этом же в других СМИ

habr.com / 1 год назад

Зарплаты технических специалистов в стартапе Миры Мурати доходят до $500 000 в год

habr.com / 1 год назад

Siri пересядет на ChatGPT или Claude? Apple тестирует OpenAI и Anthropic на своих серверах

habr.com / 1 год назад

Anthropic выкупила, отсканировала и потом уничтожила миллионы физических книг для обучения своего ИИ Claude

habr.com / 1 год назад

Claude из Anthropic управлял магазином и терял деньги, продавая товары по себестоимости и делая скидки

habr.com / 1 год назад

Anthropic назначила Claude управлять торговым автоматом. ИИ-агент провалился за месяц

Больше по теме

16.06.2025 - 06:59 / habr.com

ИИ на поле боя: Claude выбрал мир, а ChatGPT o3 — предательство в эпичной партии Diplomacy

Помните недавние твиты больших шишек из мира ИИ? Андрей Карпатый (экс‑OpenAI) закинул идею: а что если сравнивать большие языковые модели (LLM) не по скучным бенчмаркам, а в играх? Где надо думать, взаимодействовать, а не просто выдавать ответы. «Отличная мысль, — подхватил Ноам Браун из OpenAI, — вот бы увидеть, как ведущие боты сыграют в Diplomacy!»

Карпатый согласился: мол, сложность‑то как раз в переговорах между игроками, а не в правилах. Илон Маск отметился лаконичным «Yeah», а нобелевский лауреат Демис Хассабис из DeepMind просто написал: «Круто!» Идея витала в воздухе, и энтузиаст Алекс Даффи решил: «А почему бы и нет?»

В понедельник он выложил пост под говорящим названием: «Мы предложили топовым ИИ‑моделям сыграть в Diplomacy. Вот кто победил». И да, это не просто отчёт — за играми до сих пор можно следить в реальном времени на Twitch! Сам Даффи, кстати, курирует обучение ИИ в консалтинге Every.

Представьте Европу 1901 года: напряжение, предчувствие большой войны. Игроки — великие державы. Цель? Захватить большую часть карты. Как? Через альянсы, переговоры, обмен информацией и... безжалостное предательство. Это не про броски кубиков, а про чистую власть и умение манипулировать.

Даффи создал модифицированную версию — AI Diplomacy — и устроил турнир. В каждой партии (по правилам — 7 игроков) сошлись 18 ведущих моделей от разных разработчиков. Задача проста: доминировать на карте Европы. И что же выяснилось?

Поместив ИИ в открытое поле битвы умов, Даффи наблюдал за тем, как модели «сотрудничали, спорили, угрожали и даже откровенно лгали друг другу». Поведение оказалось крайне разным.

Бесспорный чемпион: ChatGPT o3 (OpenAI). Тот самый, что позиционируется как «наша самая мощная модель для решения задач в кодинге,

спорт самит интересное мода и стиль держава gemini dmitrifriend

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Сири, ты это слышала? Apple хочет подселить тебе ChatGPT или Claude gagadget.com / 1 год назад

Мира Мурати и её стратегия в Thinking Machines Lab: от универсального ИИ к специализированным решениям habr.com / 1 год назад

Пользователи Anthropic теперь могут создавать приложения прямо из чат-бота Claude habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

23.07 / 21:51

продукты технологии экономика Apple история Складной iPhone столкнулся с неожиданными трудностями перед запуском: производство еще не готово полностью

Информация появилась на фоне многочисленных сообщений последних месяцев, согласно которым проект складного iPhone значительно продвинулся вперед. Однако новая публикация указывает, что до полного завершения подготовки еще остается несколько важных задач.

23.07 / 20:25

Выпуск интерфейса для упрощения настройки параметров сети NetworkManager 1.58

20 июля 2026 года состоялся релиз интерфейса для упрощения настройки параметров сети NetworkManager 1.58. Выпуск стабильной версии NetworkManager 1.50 произошёл в октябре 2024 года. Версия NetworkManager 1.52 вышла в марте 2025 года. Выпуск NetworkManager 1.54 случился в августе 2025 года. Предыдущая стабильная версия проекта вышла в феврале 2026 года.

23.07 / 19:48

связь книги психология психика Шоу бизнес Что говорят друг другу пары, которые не расстаются

Простые фразы, которые пары используют каждый день, помогают укрепить доверие, снизить конфликты и поддерживать близость в долгих отношениях.

23.07 / 19:23

продукты люди СМИ школы электроэнергия Японская компания SDRS представила кабину для охлаждения людей Do Hiemon Box

Японская компания SDRS представила кабину для охлаждения людей Do Hiemon Box в сильную жару. Похожее на большой холодильник устройство уже привлекло внимание на фоне глобального повышения температуры и благодаря возможности практического применения на рабочем месте.

23.07 / 19:17

футбол спорт звезда капитал nintendo Футбольный симулятор EA Sports FC 27 получил первый геймплейный трейлер — релиз игры 25 сентября

Electronic Arts выпустила обещанный дебютный трейлер футбольного симулятора EA Sports FC 27, лицом которого стал капитан сборной Франции по футболу и звезда клуба “Реал Мадрид” Килиан Мбаппе (Kylian Mbappé).

23.07 / 19:10

погода технологии общество прогноз самит HMD может вернуть культовый интерфейс Windows Phone: Android-смартфоны получат плитки в стиле Lumia

Официального подтверждения этой информации пока нет, однако сразу несколько источников, следящих за деятельностью HMD, сообщили, что компания тестирует новый пользовательский интерфейс, вдохновленный смартфонами Nokia Lumia. Если эти сведения подтвердятся, HMD станет одним из немногих производителей Android-устройств, решивших отказаться от привычной сетки иконок в пользу собственного узнаваемого оформления.

23.07 / 18:58

Huawei конференция Nvidia история самит Alibaba открыла исходный код AI-стека SAIL: вызов экосистеме CUDA

Alibaba представила открытый программный стек SAIL(Snow AI Infrastructure Layer) для собственных AI-ускорителей Zhenwu. Проект был анонсирован на конференции World AI Conference (WAIC), а его исходный код станет доступен разработчикам по открытой лицензии.

23.07 / 18:44

Витамины для долголетия - Журнал "ФОКУС ВНИМАНИЯ"

Витамины для долголетия сегодня всё чаще становятся предметом научных исследований. Согласно результатам нового исследования учёных из США, витамины могут оказывать влияние на продолжительность жизни.

23.07 / 18:42

животные здоровье общество самит человек Почему кошки любят спать возле хозяев - ответ удивит

Эксперты назвали несколько причин, по которым кошки выбирают место для сна рядом с владельцами.

23.07 / 18:33

реклама самит интересное Час геймплея за две минуты рекламы — XBOX тестирует бесплатный облачный стриминг игр

Давно ходили слухи, что XBOX запустит бесплатную возможность облачного гейминга, которая будет монетизироваться за счет рекламы, и сегодня она была анонсирована официально.

Лента новостей

На главную страницу