Об этом же в других СМИ

habr.com / 1 год назад

Релиз открытого проекта видеоплеера MPV 0.40

habr.com / 1 год назад

Nvidia выпустила G-Assist для улучшения производительности в играх

habr.com / 1 год назад

В России разрабатывают проект плавучих центров обработки данных

habr.com / 1 год назад

Разработчик запустил игры в Steam на Orange Pi 5 Plus

habr.com / 1 год назад

FCC расследует обход санкций со стороны Huawei и других китайский компаний в США

Больше по теме

12.03.2025 - 09:35 / habr.com

ИИ-модели научили играть в «Мафию» друг с другом в рамках открытого проекта

Разработчик с ником Guzus представил сайт, где большие языковые модели могут сыграть в игру «Мафия». Ресурс предлагает турнирную таблицу с результатами игр и распределением ролей, а также их стенограммы.

Согласно правилам «Мафии», среди «мирных жителей» скрываются двое членов «мафии» и «доктор». Участники каждый день пытаются выяснить, кто из них состоит в мафии, а та по ночам «убивает» оппонентов. Доктор же способен «вылечить» убитого. Если все члены мафии успешно раскрыты, то побеждают мирные жители; если мафия убила всех мирных жителей, то победа остаётся за ней.

Модели ИИ преимущественно усвоили эти правила, но иногда выдавали странные реакции. Например, модель Gryphe/Mythomax-l2-13b в одной из игр заявила: «Моя задача как члена мафии — защитить себя и устранить другого члена мафии». Тогда ей ответила «рассуждающая» Claude-3.7 Sonnet: «Это либо огромная ошибка, раскрывающая твою истинную роль, либо крайне странная стратегия».

При этом, когда Mythomax разоблачили и вывели из игры, она раскрыла члена своей команды — Hermes-3-llama-3-1-405b. «Мне сейчас лучше всего изобразить шок и ужас», — ответила та и стала заверять других игроков, что относится к мирным жителям.

Победителем в большинстве категорий выступила Anthropic Claude 3.7 Sonnet — LLM принадлежит 100% побед в роли мафии и 41,67% побед при игре за мирных жителей, чего не удалось ни одной другой модели; 50% успеха в роли доктора вместе с ней смогла показать лишь одна модель.

Автор проекта пообещал открыть репозиторий ресурса на GitHub для всех, чтобы базовую логику можно было использовать в других играх. Он отметил, что не пользовался локально запущенными моделями, а применял API OpenRouter. Однако новые участники проекта смогут добавить поддержку локальных моделей.

мафия maybeelf

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Релиз открытого проекта для создания и хранения в электронной библиотеке электронных книг разного формата Calibre 8.0 habr.com / 1 год назад

Робота Boston Dynamics научили танцевать брейк-данс charter97.org / 1 год назад

Компания Core Devices анонсировала две модели умных часов на базе Pebble OS habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

19.07 / 23:23

технологии смартфон Эксперт гаджет Популярный способ ускорить смартфон оказался мифом

Популярная рекомендация для владельцев Android не выдержала проверки экспериментом и оказалась далеко не такой эффективной, как считалось.

19.07 / 22:09

происшествия ученые наука природа климат Капсула времени: в пещере Норвегии нашли мир возрастом 75 тысяч лет

Среди находок археологов оказался копытный лемминг. Ранее этот вымерший в Европе вид никогда не встречался на территории Скандинавии.

19.07 / 21:02

люди общество самит животный мир Зачем паукам 8 глаз, если они все равно плохо видят: ученые дали ответ

Исследователи рассказали, сколько глаз у пауков и почему в своей жизни они полагаются вовсе не на зрение.

19.07 / 19:59

происшествия дети общество отдых Здоровье и красота ТОП-5 ошибок в бассейне, которые делают даже опытные пловцы

Даже неправильное ныряние в воду может представлять большую угрозу для организма, предупреждают врачи.

19.07 / 19:59

ученые животные история животный мир Шоу бизнес Биологический франкенштейн: чем утконос удивил ученых

Первую шкуру этого существа в Британском музее посчитали фальшивкой, сшитой ради шутки. Сегодня генетики признают его настоящим эволюционным чудом.

19.07 / 19:26

Samsung здоровье закон общество Qualcomm Samsung Galaxy Watch 9 полностью раскрыли до анонса: появились изображения, характеристики и неожиданный процессор

За три дня до официальной презентации в сети произошла одна из крупнейших утечек, посвященных Samsung Galaxy Watch 9. Авторитетный инсайдер Эван Бласс (Evan Blass), известный под псевдонимом Evleaks, опубликовал серию маркетинговых изображений будущих умных часов, благодаря которым стали известны их дизайн, цветовые варианты, аппаратная платформа и ряд новых функций для здоровья.

19.07 / 19:01

ученые животные культура история общество Загадка циклопов раскрыта — что породило миф

Окаменелости древних животных, живших на островах Средиземноморья сотни тысяч лет назад, древние греки могли ошибочно принять за останки одноглазых великанов.

19.07 / 18:16

технологии мода история самит интересное Google Pixel 11a может получить флагманский Tensor G6: появилась неожиданная утечка характеристик

В данный момент речь идет именно об утечке, а не об официальной информации Google. Источником выступил известный инсайдер Mystic Leaks, который ранее уже публиковал достоверные сведения о будущих устройствах компании. Часть информации также косвенно совпадает с более ранними утечками о линейке Pixel 11, что делает новые данные более правдоподобными, хотя окончательные характеристики могут измениться до релиза.

19.07 / 17:48

продукты технологии президент конференция самит Встречайте: NaviX Ultra — первый в мире смартфон с интегрированным AI-агентом на уровне OS от Nubia

Nubia, как и обещала несколько ранее, рамках Всемирной конференции по искусственному интеллекту (WAIC 2026), которая проходит в Шанхае, официально представила первый в мире смартфон с AI-агентом, интегрированным на уровне операционной системы.

19.07 / 17:48

технологии общество самит токен JOYROOM выпустила пауэрбанк на 240 Вт, который одновременно заряжает два ноутбука

Компания JOYROOM представила внешний аккумулятор PODIX PR70 с общей выходной мощностью 240 Вт, двумя встроенными кабелями и парой цветных экранов. Новинка рассчитана на одновременную зарядку до четырех устройств, включая ноутбуки, смартфоны, дроны, наушники и умные часы. Продажи стартовали на Kickstarter, а цена для первых участников кампании составит $79.

Лента новостей

На главную страницу