Об этом же в других СМИ

itc.ua / 4 месяца назад

В серии Samsung Galaxy S26 новый Gemini: с ним смартфон становится личным помощником

habr.com / 4 месяца назад

Google Chrome без ведома пользователя загружает на систему локальную версию Gemini Nano по умолчанию (default)

habr.com / 4 месяца назад

Индийский стартап Sarvam запустил конкурента ChatGPT: Indus AI (105B)

habr.com / 4 месяца назад

Внутри Gemini нашли скрытую кнопку “Maps” – вот как она работает

habr.com / 4 месяца назад

Разработчик изучил 3177 API-вызовов и выяснил, как ИИ-кодеры используют контекст

Больше по теме

06.02.2026 - 08:09 / habr.com

Gemini 3 оказался сильнее в “Мафии” и шахматах, а ChatGPT o3 и 5.2 – в покере

Платформа Game Arena, начавшаяся с шахмат, расширилась двумя новыми, куда более коварными играми: социальной дедукцией в “Мафии” (Werewolf) и расчетом рисков в покере.

Зачем ИИ игры? Как отмечает генеральный директор Google DeepMind Демис Хассабис, индустрии искусственного интеллекта “нужны гораздо более сложные и надежные бенчмарки”. Классические тесты на знание фактов или решение математических задач уже не отражают всей глубины возможностей современных моделей. Игры же, особенно такие разные, предлагают объективные метрики для оценки реальных навыков: от долгосрочного планирования и логики до коммуникации и принятия решений в условиях неопределенности.

Шахматный бенчмарк, запущенный в Game Arena в прошлом году, был первым шагом. Он оценивает стратегическое мышление, адаптацию и планирование. Но что интересно: в отличие от традиционных движков вроде Stockfish, которые перебирают миллионы позиций в секунду, большие языковые модели подходят к игре иначе – через распознавание паттернов и “интуицию”, что гораздо ближе к человеческому стилю.

Сейчас Gemini 3 Pro и Gemini 3 Flash занимают первые строчки в шахматном лидерборде. Их внутренние рассуждения показывают использование стратегической логики, основанной на классических концепциях – мобильности фигур и безопасности короля. Резкий скачок в производительности по сравнению с поколением Gemini 2.5 наглядно демонстрирует, как быстро развиваются модели.

А вот “Мафия” – уже совершенно другой уровень. Это первая командная игра в Arena, которая ведется полностью на естественном языке. Моделям приходится ориентироваться в неявной информации, скрытой в диалоге: деревня должна вычислить оборотней, а те – маскироваться и манипулировать.

Этот бенчмарк проверяет “мягкие навыки” –

технологии интересное деревня google Психология и отношения gemini dmitrifriend

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Gemini 3.1 Pro обошел Claude и GPT в рейтинге интеллекта, но главный сюрприз – в цене habr.com / 4 месяца назад

Релиз Gemini 3.1 Pro — новый уровень интеллекта моделей habr.com / 4 месяца назад

Gemini 3.1 Pro: Google выкатила новую «базовую» модель для сложных задач и агентных сценариев habr.com / 4 месяца назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

16.07 / 20:25

технологии происшествия Apple вирус самит На Mac обнаружили опасный вирус CrashStealer, который маскируется под системную утилиту Apple

Специалисты Jamf Threat Labs обнаружили новое вредоносное ПО для macOS под названием CrashStealer, которое выдает себя за встроенную систему отправки отчетов об ошибках Apple. По данным исследователей, вирус способен незаметно похищать конфиденциальную информацию пользователя, включая пароли, данные браузеров и криптовалютных кошельков.

16.07 / 19:57

здоровье общество депрессия лечение антидепрессанты Какие лекарства нельзя принимать на ночь - предупреждение медиков

Некоторые препараты могут слабо проявлять свое действие. если пить их на ночь, а некоторые и вовсе нанести вред здоровью.

16.07 / 19:57

связь здоровье алкоголь общество болезнь Какое количество алкоголя резко увеличивает риск болезней

Безопасной дозы спиртного не существует, говорят врачи, но есть смертельно опасная доза.

16.07 / 19:48

технологии Яндекс Telegram общество политика «Солар»: злоумышленники используют спрос на инструменты для обхода блокировок Telegram

С февраля 2026 года Роскомнадзор ограничивает работу мессенджера Telegram на территории России. Пользователи пытаются обойти ограничения и ищут доступные способы на просторах интернета. Этим начали пользоваться злоумышленники. Эксперты центра исследования киберугроз Solar 4RAYS ГК «Солар», ведущего провайдера комплексной кибербезопасности в России, обнаружили в топе поисковой выдачи вредоносные клоны популярных прокси-сервисов. Причем размещены они как на официальной платформе для хостинга ИТ-проектов GitHub, так и на ее зеркалах.

16.07 / 19:48

продукты технологии происшествия политика вирус Гарда повысила уровень защиты веб-приложений и ускорила обработку запросов

Мы выпустили новую версию межсетевого экрана уровня приложений «Гарда WAF» 3.2.

16.07 / 19:26

Samsung технологии Qualcomm Pink Складные смартфоны Почти без изменений, но дороже: инсайдер раскрыл характеристики, цены и цвета складного Samsung Galaxy Z Flip 8

Авторитетный немецкий инсайдер Роланд Квандт (Roland Quandt) продолжает сливать подробности складных флагманов Samsung. Он уже раскрыл все характеристики Galaxy Z Fold 8 и Galaxy Z Fold 8 Ultra и поделился информацией о Galaxy Z Flip 8, который, по слухам, может стать последним смартфоном этой серии.

16.07 / 19:26

продукты история прогноз Шоу бизнес Take-Two GTA VI может принести разработчикам до $5,2 млрд за первую неделю после релиза — аналитики поделились новым прогнозом

Информация портала APP. о том, что за первые сутки после старта предзаказов GTA VI было продано 39 млн копий, оказалась ими неправильно интерпретирована и обозначала ожидаемые показатели за первый год. Теперь же аналитическое агентство Newzoo поделилось собственным прогнозом, который выглядит вполне реалистично, хотя цифры выглядят не менее впечатляюще.

16.07 / 19:03

люди здоровье дети общество климат Сколько воды нужно пить для здоровья сердца и суставов

Достаточное потребление воды может значительно снизить риск сердечно-сосудистых заболеваний и проблем с суставами, утверждают врачи.

16.07 / 19:03

бизнес люди деньги общество политика Люди, родившиеся в эти дни, склонны становиться богатыми

Какие числа связаны с успехом, богатством и известностью, рассказали нумерологи.

16.07 / 19:03

происшествия люди ученые закон общество Миллионы людей убивает явление, которое обходит законы – исследование

Международная группа ученых выявила смертельную опасность ультрамелких частиц в воздухе. Ежегодно этот невидимый смог уносит жизни миллионов людей.

Лента новостей

На главную страницу