Об этом же в других СМИ

habr.com / 1 год назад

Люди всё чаще обращаются к ChatGPT за новостями, тогда как популярность Google падает

habr.com / 1 год назад

Hunyuan-A13B от Tencent: языковая модель с динамическим подходом к рассуждению

habr.com / 1 год назад

ИИ Google раскрыл механизм устойчивости супербактерий за 48 часов

habr.com / 1 год назад

Заявления Apple о больших моделях обработки данных стали предметом нового исследования

habr.com / 1 год назад

Google запускает Veo 3 Fast в 159 странах, теперь пользователи Gemini Pro могут создавать видео в разрешении до 720p

Больше по теме

21.06.2025 - 06:14 / habr.com

ИИ-модель Google Gemini «запаниковала», играя в Pokémon

Google и Anthropic изучают, как их новейшие модели ИИ справляются с играми в Pokémon — результаты могут быть как забавными, так и поучительными. На этот раз Google DeepMind написал в отчёте, что Gemini 2.5 Pro впадает в панику, когда его покемоны близки к смерти. Согласно отчёту, это может привести к «качественно заметному ухудшению способности модели к рассуждению».

Тестирование ИИ — или процесс сравнения производительности различных моделей ИИ — это сомнительное дело, которое часто даёт мало информации о реальных возможностях конкретной модели. Но некоторые исследователи считают, что изучение того, как модели ИИ играют в видеоигры, может быть полезным (или, по крайней мере, забавным).

За последние несколько месяцев два разработчика, не связанные с Google и Anthropic, запустили на Twitch стримы под названием «Gemini играют в Pokémon» и «Claude играет в Pokémon», где любой желающий может в реальном времени наблюдать за тем, как ИИ пытается пройти детскую видеоигру, выпущенную более 25 лет назад.

Каждый стрим отображает процесс «рассуждений» ИИ — или перевод на естественный язык того, как ИИ оценивает задачу и приходит к ответу, — что даёт нам представление о том, как работают эти модели.

Хотя прогресс в развитии этих моделей ИИ впечатляет, они всё ещё не очень хорошо играют в Pokémon. Gemini требуется сотни часов, чтобы пройти игру, которую ребёнок мог бы пройти в разы быстрее. Интересно наблюдать за тем, как ИИ проходит игру Pokémon, не столько из-за времени прохождения, сколько из-за того, как он ведёт себя на протяжении всего пути.

«В ходе прохождения игры Gemini 2.5 Pro попадает в различные ситуации, которые заставляют модель имитировать панику», — говорится в отчёте.

Такое состояние «паники» может привести к ухудшению

технологии общество самит интересное google крипто gemini mefdayy

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Google улучшает функцию Ask Photos: поиск по фотографиям станет быстрее habr.com / 1 год назад

OpenAI начинает использовать тензорные процессоры Google для своих ИИ-продуктов habr.com / 1 год назад

Google передает протокол Agent2Agent в Linux Foundation для создания открытого стандарта ИИ-агентов habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

16.07 / 23:19

связь люди здоровье общество самит Количество кофе, которое может продлить жизнь, назвали ученые

Ученые проанализировали данные почти 450 тысяч человек и определили оптимальную ежедневную норму кофе

16.07 / 23:17

продукты Amazon экспорт Nvidia самит Google открыла k8s-aibom — контроллер Kubernetes для инвентаризации ИИ-нагрузок

Google Cloud опубликовала исходный код k8s-aibom — контроллера Kubernetes, который обнаруживает запущенные в кластере ИИ-компоненты и автоматически формирует ведомости компонентов машинного обучения в формате CycloneDX 1.6 ML-BOM. Инструмент собирает данные из фактического состояния кластера, поэтому способен находить в том числе нагрузки, которые не были зарегистрированы во внутренних системах компании.

16.07 / 22:38

технологии экономика общество В последнее время многие современные ноутбуки стали выходить без HDMI-порта

Производители ноутбуков стали чаще исключать порты HDMI из-за желания уменьшить размеры лэптопа и расширения возможностей USB-C, пишет журнал SlashGear.

16.07 / 21:57

Sony Разработчикам эмулятора KytyPS5 удалось запустить GTA V, Quake II и другие трёхмерные игры

Разработчики эмулятора PlayStation 5 KytyPS5 выпустили обновление, в котором им впервые удалось запустить GTA V, QuakeII и другие трёхмерные игры. Проекты запускаются с разной производительностью, но разработчики считают, что сейчас важно добиться максимальной совместимости.

16.07 / 20:25

технологии происшествия Apple вирус самит На Mac обнаружили опасный вирус CrashStealer, который маскируется под системную утилиту Apple

Специалисты Jamf Threat Labs обнаружили новое вредоносное ПО для macOS под названием CrashStealer, которое выдает себя за встроенную систему отправки отчетов об ошибках Apple. По данным исследователей, вирус способен незаметно похищать конфиденциальную информацию пользователя, включая пароли, данные браузеров и криптовалютных кошельков.

16.07 / 19:57

здоровье общество депрессия лечение антидепрессанты Какие лекарства нельзя принимать на ночь - предупреждение медиков

Некоторые препараты могут слабо проявлять свое действие. если пить их на ночь, а некоторые и вовсе нанести вред здоровью.

16.07 / 19:57

связь здоровье алкоголь общество болезнь Какое количество алкоголя резко увеличивает риск болезней

Безопасной дозы спиртного не существует, говорят врачи, но есть смертельно опасная доза.

16.07 / 19:48

технологии Яндекс Telegram общество политика «Солар»: злоумышленники используют спрос на инструменты для обхода блокировок Telegram

С февраля 2026 года Роскомнадзор ограничивает работу мессенджера Telegram на территории России. Пользователи пытаются обойти ограничения и ищут доступные способы на просторах интернета. Этим начали пользоваться злоумышленники. Эксперты центра исследования киберугроз Solar 4RAYS ГК «Солар», ведущего провайдера комплексной кибербезопасности в России, обнаружили в топе поисковой выдачи вредоносные клоны популярных прокси-сервисов. Причем размещены они как на официальной платформе для хостинга ИТ-проектов GitHub, так и на ее зеркалах.

16.07 / 19:48

продукты технологии происшествия политика вирус Гарда повысила уровень защиты веб-приложений и ускорила обработку запросов

Мы выпустили новую версию межсетевого экрана уровня приложений «Гарда WAF» 3.2.

16.07 / 19:26

Samsung технологии Qualcomm Pink Складные смартфоны Почти без изменений, но дороже: инсайдер раскрыл характеристики, цены и цвета складного Samsung Galaxy Z Flip 8

Авторитетный немецкий инсайдер Роланд Квандт (Roland Quandt) продолжает сливать подробности складных флагманов Samsung. Он уже раскрыл все характеристики Galaxy Z Fold 8 и Galaxy Z Fold 8 Ultra и поделился информацией о Galaxy Z Flip 8, который, по слухам, может стать последним смартфоном этой серии.

Лента новостей

На главную страницу