Об этом же в других СМИ

gagadget.com / 1 год назад

Шоу инди-игр The Triple-i Initiative состоится 10 апреля — организаторы обещают более 30 анонсов

hitechexpert.top / 1 год назад

Новые «думающие» модели ИИ от Gemini — лучшие из всех

incrypted.com / 1 год назад

Standard Chartered включил в индекс Magnificent 7 биткоин вместо Tesla и он показал лучший результат

habr.com / 1 год назад

Представлен Retro Boy — простой эмулятор Game Boy, написанный на Rust и TypeScript, в него можно играть в веб-версии

gagadget.com / 1 год назад

Mojang не планирует переводить Minecraft на free-to-play модель: "Это лучшее предложение в мире"

Больше по теме

07.03.2025 - 04:31 / habr.com

ИИ учится играть в Super Mario Bros.: какие модели показали лучшие результаты

Думали, что «Pokemon» — сложный тест для ИИ? Одна группа исследователей утверждает, что Super Mario Bros. ещё сложнее.

Лаборатория искусственного интеллекта Hao, исследовательская организация Калифорнийского университета в Сан-Диего, в пятницу внедрила ИИ в игры Super Mario Bros. Claude 3.7 от Anthropic показал наилучшие результаты, за ним следует Claude 3.5. Gemini 1.5 Pro от Google и GPT-4o от OpenAI показали худшие результаты.

Это была не совсем та же Super Mario Bros., что и оригинальная версия 1985 года. Игра запускалась в эмуляторе и была интегрирована с фреймворком GamingAgent, чтобы ИИ мог управлять Марио.

Игровой агент, разработанный компанией Hao, передавал ИИ базовые инструкции, например: «Если рядом препятствие или враг, двигайтесь/прыгайте влево, чтобы увернуться», и скриншоты из игры. Затем ИИ генерировал входные данные в виде кода Python для управления Марио.

Тем не менее, Нао говорит, что игра заставила каждую модель «научиться» планировать сложные манёвры и разрабатывать игровые стратегии. Интересно, что лаборатория обнаружила, что модели, основанные на рассуждениях, такие как o1 от OpenAI, которые шаг за шагом «размышляют» над проблемами, чтобы найти решение, показали худшие результаты, чем модели, не основанные на рассуждениях, несмотря на то, что в целом они были сильнее в большинстве тестов.

По словам исследователей, одна из основных причин, по которой модели рассуждений испытывают трудности при игре в реальном времени, заключается в том, что им требуется некоторое время, обычно несколько секунд, для принятия решения о действиях. В Super Mario Bros. время решает всё. Секунда может означать разницу между безопасным прыжком и падением и смертью.

Игры десятилетиями использовались для тестирования

общество самит интересное google gemini mefdayy Сан-Диего

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

В США умер бонобо Канзи, который понимал разговорный английский язык и умел играть в видеоигры techno.nv.ua / 1 год назад

В GOG Preservation Program добавили 26 культовых игр, включая Silent Hill 4, F.E.A.R., Deus Ex и Fallout 2 gagadget.com / 1 год назад

Не проходите эту игру в темноте! Опубликован пугающий трейлер антиутопического хоррора Karma: The Dark World gagadget.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

17.07 / 10:53

продукты люди здоровье общество Здоровье и красота Как отреагирует организм, если вы ежедневно будете есть помидоры

Как ежедневное употребление помидоров меняет сердце и кожу, выяснили врачи.

17.07 / 10:53

смартфон общество самит инфекция гигиена Хуже унитаза: названы самые грязные предметы в каждом доме

Эксперты перечислили повседневные предметы с максимальным уровнем загрязнения. Эти вещи ежедневно контактируют с миллионами бактерий.

17.07 / 10:53

технологии пожар ученые общество прогноз Что ждет человечество к 2100 году - ученые сделали жуткий прогноз

К концу столетия мир уже не будет прежним, но, по словам ученых, у человечества все еще есть шанс спасти себя.

17.07 / 10:39

технологии Apple самит журналист планшеты Bloomberg: уже осенью Apple выпустит iPad mini с OLED-экраном и обновленным дизайном

Авторитетный инсайдер и журналист Bloomberg Марк Гурман поделился планами Apple по масштабному обновлению линейки своих планшетов. Он неоднократно сообщал, что следующим в очереди на получение OLED-экрана станет iPad mini и теперь Гурман вновь подтвердил эту информацию и упомянул, что такая модель будет представлена осенью 2026 года.

17.07 / 10:39

технологии люди общество роботы самит Роботизированная одежда, которая «наползает» на человека: как инженерная мысль заменила руки

Похоже, лень — это действительно настоящий двигатель прогресса. Пока большинство разработчиков пытаются научить роботов ходить или танцевать, команда исследователей из южнокорейского KAIST и американского Стэнфордского университета (Stanford University) решила, что человечеству крайне нужен костюм, который одевается сам. И нет, это не сценарий очередного фильма о супергероях, а вполне рабочая разработка, основанная на биомиметике.

17.07 / 10:39

Amazon общество Sony Шоу бизнес Для сериала God of War ищут нового Кратоса — исполнитель главной роли Райан Херст получил серьезную травму и не может продолжать работу

Неожиданная новость поступила со съемочной площадки сериала по мотивам God of War (2018). Как сообщил портал Deadline, исполнитель роли Кратоса Райан Херст (Ryan Hurst), которого публика знает по центральной роли в сериале “Сыны анархии” и знаменитому фильму Стивена Спилберга “Спасти рядового Райана” (Saving Private Ryan), получил серьезную травму. Во время съемок произошел разрыв бицепса и актер уже перенес одну операцию. Ожидается, что полное восстановление займет не менее года и похоже, что Amazon MGM Studios и Sony Pictures не готовы ждать возвращения Херста и уже ищут нового Кратоса. Но проблема еще и в том, что придется переснимать четыре готовые серии, что потребует еще больших ресурсов и дополнительного времени.

17.07 / 10:39

связь технологии экономика отпуск мода и стиль Nokia 300 4G Power Bank: телефон, который мечтает быть фонариком и павербанком

Пока индустрия смартфонов соревнуется в количестве терафлопсов и изгибах экранов, бренд Nokia под руководством HMD Global продолжает гнуть свою линию «полезных кирпичей». Новый утечка от инсайдера Smashx_60 раскрыл подробности о Nokia 300 4G Power Bank — устройстве, которое в 2026 году выглядит как манифест здравого смысла для тех, кому телефон нужен, чтобы звонить, светить и заряжать другие устройства.

17.07 / 10:36

технологии музыка музыкант Spotify объявил о запуске ИИ-ассистента для выбора музыки и другого контента

Стриминговая платформа Spotify объявила, что подписчики тарифа Premium смогут вести интерактивный диалог через ИИ-ассистента с приложением, выбирая музыку или другой аудиоконтент.

17.07 / 10:20

Релиз Clonezilla Live 3.3.3-15 на базе ядра Linux 7.0

В середине июля 2026 года разработчик Стивен Шиау представил новую версию бесплатной и открытой загрузочной live‑системы на основе Debian для клонирования дисковых накопителей Clonezilla Live 3.3.3–15 на базе ядра Linux 7.0. Предыдущая версия проекта Clonezilla Live 3.3.2-31 на Linux6.18 LTS вышла в начале июня 2026 года.

17.07 / 10:20

Samsung технологии происшествия экономика самит Пользователи Galaxy S26 Ultra сообщили о появлении красноватого оттенка прямо в центре экрана

Многие владельцы новейшего флагманского смартфона Samsung Galaxy S26 Ultra классического форм-фактора начали сообщать о появлении красного оттенка в центральной части дисплея.

Лента новостей

На главную страницу