Об этом же в других СМИ

habr.com / 1 год назад

Исследование Anthropic: AI-модели скрывают свои настоящие мыслительные процессы даже при пошаговых объяснениях

habr.com / 1 год назад

Эксплуатация модели o3 от OpenAI может оказаться более затратной, чем предполагалось изначально

habr.com / 1 год назад

Anthropic запускает новый план для университетов и колледжей

habr.com / 1 год назад

OpenAI планирует выпустить новую открытую языковую модель AI в ближайшие месяцы

habr.com / 1 год назад

Исследование Anthropic: ИИ умеет планировать и сознательно врать

Больше по теме

23.03.2025 - 13:00 / incrypted.com

ИИ-модель от Anthropic на протяжении месяца не может «победить» игру Pokémon

Claude 3.7 Sonnet научился планировать, но застревает на простых задачах.
ИИ не справляется с навигацией в 2D-мире и ошибается в запоминании данных.
Улучшение визуального восприятия и расширение контекста могут повысить эффективность.

В феврале 2025 гоода в рамках тестирования возможностей ИИ компания Anthropic запустила проект Claude Plays Pokémon. В рамках этой инициативы их последняя модель Claude 3.7 Sonnet управляет персонажем в классической игре для Game Boy. Более месяца ИИ пытается пройти игру, но пока не в состоянии «победить» покемонов, отмечают эксперты ArsTechnica.

Разработчики утверждают, что новая модель лучше планирует, запоминает цели и адаптируется к изменениям в игре. Однако, несмотря на заметный прогресс, Claude все еще испытывает трудности: он может застревать в тупиках, бесполезно взаимодействовать с NPC или многократно совершать одни и те же ошибки.

Одним из главных вызовов стало восприятие визуальной информации. Claude 3.7 Sonnet использует текстовое понимание Pokémon и считывает игровые данные напрямую из памяти, но его способности интерпретировать пиксельные изображения ограничены.

Что такое машинное обучение? Все, что вам нужно знать 07.10.2023 37 мин 6349 читать

По словам разработчика проекта Дэвида Херши, ИИ лучше распознавал бы элементы в игре с более реалистичной графикой. Навигация также остается проблемой. Claude не всегда понимает, что здание непроходимо, и может часами упираться в стену.

Еще одна сложность связана с памятью. Контекстное окно модели ограничено 200 000 токенами, и при его заполнении ИИ пытается суммировать накопленные знания, что иногда приводит к потере важных деталей.

Более того, если модель делает ошибку, она может надолго зациклиться на ложных данных, например,

самит крипто Pavel Kot

Читать на incrypted.com

Все новости от incrypted.com

Об этом же в других СМИ

TOKEN2049 Dubai показала рекордный спрос на билеты за месяц до старта конференции incrypted.com / 1 год назад

«AI-микроскоп» от Anthropic показывает, как Claude обрабатывает информацию и рассуждает habr.com / 1 год назад

OpenAI использует стандарт конкурирующей компании Anthropic для подключения моделей AI к данным habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

15.07 / 10:10

Huawei золото роды мода и стиль Дом и интерьер Honor Life: фонарик, который светит дальше, чем планы на выходные

Бренд Honor, который когда-то был лишь «младшим братом» Huawei, давно превратился в самостоятельного игрока, стремящегося поместить свой логотип в каждый угол вашего дома. На этот раз компания решила, что нам не хватает света, и представила многофункциональный фонарик Honor Life. Это устройство для тех, кто ценит универсальность больше, чем профессиональную оптику за сотни долларов.

15.07 / 10:10

технологии история Qualcomm самит motorola Motorola представила новый флагман — Edge 70 Max с яркостью 7000 нит, рекордной для бренда батареей и чипом Snapdragon 8 Gen 5

Motorola официально презентовала в Индии новый премиальный смартфон Motorola Edge 70 Max, который получил самый емкий аккумулятор в истории бренда и флагманскую аппаратную платформу. В актуальной линейке новинка расположилась между моделями Edge 70 Pro+ и Edge 70 Signature.

15.07 / 10:08

технологии доллар google WhatsApp тестирует собственное облачное хранилище для резервных копий на iPhone

Обнаружить нововведение удалось специалистам WABetaInfo в бета-версии WhatsApp 26.28.10.16 для iOS.

15.07 / 09:49

ibm Apache крипто Вышло обновление Debian 13.6

11 июля 2026 года вышел в релиз Debian 13.6 на базе ядра Linux 6.12 LTS (а также GNOME 48, KDE Plasma 6.3.6, Xfce 4.20, Cinnamon 6.4.10, LXQt 2.1, MATE 1.26.1 и LXDE 13). Популярный дистрибутив доступен для многих официально поддерживаемых архитектур, включая AMD64/x86-64, ARM EABI (armel), ARM64, ARMv7 (armhf), mipsel, mips64el, RISC‑V, PowerPC 64 (ppc64el) и IBM System z (s390x).

15.07 / 09:49

погода происшествия ураган прогноз энергетика Модель Aurora 1.5 от Microsoft позволит улучшить прогнозы ураганов

Компания Microsoft выпустила крупное обновление для своей базовой модели системы Земли с открытым доступом — Aurora 1.5. В новой версии добавлены 22 метеорологические переменные, важные для энергетики, сельского хозяйства, транспорта и оценки климатических рисков.

15.07 / 09:47

нефть промышленность Toyota бокс BMW Двигатели внутреннего сгорания ещё поборются: BMW и Toyota тестируют «зелёный» бензин

Пока чиновники в Брюсселе рисуют графики полной отказа от двигателей внутреннего сгорания, автомобильные гиганты пытаются найти способ сохранить то, что мы так любим — привычные заправки и грохот поршней. BMW Group, Toyota Motor Europe, Bosch и Repsol объединились в Испании, чтобы доказать: классический двигатель может быть экологичным без каких-либо технических переделок.

15.07 / 09:47

продукты история Sony playstation мода и стиль Контроллер PlayStation FlexStrike задержится: Sony перенесла выход гаджета из-за непредвиденных трудностей

Sony сообщила неприятную новость для любителей файтингов: специализированный беспроводной контроллер FlexStrike не выйдет в запланированные сроки. Устройство должно было поступить в продажу 6 августа — одновременно с релизом файтинга Marvel Tōkon: Fighting Souls, но теперь его перенесли на неопределенный срок.

15.07 / 09:27

технологии смартфоны BMW мода и стиль Дом и интерьер Пятое поколение BMW X5: ИИ, 5 моторов и зарядка за 22 минуты

Компания BMW представила новое, пятое поколение популярного кроссовера X5, который получил масштабное обновление в рамках перехода бренда к дизайну Neue Klasse.

15.07 / 09:23

самит совет интересное лайфхак гаджет Как ускорить работу любого телевизора: есть простой трюк

Современные "умные" телевизоры могут терять прежнюю скорость работы и всё чаще демонстрируют задержки при запуске программ. Особенно досадно, когда операционная система начинает давать сбои или бесконечно загружать видео прямо посреди запланированного кино-вечера.

15.07 / 09:22

Amazon общество visa mastercard google Linux Foundation запустила организацию x402 для развития стандарта интернет-платежей между ИИ-агентами

Некоммерческая организация Linux Foundation объявила о начале работы x402 Foundation. Это новый орган открытого управления, созданный для руководства протоколом x402. Одновременно криптобиржа Coinbase завершила передачу протокола новому фонду. В пресс-релизе отмечается, что x402 интегрирует платежные функции непосредственно во взаимодействие HTTP, позволяя искусственному интеллекту, API и приложениям автоматически осуществлять и получать платежи так же просто, как они обмениваются данными. Как новый протокол для интернет-платежей x402 может изменить Web3-экономику? 27.10.2025 Читать Протокол поддерживает карты и стейблкоины В Linux Foundation заявили, что x402 должен стать открытым стандартом для интернет-платежей без привязки

Лента новостей

На главную страницу