Об этом же в других СМИ

habr.com / 1 год назад

Google Deepmind представляет новые модели AI для управления роботами

habr.com / 1 год назад

Google добавляет собственную генерацию изображений в языковые модели Gemini

habr.com / 1 год назад

Четыре поведенческие стратегии для улучшения рассуждающих языковых моделей

habr.com / 1 год назад

Foxconn запустила собственную большую языковую модель

Больше по теме

26.02.2025 - 11:20 / habr.com

Языковые модели могут перегружать себя мыслями и застревать в бесконечных циклах мыслей

Новое исследование выявило неожиданную слабость языковых моделей: они могут зацикливаться на мышлении вместо действия, особенно в интерактивных средах. Эта тенденция к чрезмерному размышлению может значительно повредить их производительности, даже несмотря на то, что эти модели специально разработаны для рассуждений. Исследователи из нескольких университетов США и ETH Zurich разработали методы для измерения и решения этой проблемы в интерактивных сценариях, называемых «агентными задачами».

В этих задачах модели AI должны самостоятельно преследовать цели, использовать интерфейсы на естественном языке и производить структурированные результаты для работы с другими инструментами. Модели должны собирать, хранить и действовать на основе информации автономно.

Исследовательская группа выявила то, что они называют «дилеммой рассуждения-действия». Модели AI должны постоянно балансировать между прямым взаимодействием с окружающей средой для получения обратной связи и внутренним моделированием для рассмотрения возможных действий и последствий.

Исследователи обнаружили, что даже при неограниченной вычислительной мощности модели искусственного интеллекта, которые слишком много думают, все равно принимают плохие решения. Это происходит из-за того, что модели не полностью понимают мир, что приводит к ошибкам, которые со временем усугубляются.

Они создали систематический способ измерения избыточного мышления с использованием двух ключевых фреймворков: бенчмарка по программной инженерии "SWE-bench Verified" и фреймворка "OpenHands Framework" для моделирования интерактивных сред. Они использовали большое контекстное окно Claude 3.5 Sonnet на 200 000 токенов для анализа примерно 4 000 процессов взаимодействия, оценивая избыточное мышление по

связь интересное крипто ETH dilnaz04 США

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Новый метод подсказок повышает точность и проверяемость ответов языковых моделей habr.com / 1 год назад

Amazon планирует новую модель рассуждений, чтобы конкурировать с OpenAI и Anthropic habr.com / 1 год назад

Тест BIG-Bench Extra Hard: как он выявляет недостатки в больших языковых моделях habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

16.07 / 07:04

Amazon общество visa mastercard google Linux Foundation запустила организацию x402 для развития стандарта интернет-платежей между ИИ-агентами

Некоммерческая организация Linux Foundation объявила о начале работы x402 Foundation. Это новый орган открытого управления, созданный для руководства протоколом x402. Одновременно криптобиржа Coinbase завершила передачу протокола новому фонду. В пресс-релизе отмечается, что x402 интегрирует платежные функции непосредственно во взаимодействие HTTP, позволяя искусственному интеллекту, API и приложениям автоматически осуществлять и получать платежи так же просто, как они обмениваются данными. Как новый протокол для интернет-платежей x402 может изменить Web3-экономику? 27.10.2025 Читать Протокол поддерживает карты и стейблкоины В Linux Foundation заявили, что x402 должен стать открытым стандартом для интернет-платежей без привязки

16.07 / 07:04

экономика общество самит финансирование капитал DeepSeek превратил основателя в самого богатого создателя ИИ в мире

Основатель китайского ИИ-стартапа DeepSeek Лян Вэньфэн стал самым богатым в мире предпринимателем среди создателей моделей искусственного интеллекта после завершения раунда финансирования на $7,4 млрд в июне 2026 года. По оценке Bloomberg Billionaires Index, его состояние выросло до $36 млрд, что позволило обогнать сооснователя OpenAI Грега Брокмана и сооснователя Anthropic Дарио Амодеи. DeepSeek увеличил оценку в пять раз По данным Bloomberg, оценка DeepSeek после июньского инвести

16.07 / 07:04

президент общество законопроект каникулы сенат Трамп встретится с сенаторами по поводу положений об этике в CLARITY Act

Президент США Дональд Трамп проведет встречу с группой сенаторов касательно положений об этике в законопроекте о структуре крипторынка (CLARITY). Об этом заявил республиканец Берни Морено в интервью Politico. Отметим, в числе первых о встрече сообщило издание CoinDesk. Это также подтвердила президентка организации Solana Policy Institute Кристин Смит в комментарии для The Block. По ее словам, цель собрания заключается в том, чтобы предложить Трампу несколько вариантов компромисса по этим положениям и получить его одобрение. Смит считает,

16.07 / 06:35

люди общество самит психология профессор Пять правил, которые меняют жизнь, назвал профессор Стэнфорда

Умение следовать личным ценностям защищает человека от рискованных и глупых сделок. Честность формирует репутацию, которая работает на вас годами.

16.07 / 06:33

Дом и интерьер Чем заменить домен MS AD: Samba или FreeIPA? Сильные и слабые стороны каждого из решений

Когда стоит задача заменить MS AD, перед командой почти всегда возникает дилемма: Samba или FreeIPA? Обе востребованы, у каждой свои сильные стороны, свои ограничения и свои подводные камни, о которых редко пишут в документации.

16.07 / 06:08

связь технологии смартфон Эксперт гаджет Почему смартфоны лишились съемных аккумуляторов – основные причины

Производители смартфонов отказались от съемных аккумуляторов в пользу более тонкого дизайна.

16.07 / 06:04

reddit Valve выпустит обновление для повышения порога температуры, вызывающего «красную полосу смерти» в Steam Machine

Valve сообщила о планах выпустить обновление BIOS компактного компьютера Steam Machine, которое увеличит порог срабатывания на температуру, приводящий к появлению «красной полосы смерти» (Red Line of Death, RLOD).

16.07 / 05:38

люди общество самит отношения психология Как не испортить первое свидание – шесть вещей, которые все меняют

Желание произвести идеальное впечатление часто мешает людям трезво оценить партнера. Эксперты призвали сместить фокус внимания на личные интересы.

16.07 / 05:37

пожар деньги наука история общество Во Франции нашли клад с монетами 3 века: как выглядел (фото)

Археологи во французском городе Сенон обнаружили уникальное сокровище времен Римской империи. Во время раскопок они обнаружили три керамических сосуда, заполненные бронзовыми и медными монетами III века нашей эры.

16.07 / 05:25

происшествия политика самит крипто Добавили ИИ-ассистента в Kubernetes-платформу: управление кластером на человеческом языке и планы на встроенную LLM

Привет, Хабр! Мы активно работаем над упрощением эксплуатации Deckhouse Kubernetes Platform (DKP). Недавно рассказывали, что полное управление платформой через веб-интерфейс стало доступно в бесплатной редакции DKP. Сегодня делаем следующий шаг — встраиваем туда ИИ-ассистента, так что попробовать его может любой и без коммерческой лицензии.

Лента новостей

На главную страницу