Об этом же в других СМИ

habr.com / 6 месяцев назад

OpenAI представила GPT‑5.2 — новую версию ведущей языковой модели с улучшенной логикой и скоростью

habr.com / 6 месяцев назад

Новый бенчмарк показывает, что даже лучшие ИИ‑модели плохо справляются с правдой

habr.com / 7 месяцев назад

Anthropic объяснила, почему не устраивает авралы из за релизов конкурентов

habr.com / 7 месяцев назад

Anthropic подписала $200 млн сделку с Snowflake — её ИИ‑модели станут доступны тысячам компаний

habr.com / 7 месяцев назад

OpenAI представила технику Confessions которая учит модели честно сообщать о собственных ошибках

Больше по теме

28.11.2025 - 12:02 / habr.com

Учёные раскрыли слабые места ИИ: почему модели всё ещё не думают как люди

Команда учёных провела масштабный анализ 171 485 «трасс рассуждений» (reasoning traces) от 17 открытых моделей ИИ, а также сравнила их с набором из 54 решений, сделанных людьми - от математики и задач по проверке ошибок до сложных политических и медицинских дилемм.

В результате выяснилось, что на структурированных задачах (например, классические математические примеры) ИИ использует относительно разнообразные умственные приёмы - комбинирует простые понятия, разбивает проблему на части, проверяет шаг за шагом. Но как только задача становится неоднозначной, открытой или требует абстрактного мышления - модели резко начинают использовать линейные, пошаговые вычисления, простые проверки правдоподобия и перестают проявлять гибкость.

У людей же в таких ситуациях доминирует метакогнитивный подход. Они меняют стратегии, используют абстракции, строят причинно‑следственные цепочки, пересматривают промежуточные шаги, настроены на самоанализ и адаптацию. Именно такие глубокие паттерны коррелируют с успешным решением сложных задач.

Учёные считают, что нынешние методы тестирования ИИ, когда оценивают только итоговый ответ, дают ложное впечатление о настоящем мышлении моделей. Новый фреймворк с 28 когнитивными компонентами показывает: ИИ всё ещё часто просто подбирает знакомые шаблоны, а не настоящим образом рассуждает.

Интересно, что при специальной подсказке, когда системе дают структуру: сначала собрать факты, потом структурировать, потом сделать вывод - сильные модели (например, Qwen‑, Llama‑ и Qwen‑Distill‑семейства) иногда прибавляют в точности до +60 % на задачах с открытым контекстом, но слабые модели часто падают в производительности.

Авторы подчёркивают, что мы всё ещё далеко от того, чтобы ИИ рассуждал так, как человек. Но

технологии люди общество интересное крипто cognitronn

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

AWS открывает путь к корпоративному ИИ: создавайте свои модели на облаке habr.com / 7 месяцев назад

OpenAI и Google раскрыли, как ИИ меняет правила выхода на рынок habr.com / 7 месяцев назад

Как Google собирается создать AGI: интервью с главным архитектором DeepMind habr.com / 7 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

11.07 / 18:38

ученые здоровье общество самит человек Как узнать биологический возраст своего организма - ответ ученых

Специалисты рассказали, почему возраст по паспорту не всегда отражает реальное состояние организма человека.

11.07 / 18:16

связь люди общество прогноз интересное Три знака Зодиака, которых в этом июле ждут большие изменения

Астрологи считают, что в ближайшее время для представителей трех знаков зодиака может начаться период важных жизненных изменений.

11.07 / 17:52

люди семья политика выплаты самит ИИ нашел критический баг в шифровании Cloudflare — любой ключ открывал все

Аудиторская компания zkSecurity направила свой ИИ-пайплайн на CIRCL — экспериментальную криптографическую библиотеку Cloudflare. Результат: семь подтвержденных багов, все уже исправлены, за большинство компания получила выплаты по баунти-программе Cloudflare. Разбор находок zkSecurity опубликовала 7 июля — и самое интересное в нем не сами баги, а то, как повели себя нашедшие их модели.

11.07 / 17:52

экономика закон общество законодательство самит В Европе появился конкурент ChatGPT: новый AI-чат хранит данные только в пределах ЕС

Главная особенность платформы — обработка и хранение пользовательской информации исключительно на территории Европейского союза с соблюдением требований европейского законодательства о защите персональных данных.

11.07 / 17:51

медицина люди общество самит Эксперт Зубы мудрости – почему они больше не нужны человеку

То, что в древности считалось признаком пришедшей мудрости, сегодня для большинства людей оборачивается лишь болезненным визитом к стоматологу.

11.07 / 17:51

происшествия экономика ученые климат прогноз Когда на Земле исчезнет последнее растение — исследование

Новое исследование показало, что растительная жизнь на Земле исчезнет значительно позже прежних прогнозов.

11.07 / 17:51

продукты здоровье общество женщина болезнь Что женщины 50+ должны делать вечером для улучшения здоровья

Эксперты назвали шесть легких привычек для улучшения здоровья женщин, которые будут полезны для всех.

11.07 / 17:13

NASA интересное Для фанатов космоса: LEGO анонсировала новый набор, который позволит собрать телескоп Hubble Space Telescope

Космический телескоп Hubble, запущенный в 1990 году, внес неоценимый вклад в исследование вселенной и ее понимание. LEGO решила почтить этот важный для науки объект и выпустила второй тематический набор. Напомним, первый конструктор вышел в 2021 году и был значительно меньше.

11.07 / 16:49

люди здоровье общество самит Здоровье и красота В жару отекают ноги - как быстро облегчить состояние, рассказал врач

Часто люди в случае появления отечности пьют меньше воды, что является распространенной ошибкой.

11.07 / 16:49

продукты связь вода Здоровье и красота болезнь Как употребление газированной воды влияет на ваши почки

Урологи рассказали, есть ли фактическая связь между газированной водой и камнями в почках, или это просто миф.

Лента новостей

На главную страницу