Об этом же в других СМИ

habr.com / 1 год назад

Anthropic расширяет присутствие на корпоративном рынке: новые ИИ-решения и инвестиции

habr.com / 1 год назад

Voxtral — новая модель распознавания речи от Mistral, которая дешевле проприетарных аналогов

habr.com / 1 год назад

Архитектура New Energy-Based Transformer призвана улучшить «системное мышление» в моделях ИИ

habr.com / 1 год назад

Google представляет MedGemma — набор моделей ИИ с открытым исходным кодом для медицинских приложений

habr.com / 1 год назад

Новый алгоритм Sakana AI позволяет большим языковым моделям работать сообща для решения сложных задач

Больше по теме

02.07.2025 - 01:45 / habr.com

Исследование Pfizer о причинах трудностей больших языковых моделей при решении задач

Новый комментарий исследователей из Pfizer ставит под сомнение основные выводы исследования «Иллюзия мышления», соавторами которого являются учёные из Apple.

В статье, написанной Apple, утверждается, что это внезапное снижение производительности указывает на фундаментальный предел возможностей машинного мышления. Другие исследования показали аналогичные результаты, но не называют это жёстким ограничением.

Команда Pfizer также не согласна с интерпретацией Apple. Они утверждают, что снижение производительности вызвано не когнитивным барьером, а искусственными условиями тестирования. Если заставлять модели работать только в текстовой среде — без таких инструментов, как интерфейсы программирования, — сложные задачи становятся намного труднее, чем необходимо. То, что кажется проблемой мышления, на самом деле является проблемой выполнения.

В оригинальном исследовании такие модели, как Claude 3.7 Sonnet-Thinking и Deepseek-R1, тестировались на текстовых головоломках — «Ханойская башня» или «Переправа через реку». По мере усложнения головоломок точность моделей резко снижалась — это явление в исследовании назвали «обрывом рассуждений».

Команда Pfizer указывает на нереалистичные ограничения теста: модели не могли использовать внешние инструменты и должны были отслеживать всё в виде обычного текста. Это не выявило ошибок в рассуждениях, но сделало практически невозможным для моделей выполнение длительных и точных шагов по решению задач.

В качестве примера исследователи из Pfizer рассмотрели модель o4-mini. Без доступа к инструментам она объявила решаемую головоломку «Переправа через реку» неразрешимой, вероятно, потому, что не могла вспомнить предыдущие шаги. Это ограничение памяти — хорошо известная проблема современных языковых

Apple самит интересное Pfizer mefdayy

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Компания Huawei опровергла обвинения в плагиате моделей ИИ habr.com / 1 год назад

Hunyuan-A13B от Tencent: языковая модель с динамическим подходом к рассуждению habr.com / 1 год назад

Заявления Apple о больших моделях обработки данных стали предметом нового исследования habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

20.07 / 23:49

люди ученые общество самит человек Что происходит с человеком после попадания молнии

Даже если человек чувствует себя нормально после удара молнии, опасные изменения в организме могут проявиться лишь спустя время.

20.07 / 22:52

Выпуск nginx 1.31.3 и nginx 1.30.4 с устранением RCE-уязвимости

15 июля 2026 года состоялся выпуск высокопроизводительного HTTP‑сервера и многопротокольного прокси‑сервера nginx 1.31.3. Исходный код проекта nginx написан на языке C и распространяется под лицензией BSD. Проект nginx 1.28.0 вышел в апреле 2025 года. Выпуск nginx 1.29 случился в июне 2025 года. Версия nginx 1.30 вышла в апреле 2026 года. Выпуск nginx 1.31 произошёл в мае 2026 года.

20.07 / 22:29

люди животные общество природа собака Миф о зрении собак разрушен – каким они видят окружающий мир

Популярный миф о монохромном зрении домашних питомцев давно опровергнут наукой. Собаки видят мир цветным, но их спектр заметно сужен.

20.07 / 22:10

технологии происшествия Apple общество вирус Новый вирус для macOS заставляет пользователей самостоятельно отдать свои пароли: под угрозой данные, криптокошельки и браузеры

По данным исследователей, атака активна как минимум с мая 2026 года и уже затронула более 100 пользователей в 33 странах. Более половины всех известных случаев заражения пришлись на Европу, что делает угрозу актуальной и для владельцев Mac в Украине.

20.07 / 20:14

погода общество отдых самит мозг Как правильно принимать душ вечером, чтобы лучше спать

Душ правильной температуры помогает расслабить мышцы и улучшить засыпание.

20.07 / 20:14

технологии люди дети искусственный интеллект общество ИИ научился обманывать: ученые рассказали, как распознать подделку

Эксперимент показал, что большинство людей не замечают подделку, пока не узнают несколько характерных особенностей.

20.07 / 20:14

Apple общество reddit MacRumors В macOS 27 обнаружили скрытый интерфейс Siri AI: Apple готовит более удобную работу с текстом

О необычной находке сообщил участник сообщества Reddit, тестирующий macOS 27. Позже информацию подтвердили и другие пользователи, которым удалось активировать скрытый интерфейс вручную. Пока Apple официально не рассказывала об этой возможности, поэтому ее появление в финальной версии системы остается под вопросом.

20.07 / 19:50

звезда Солёный огурец, маяк и трескающееся лицо: Unicode представил новые эмодзи

Накануне Всемирного дня эмодзи — 17 июля — консорциум Unicode утвердил стандарт Emoji 18.0. Новые эмодзи начнут появляться на устройствах после обновления ОС весной 2027 года.

20.07 / 19:39

технологии история общество самит автомобили McLaren F1 GTR Ника Мейсона выставили на аукцион: цена как у небольшой страны

Если у вас завалялось лишних 35 000 000$ (1 435 000 000 грн), а гараж кажется слишком пустым без легенды автоспорта, у RM Sotheby's есть интересное предложение. В августе на аукционе в Монтерее (Monterey) с молотка пойдет McLaren F1 GTR 1996 года с шасси под номером 10R. Это не просто очередной суперкар для коллекционеров, а машина с родословной, от которого у фанатов техники и рок-музыки начинает дергаться глаз.

20.07 / 19:39

steam Steam Train Fest 2026 привез кучу скидок и вагоны веселья

В Steam стартовал тематический фестиваль и в этот раз он порадует тех, кто не наигрался в железную дорогу или превратил это увлечение в полноценное хобби.

Лента новостей

На главную страницу