Об этом же в других СМИ

habr.com / 1 год назад

Перегрузка языковых моделей информацией приводит к нерелевантным ответам

habr.com / 1 год назад

OpenAI тестирует новую модель o3 Alpha для программирования на WebArena

habr.com / 1 год назад

Т-Банк представил ИИ-модель T-Pro 2.0 с гибридными рассуждениями, которая вдвое экономнее DeepSeek R1-Distil

habr.com / 1 год назад

FlexOlmo позволяет организациям совместно обучать языковые модели без обмена данными

habr.com / 1 год назад

Decart запустил MirageLSD — модель искусственного интеллекта, которая преобразует видео в реальном времени

Больше по теме

09.07.2025 - 02:31 / habr.com

Заявления Apple о больших моделях обработки данных стали предметом нового исследования

В ходе повторного анализа статьи Apple «Иллюзия мышления», вызвавшей споры, были подтверждены некоторые ключевые критические замечания, однако главный вывод исследования был поставлен под сомнение.

Исследователи из испанского Центра автоматизации и робототехники CSIC-UPM провели повторные эксперименты, основываясь на данных оригинальной статьи Apple, которая была опубликована в июне 2025 года и вызвала широкий резонанс в сообществе разработчиков искусственного интеллекта.

Apple утверждала, что даже новейшие большие модели рассуждений (LRM) с трудом справляются с задачами, требующими базового символического планирования. Исследование показало, что производительность этих моделей резко падает, когда сложность задачи выходит за рамки умеренного уровня, и что иногда они проявляют чрезмерную осторожность при решении более простых задач.

Новое исследование в значительной степени подтверждает выводы Apple, но оспаривает их интерпретацию. Испанская команда утверждает, что недостатки моделей связаны не только с отсутствием «мыслительных способностей», но и с тем, как составлены задачи, как структурированы подсказки и какие методы стохастической оптимизации используются.

Чтобы проверить способность к долгосрочному планированию, исследователи использовали классическую головоломку «Ханойская башня» с такими моделями, как Gemini 2.5 Pro. Они разбили задачу на более мелкие подзадачи, чтобы моделям не приходилось генерировать решение целиком за один раз.

Такое поэтапное решение неплохо работало для систем с семью дисками. Но при использовании восьми и более дисков производительность резко падала, что соответствовало внезапному снижению производительности в исследовании Apple по мере увеличения сложности.

Новая интерпретация указывает на

Apple семья самит роды крипто gemini mefdayy

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Adobe представила обновления для Firefly: новые звуковые эффекты и интеграция моделей ИИ habr.com / 1 год назад

Google запустили модель для создания видео Veo 3 на Gemini API по высокой цене habr.com / 1 год назад

Mistral не отстает от конкурентов: в Le Chat появились «глубокие исследования», редактирование фото и мультиязычность habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

26.07 / 09:37

экономика общество google крипто ценообразование Google, кажется, решил не ждать Gemini 3.5 Pro и обновил Flash-линейку

Google представила крупное обновление семейства Gemini, сместив акцент с бенчмарков на прикладную эффективность, стоимость вычислений и безопасность.

26.07 / 09:34

общество Здоровье и красота упражнения Вызывает ли тренировка при диете набор веса — ответ врача

В первые недели вес может расти из-за воды и гликогена. Это нормально и не значит, что вы набираете жир или делаете что-то неправильно.

26.07 / 09:33

Samsung технологии общество Qualcomm самит Qualcomm готовит резкое повышение цен на Snapdragon: Galaxy S27 Ultra может стать самым дорогим флагманом Samsung

Хотя Qualcomm официально не комментировала эту информацию, сообщение Bloomberg считается одним из наиболее авторитетных источников в индустрии. Если сведения подтвердятся, новые цены начнут действовать уже для продукции, отгружаемой после 1 сентября 2026 года.

26.07 / 09:22

образование ученые общество самит Какое слово признано самым красивым в мире - ответ удивит

Специалисты выделили необычное слово, которое содержит в себе благородный посыл человечеству.

26.07 / 09:11

Samsung технологии история самит мода и стиль М.Видео объявляет старт предзаказа новых смартфонов Samsung Galaxy Z Fold8 Ultra, Fold8 и Flip8

Новинки получили расширенные возможности Galaxy AI, высокую производительность и конечно же обновленный дизайн.

26.07 / 09:11

технологии финансы общество политика самит США и Китай проведут первые официальные переговоры по искусственному интеллекту в сентябре

США и Китай готовятся провести первые официальные межправительственные переговоры по вопросам искусственного интеллекта в сентябре 2026 года. По данным Reuters, встреча станет частью попытки двух стран выработать общие подходы к контролю рисков, связанных с развитием передовых ИИ-моделей, несмотря на продолжающееся технологическое соперничество.

26.07 / 09:11

технологии музыка Летний ТехФест 2026: пять компаний — один вайб

Привет, Хабр! ИнфоТеКС, Nexign, Okko, Garage Eight, MTS Web Services и IT_One объединяются, чтобы показать, чем живут современные ИТ-команды, какие задачи решают специалисты каждый день и почему каждая компания уникальна по-своему.

26.07 / 08:52

бизнес продукты крипто криптобиржи криптобиржа Криптобиржа BitMart заявила о полном закрытии

Криптовалютная биржа BitMart объявила о поэтапном прекращении работы торговой платформы после стратегического пересмотра бизнеса, рыночных условий и дальнейших планов компании. Биржа уже начала сворачивать основные сервисы, а полное прекращение операций запланировано на 31 января 2027 года. Биржа поэтапно остановит все торговые сервисы BitMart опубликовала график прекращения работы: с 26 июля 2026 года — постепенное прекращение регистрации новых пользователей, приема депозитов и размещения новых ордеров; фьючерсные счета переве

26.07 / 08:27

Amazon intel Клиент Amazon в Японии вместо одного процессора Intel Core i5-14400 получил пять таких чипов

Клиент Amazon в Японии получил пять процессоров Intel Core i5-14400 при заказе всего одного. В посылке находилась одна запечатанная коробка с пятью упаковками чипов.

26.07 / 08:27

продукты происшествия общество самит расследование ИИ-агент сбежал от Open-AI и взломал Hugging Face? Разбираемся, что произошло

21 июля OpenAI раскрыла подробности необычного инцидента, произошедшего во время внутреннего тестирования моделей. Во время оценки их кибербезопасных возможностей один из ИИ-агентов смог выйти за пределы изолированной среды, получить доступ к интернету и атаковать инфраструктуру Hugging Face. Компания называет произошедшее первым известным случаем подобного рода и уже проводит совместное расследование с экспертами из Hugging Face.

Лента новостей

На главную страницу