Об этом же в других СМИ

cursorinfo.co.il / 10 месяцев назад

Неочевидный фактор, влияющий на работу сердца, назвали ученые

cursorinfo.co.il / 10 месяцев назад

Новый секрет замедления старения раскрыли ученые

cursorinfo.co.il / 10 месяцев назад

Новое открытие о жизни рыб совершили ученые

cursorinfo.co.il / 10 месяцев назад

Замедляют старение в любом возрасте: ученые назвали 5 полезнейших продуктов

cursorinfo.co.il / 10 месяцев назад

Необычного "убийцу" акул в океане обнаружили ученые (ВИДЕО)

Больше по теме

12.08.2025 - 12:35 / incrypted.com

Ученые назвали способность ИИ-моделей к рассуждениям «хрупкой иллюзией»

Исследователи из Университета Аризоны заявили, что модели с «цепочкой мыслей» не обладают истинными навыками обобщенных рассуждений.
Эксперименты показали, что при малейшем отклонении от обучающих данных точность таких моделей резко падает.
Ученые предупреждают, что нельзя приравнивать работу LLM к человеческому мышлению, особенно в критически важных областях.

Исследование Университета Аризоны поставило под сомнение реальную способность ИИ-моделей рассуждений к логическим выводам. Авторы работы отмечают, что такие проекты чаще воспроизводят знакомые шаблоны, чем формируют осмысленные умозаключения.

Чтобы проверить это, исследователи создали тестовую среду DataAlchemy. В ней небольшие LLM обучали простым текстовым преобразованиям, включая ROT-шифр и циклические сдвиги. Затем ИИ просили комбинировать их в новых последовательностях, которых не было в обучающем наборе.

Результаты показали, что при столкновении с незнакомыми комбинациями функций модели часто давали либо правильный ответ с неправильным «обоснованием», либо наоборот — верные рассуждения, но неверный результат. Даже незначительные изменения формата задачи, например, длины текста или символов, приводили к резкому снижению точности.

Надеюсь, что ИИ не сделает нас полностью бесполезными: соучредитель NEAR о развитии искусственного интеллекта 03.10.2024 25 мин 2854 читать

Ученые подчеркнули, что добавление в тренировку небольшой доли релевантных данных через контролируемую донастройку (SFT) действительно улучшает показатели. Однако это не решает главную проблему — отсутствие у LLM способности к абстрактному мышлению. Такой подход они назвали «заплаткой», а не фундаментальным решением.

По их словам, цепочки мыслей в нынешнем виде являются «структурированным

медицина финансы Pavel Kot шт. Аризона

Читать на incrypted.com

Все новости от incrypted.com

Об этом же в других СМИ

Признаки того, что вы будете жить 100 и больше лет - пять ключевых факторов назвали ученые cursorinfo.co.il / 10 месяцев назад

Возраст счастья резко изменился - ученые бьют тревогу cursorinfo.co.il / 10 месяцев назад

Группу крови с самым слабым иммунитетом назвали ученые cursorinfo.co.il / 10 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

10.07 / 13:24

продукты здоровье общество курение полезные продукты Какие продукты могут помочь бросить курить без мучений

Эксперты рассказали, как и какие продукты могут облегчить отказ от сигарет.

10.07 / 13:21

Huawei Nvidia история финансирование дефицит DeepSeek тайно собирает команду для собственного чипа — вслед за OpenAI и Anthropic

DeepSeek, год назад взорвавший рынок своей R1-моделью, начал разработку собственного чипа для инференса. Проект запущен около года назад, но только сейчас стал достоянием общественности. Чип будет заточен исключительно под вывод — генерацию ответов для пользователей, а не под ресурсоёмкое обучение моделей.

10.07 / 13:21

экономика деньги курс мода и стиль крипто JetBrains протестировали скилл Caveman: обещанные 65% экономии токенов превратились в 8.5%

Caveman — скилл для агентов вроде Claude Code, который переводит текстовые ответы в рубленый «пещерный» стиль без служебных слов. Код и вызовы инструментов не трогает. Целых 85 тысяч звёзд на GitHub.

10.07 / 13:21

дети общество досуг пляж кулинария ИИ-чат в «Яндекс Картах» научили помогать пользователям находить подходящие места для культурного и активного отдыха

В сервис «Яндекс Карты» разработчики добавили возможность для пользователей в ИИ-чате находить подходящие места для культурного и активного отдыха.

10.07 / 13:21

технологии экономика google Google планирует увеличить минимальный объём встроенной памяти и повысить стоимость смартфонов серии Pixel 11

Google повысит цены на грядущую серию смартфонов Pixel 11, а также откажется от варианта со 128 ГБ постоянной памяти, сообщил инсайдер billbil-kun с сайта Dealabs. Релиз линейки должен состояться в августе этого года.

10.07 / 13:13

технологии экономика HMD представила бюджетный смартфон Arc 2 с новым процессором и ценой от $68

Главным обновлением смартфона стал процессор. Вместо Unisoc SC9863A теперь используется более новый Unisoc T603, выполненный по 12-нм техпроцессу. Чип работает на частоте до 1,8 ГГц и ориентирован на устройства начального уровня.

10.07 / 13:09

медицина технологии наука история общество Впервые в истории гуманоидные роботы провели хирургическую операцию

Врачи успешно провели две операции с использованием дистанционно управляемых человекоподобных роботов — впервые в истории. Доклинические испытания, подтверждающие работоспособность метода, включали удаление желчного пузыря у крупных млекопитающих, не относящихся к приматам. Одну процедуру выполнил человекоподобный робот и сопровождающий его человек, а вторую — пара гуманоидов.

10.07 / 13:06

технологии общество мода и стиль Nubia представила игровой смартфон Neo 5 GT Special Edition с жидкостным и воздушным охлаждением

Бренд Nubia анонсировала смартфон Neo 5 GT Special Edition, ориентированный на мобильных геймеров. Главной особенностью устройства стала необычная система охлаждения AquaCore, которая объединяет сразу два способа отвода тепла — жидкостное и воздушное охлаждение.

10.07 / 12:52

происшествия пожар наука история общество В Румынии обнаружили римский форт в возрасте 1800 лет: как выглядел (фото)

Археологи при раскопках в Румынии обнаружили остатки одного из ключевых сооружений древнеримского форта Рекари, который, вероятно, был уничтожен масштабным пожаром почти 1800 лет назад во время вторжения готов. О находке сообщила мэр города Крайова Лия Олгуца Василеску, ссылаясь на результаты исследований, проведенных археологами Музея Олтении.

10.07 / 12:39

технологии смартфон гаджет Что делать, если смартфон стал медленно работать

Многие пользователи выбирают не тот способ, пытаясь вернуть смартфону прежнюю скорость работы.

Лента новостей

На главную страницу