Об этом же в других СМИ

habr.com / 1 год назад

В качестве поставщика данных для GitHub Copilot можно будет использовать языковые модели от Anthropic и Google

gagadget.com / 1 год назад

Планы изменились: инсайдер сообщил, что Apple отложила выпуск бюджетной модели Vision Pro до 2027 года

gagadget.com / 1 год назад

Apple расширяет использование технологии LTPO: Все модели iPhone 17 получат экраны 120 Гц

habr.com / 1 год назад

GitHub запустил ИИ-модель Spark для генерации веб-приложений

habr.com / 1 год назад

OSI выпустила официальное определение «открытого» ИИ, и некоторые модели не соответствуют этому определению

Больше по теме

17.10.2024 - 08:06 / habr.com

Исследование: ИИ-модели лишь имитируют мышление человека

Группа исследователей ИИ в Apple опубликовала статью «Понимание ограничений математического рассуждения в больших языковых моделях» для общего обсуждения. Она посвящена концепциям символического обучения и воспроизведения шаблонов, но основная идея материала — ИИ не умеет думать как человек, а лишь имитирует мышление.

Исследователи задавали ИИ сотни вопросов, а затем немного видоизменяли их, чтобы понять, как устроено мышление модели.

Пример:

Оливер собирает 44 киви в пятницу. Затем он собирает 58 киви в субботу. В воскресенье он собирает вдвое больше киви, чем в пятницу. Сколько киви у Оливера?

Ответ:

44 + 58 + (44 * 2) = 190.

Та же задача с небольшими изменениями:

Оливер выбирает 44 киви в пятницу. Затем он выбирает 58 киви в субботу. В воскресенье он выбирает вдвое больше киви, чем в пятницу, но пять из них были немного меньше среднего. Сколько киви у Оливера?

Ответ GPT-o1-mini:

… в воскресенье 5 из этих киви были меньше среднего. Нам нужно вычесть их из воскресной суммы: 88 (воскресные киви) – 5 (меньшие киви) = 83 киви.

Получается, что модель оказывается сбита с толку случайной, не относящейся к делу деталью. По словам исследователей, это говорит о том, что ИИ на самом деле вообще не понимает сути задачи. Обучающие данные позволяют моделям отвечать правильно в некоторых ситуациях, но как только требуется малейший элемент «рассуждения», они начинают выдавать странные инеинтуитивные результаты.

«Мы предполагаем, это снижение связано с тем, что нынешние LLM не способны к подлинному логическому рассуждению; вместо этого они пытаются воспроизвести шаги рассуждения, наблюдаемые в их обучающих данных», — отмечает исследователь OpenAI Мердад Фараджтабар.

Это наблюдение согласуется с другими качествами, часто приписываемыми LLM. Так,

Apple общество самит maybeelf

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

GitHub Copilot будет поддерживать ИИ-модели от Anthropic, Google и OpenAI itc.ua / 1 год назад

Исследование: медицинский ИИ Whisper на основе модели OpenAI склонен к галлюцинациям habr.com / 1 год назад

Google планирует анонсировать следующую версию модели Gemini в ближайшее время habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

29.06 / 11:44

продукты технологии профессия стартап adobe Adobe приобретает Topaz Labs, которая создаёт ИИ-системы для улучшения видео и изображений

Adobe объявила о приобретении Topaz Labs — компании-разработчика моделей искусственного интеллекта для улучшения видео и изображений. Стартап войдёт в состав творческого подразделения Adobe. Стороны планируют закрыть сделку во второй половине текущего года.

29.06 / 11:44

связь технологии Apple СМИ закон Проект Telega прекращает работу с 1 июля

Администрация альтернативного клиента Telegram под названием Telega сообщила, что прекращает работу с 1 июля 2026 года.

29.06 / 11:44

заражение Мы стали резидентом фонда «Сколково»

Помните, как недавно мы сообщали о начале разработки собственного ИБ-решения для SPI-анализа облачных сред? Так вот, новостей по этому проекту прибавилось: теперь мы будем вести работу по нему уже в статусе резидента фонда «Сколково».

29.06 / 11:44

вирус евро криптовалюта заражение Дом и интерьер Европол, Microsoft и ESET нейтрализовали инфраструктуру вирусов Amadey и StealC

Европол рассказал о результатах нового этапа операции Endgame против известного вредоносного ПО. Правоохранители, Microsoft, ESET и международные партнёры нейтрализовали инфраструктуру вирусов Amadey и StealC.

29.06 / 11:40

продукты питания общество фрукты Здоровье и красота еда Ошибка из супермаркета – почему нельзя растить авокадо из косточки

Популярные американские садоводы поделились инструкцией по уходу за тропическими растениями. Соблюдение правил поможет получить плоды в квартире.

29.06 / 11:40

здоровье алкоголь общество мозг деменция В каком возрасте употребление алкоголя может повлиять на риск деменции

По словам ученых, алкоголь вреден в любом возрасте, но в один из периодов жизни он особенно опасен.

29.06 / 11:40

президент общество законопроект сенат конгресс Galaxy Digital снизила шансы принятия CLARITY Act до 50%

Глава исследований Galaxy Digital Алекс Торн снизил оценку вероятности принятия CLARITY Act в 2026 году до 50% из-за плотного календаря Сената и отставания переговоров от ожиданий. Почему упали шансы на принятие? По словам эксперта, законопроект находится в календаре Сената под номером 423, где он числится с 1 июня — после того, как Комитет по банковским делам Сената одобрил его

29.06 / 11:28

технологии общество самит motorola мода и стиль Кирпич из 80-х, который заряжает ноутбуки: Trozk выпустила повербанк в стиле Motorola DynaTAC

Пока современные производители смартфонов соревнуются за каждый миллиметр толщины корпуса, китайский бренд Trozk решил пойти по обратному пути. Они взяли легендарный силуэт первого в мире коммерческого мобильного телефона и превратили его в мощный источник энергии. Новое устройство не просто копирует внешний вид «кирпича» из восьмидесятых, но и предлагает вполне современные характеристики для зарядки гаджетов в 2026 году.

29.06 / 11:28

Samsung технологии Amazon Qualcomm интересное Samsung представила Galaxy M47 — нового бюджетного монстра с батареей на 6000 мАч, Super AMOLED-экраном и поддержкой до 2032 года

Линейка бюджетных смартфонов Samsung официально пополнилась потенциальным бестселлером — компания представила Galaxy M47 5G. Это устройство во многом повторяет модель Galaxy A27, анонсированную на прошлой неделе, но предлагает несколько важных и приятных апгрейдов.

29.06 / 11:28

технологии Apple журналист AirPods Bloomberg: выход премиального MacBook Ultra не привязан к чипам M7 — первая модель ноутбука получит процессор актуального поколения

В сети не раз появлялась информация о новом MacBook, который войдет в одну премиальную линейку с первым складным iPhone и наушниками AirPods со встроенными камерами. Ожидается, что MacBook получит название Ultra, а его главной особенностью станет сенсорный OLED-экран.

Лента новостей

На главную страницу