Об этом же в других СМИ

habr.com / 1 год назад

Square Enix закрыла iOS-версию игры Final Fantasy Crystal Chronicles из-за ошибки в системы оплаты

habr.com / 1 год назад

Исследование: четыре самых популярных чат-бота с ИИ допускают много ошибок при подготовке сводок новостей

cursorinfo.co.il / 1 год назад

Самые опасные ошибки при повседневном приготовлении блюд, которые могут стоить вам здоровья

gagadget.com / 1 год назад

Похоже, что работа над ошибками не была проведена: Ubisoft хочет выпускать больше игр с открытым миром и лайв-сервисов "год за годом"

habr.com / 1 год назад

Из-за ошибки автомобили Jeep начали выводить рекламу на мультимедийный экран после каждой остановки

Больше по теме

29.01.2025 - 15:43 / habr.com

Исследование: ошибки ИИ сильно отличаются от человеческих

Исследователи Натан Сандерс и Брюс Шнайдер опубликовали статью, посвящённую ошибкам систем искусственного интеллекта. По их словам, большие языковые модели (LLM) могут выполнять множество задач, которые выполняют и люди, но они также допускают множество ошибок. При этом их ошибки отличаются от человеческих.

Как пишут исследователи, человеческие ошибки, как правило, группируются: одна ошибка в математической задаче, скорее всего, будет сопровождаться другими. Кроме того, ошибки будут нарастать и убывать в зависимости от таких факторов, как усталость и невнимательность. Они также связаны с недостатком знаний: тот, кто совершает ошибки в математических задачах, скорее всего, не сможет ответить на вопросы, связанные с математикой.

Современные модели ИИ ошибаются иначе. Их ошибки происходят, казалось бы, случайным образом, без какой-либо группировки вокруг определённой темы, они более равномерно распределены по разным областям знаний. Модель может с одинаковой вероятностью как ошибиться в решении математической задачи, так и заявить, что капуста ест коз.

«Кажущаяся непоследовательность LLM понижает доверие к их рассуждениям в сложных многошаговых задачах. Если вы хотите использовать модель ИИ для решения бизнес-задач, недостаточно заставить её рассказать, какие факторы делают продукт прибыльным; нужно быть уверенным, что она не забудет, что такое деньги», — пишут авторы работы.

LLM также склонны повторять слова, которые чаще всего встречались в их обучающих датасетах, например, угадывать знакомые названия мест, такие как «Америка», даже если речь идёт о каком-то более экзотическом месте.

Некоторые ошибки ИИ более «человекоподобны». Например, такая проблема, как чувствительность к подсказкам: небольшие изменения в запросе к LLM

продукты люди общество AnnieBronson

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Работа над ошибками продолжается: для S.T.A.L.K.E.R. 2: Heart of Chornobyl вышло крупное обновление, которое вносит более 1700 исправлений gagadget.com / 1 год назад

Ошибку №1, мешающую избавиться от жира на животе, назвали опытные тренеры cursorinfo.co.il / 1 год назад

Магнитная буря будет держаться почти до конца недели. Будет ли она сильной telegraf.com.ua / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

14.07 / 15:26

технологии Xiaomi отпуск самит умный дом Xiaomi Mijia Smart Water Flosser Pro: теперь ирригатор умнее твоего первого смартфона

Xiaomi продолжает экспансию в вашу ванную комнату. На этот раз они решили, что обычного струи воды для гигиены недостаточно — теперь нам нужен цветной экран и мобильное приложение для чистки зубов. Новый Mijia Smart Water Flosser Pro уже появился на рынке по цене 399 юаней, что составляет приблизительно 56$ (2500 грн).

14.07 / 15:26

Samsung технологии дети общество роботы Samsung забирает награды Red Dot Award за роботов-нянек и «умные» зеркала

Пока мы пытаемся привыкнуть к тому, что искусственный интеллект теперь в каждом утюге, Samsung Electronics продолжает рисовать будущее, где ИИ будет воспитывать наших детей и критиковать состояние кожи по утрам. Компания получила восемь наград на престижном конкурсе Red Dot Award: Design Concept, доказав, что умению создавать красивые рендеры им не занимать. Две из этих наград имеют высший статус «Best of the Best».

14.07 / 15:23

происшествия туризм политика самит Знаменитости ТОП-10 мест в Лондоне, которые не любят сами британцы

Коренные жители Лондона массово игнорируют культовые городские локации. Каждый горожанин не посетил минимум три знаковых места.

14.07 / 15:14

бизнес продукты технологии экономика самит Корпоративная почта под новой защитой: SEG-T и «Солар» создают барьер от хакеров и индустрии фишинга

Ко-фаундер Secure-T Харитон Никишкин при поддержке ГК «Солар» запустил разработку нового продукта класса SEG (security email gateway) c ИИ-фильтрацией трафика и подключением решения за 15 минут в инфраструктуре клиента. Важными факторами для выхода двух компаний на рынок SEG стали снижение порога входа для атакующих корпоративные ресурсы и масштабируемые фишинговые кампании, собранные из готовых конвейеров для атак (административные панели, антибот-механизмы, инфраструктура рассылки, модули перехвата одноразовых кодов и др), ИИ, который используется для автоматизации фишинга.

14.07 / 15:14

технологии конференция история прогноз reddit В 2026 году дополнительную секунду не добавят, а с 2027-го могут разрешить отклонение до часа

Международные органы, отвечающие за измерение времени, готовятся проголосовать по предложению о том, чтобы уже в 2027 году заменить практику добавления «високосной секунды» (дополнительной секунды, которая время от времени добавляется к году для синхронизации Всемирного координированного времени (UTC) с вращением Земли) на разрешение большего расхождения — вплоть до одного часа (так называемый високосный час).

14.07 / 15:12

технологии Amazon закон самит google Опубликованы новые рендеры, характеристики и возможная цена Google Pixel 11

Речь идет о карточках товара, которые, судя по всему, были созданы заранее в качестве черновиков или заглушек перед стартом продаж. Примечательно, что они размещены самим Amazon и отображаются в разделе Google Store на площадке.

14.07 / 15:08

продукты инфляция прогноз google крипто Инфляция в США замедлилась до 3,5%. Биткоин пробил $64 000

14 июля 2026 года Бюро статистики труда США опубликовало обновленные данные по инфляции. Согласно отчету, индекс потребительских цен (CPI) в июне снизился до 3,5% в годовом выражении. Биткоин отреагировал ростом. Отметим, это первое снижение показателя с февраля 2026 года. Из релиза Бюро следует, что замедление обусловлено падением цен на энергоносители, в первую очередь на бензин. Базовый CPI без учета продуктов и энергоносителей не изменился за месяц, а в годово

14.07 / 14:55

технологии общество мужчина женщина мозг Как встретить свою половинку без сайта для знакомств – советы эксперта

Путь к гармоничным отношениям лежит не через экран смартфона, а через живое общение в кругу единомышленников.

14.07 / 14:34

продукты питания самит еда буря овощи Лайфхаки шефов: как спасти половинку авокадо от потемнения

Главной причиной быстрого потемнения плода является процесс окисления. Контакт с кислородом мгновенно разрушает аппетитный вид среза.

14.07 / 14:34

общество самит психология человек Психология и отношения Привычки, которые медленно разрушают даже крепкие отношения

Проблемы в отношениях нередко начинаются с привычек, которым большинство не придает значения.

Лента новостей

На главную страницу