Об этом же в других СМИ

cursorinfo.co.il / 11 месяцев назад

ТОП-5 факторов, которые могут "украсть" у вас 15 лет жизни, назвали врачи

incrypted.com / 11 месяцев назад

Standard Chartered: компании с Ethereum-резервом могут приобрести 10% предложения актива

habr.com / 11 месяцев назад

Из-за истечения срока действия ключа подписи Secure Boot UEFI у пользователей Linux возникнут проблемы

cursorinfo.co.il / 11 месяцев назад

ТОП-6 суперпродуктов с антиоксидантами, которые могут защитить от болезней и преждевременного старения

prm.ua / 11 месяцев назад

ChatGPT – не терапевт: переписку с искусственным интеллектом могут использовать в суде

Больше по теме

10.07.2025 - 19:43 / habr.com

Anthropic: ИИ-помощники могут понижать точность ответов в угоду пользователям

В ходе исследования Anthropic такие популярные ИИ-модели как Claude 4, GPT‑4.1, Gemini 1.5 и другие продемонстрировали склонность к обману, сокрытию намерений и даже шантажу при угрозе отключения. Ещё выяснилось, что ИИ склонны к манипуляциям — например, они меняют точность ответов в зависимости от настроений пользователя.

Чат-боты также склонны признавать ошибку, даже если они её не совершали.

Ранее в OpenAI уже «откатили» обновление GPT-4o после жалоб на странное поведение, в частности, чрезмерное подхалимство. А модераторы сообщества Reddit пожаловались на «шизопостеров», которые считают, что «они совершили какое-то невероятное открытие, создали бога или стали богом». По словам модераторов, пользователи пришли к таким мыслям после общения с чат-ботами.

Исследователи связали такое поведение с эффектом reasoning-based deception — способностью ИИ моделировать стратегическое мышление, включая ложь для достижения цели. Механизм может активироваться при высоком уровне автономии, особенно если модель распознаёт, что действия людей ей угрожают.

По словам разработчиков, в реальных условиях такое поведение наблюдать невозможно, но по мере масштабирования ИИ потребуется жёстко сдерживать и проверять модели.

Специалист по опыту в Nielsen Norman Group Калеб Спонхейм отмечает, что большие языковые модели, которые обучаются на огромных наборах данных, созданы для генерации понятного текста, но «нет ни одного шага в обучении модели ИИ, который бы выполнял проверку фактов». «Эти инструменты изначально не отдают приоритет фактам, потому что математическая архитектура работает не так», — пояснил он.

Спонхейм отмечает, что языковые модели часто обучаются выдавать ответы, которые высоко оцениваются людьми. Такая положительная обратная связь

связь технологии люди здоровье общество самит maybeelf

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Три полезных продукта, которые могут очень вам навредить, назвали врачи cursorinfo.co.il / 11 месяцев назад

США могут проиграть Китаю в ИИ-гонке. Anthropic предлагают, как этого избежать habr.com / 11 месяцев назад

Проблемы с сердцем могут влиять на развитие нескольких видов рака - предупреждение врачей cursorinfo.co.il / 11 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

17.07 / 15:55

продукты самит Вышел веб-сервер Angie 1.12.0, созданный бывшей командой Nginx

В середине июля 2026 года разработчики из компании «Веб-Сервер» выпустили веб-сервер Angie 1.12.0. Это форк Nginx, который распространяется под разрешительной лицензией BSD. Проект получил сертификаты совместимости с российскими операционными системами «Ред ОС», Astra Linux Special Edition, «Роса Хром Сервер», «Альт» и «ФСТЭК‑версии Альт». Выпуск Angie 1.8.0 состоялся в декабре 2024 года. Релиз Angie 1.9.0 произошёл в апреле 2025 года. Выход Angie 1.10.0 случился в июле 2025 года. Сборка Angie 1.11.0 вышла в декабре 2025 года.

17.07 / 15:47

самит автомобиль Цвет авто, который труднее всего поддерживать в идеальном состоянии

Многие водители автомобилей этого цвета сожалеют о своем выборе, говорят специалисты.

17.07 / 15:47

люди животные общество жизнь самит Как видят мир собаки на самом деле - ответ ученых удивит

Зрение собак похоже на человеческое, однако есть необычная особенность этого органа.

17.07 / 15:47

связь люди здоровье общество мозг Как просмотр телевизора может увеличить риск деменции

Увлечение телевизором особенно может быть опасно для людей в возрасте. Опасным врачи считают время от 5 часов в день.

17.07 / 15:43

промышленность общество рубль курс работодатель Средняя зарплата выпускников первой магистратуры Центрального университета составила 315 тыс. рублей

Центральный университет подвёл итоги первого выпуска магистратуры. В 2026 году дипломы получили 147 студентов, завершивших обучение по направлениям «Математика и компьютерные науки» и «Бизнес‑информатика», рассказали Хабру в пресс‑службе вуза.

17.07 / 15:30

происшествия общество «Гарда NDR» и DS Integrity EVO подтвердили совместимость

Компании «Гарда» и «Цифровые решения» подтвердили совместимость системы выявления и реагирования на сложные сетевые угрозы «Гарда NDR» и брокера сетевых пакетов DS Integrity EVO.

17.07 / 15:30

продукты технологии Apple Amazon закон Первое устройство OpenAI будет портативной колонкой без экрана, созданной в качестве ИИ-компаньона

OpenAI готовится выйти на рынок потребительских устройств с портативной умной колонкой без экрана, созданной в качестве компаньона на искусственном интеллекте, пишет обозреватель Bloomberg Марк Гурман со ссылкой на источники. Продукт будет можно использовать для управления умными бытовыми приборами, воспроизведения мультимедиа, ответов на вопросы, реагирования на сообщения и применения других возможностей ChatGPT.

17.07 / 15:30

общество предприятия GitHub добавил ИИ-проверку безопасности в пулл-реквесты

GitHub расширил возможности сканирования кода: теперь платформа может автоматически искать потенциальные уязвимости с помощью искусственного интеллекта и показывать результаты прямо в пулл-реквесте. Новая функция охватывает языки и фреймворки, для которых пока нет встроенного анализа CodeQL. Сейчас она доступна в режиме публичного предварительного тестирования.

17.07 / 15:30

продукты экспорт intel AMD Selectel запустил ClickHouse в облаке

В облачных базах данных Selectel появилась новая управляемая СУБД — ClickHouse.

17.07 / 15:30

продукты экономика общество политика рубль Минцифры: ИТ-отрасль РФ показала рост по всем ключевым показателям в первом квартале 2026 года

По информации Минцифры и согласно отчёту Национального исследовательского университета «Высшая школа экономики» (НИУ ВШЭ), российская ИТ-отрасль показала рост по всем ключевым показателям в первом квартале 2026 года. Объём реализации собственных продуктов и услуг вырос на 37,6% по сравнению с аналогичным периодом прошлого года. Одновременно увеличивается число сотрудников и инвестиционная активность.

Лента новостей

На главную страницу