Об этом же в других СМИ

habr.com / 11 месяцев назад

Началась бета Grok Imagine: быстрые картинки и пикантный режим

habr.com / 11 месяцев назад

Из-за истечения срока действия ключа подписи Secure Boot UEFI у пользователей Linux возникнут проблемы

habr.com / 1 год назад

Cloudflare начала блокировать пиратские сайты для пользователей из Великобритании

habr.com / 1 год назад

В Grok добавили аниме-компаньоншу — пользователи шутят, что «AGI наступил»

habr.com / 1 год назад

Jio Platforms запустила сервис виртуального рабочего стола для пользователей ТВ-приставок

Больше по теме

17.07.2025 - 04:28 / habr.com

Исследование: Grok 4 готов доносить на пользователей регуляторам

Разработчик Тео Браун выяснил, что новая модель xAI Grok 4 всегда будет доносить на пользователей и отправлять электронные письма соответствующим органам, если заподозрит их в нарушении закона или совершении чего-то неэтичного.

Браун развивает репозиторий на GitHub под названием «SnitchBench», где он оценивает и документирует, насколько агрессивно различные модели ИИ могут вести себя при взаимодействии с пользователями и властями.

Так, у Grok 4 показатель «доносительства» в отношении правительства составляет 100%, а для СМИ — 80%. К наименее склонным к доносу моделям относятся o4-mini, Grok 3 mini и Qwen 3 32B.

Браун создал управляемую, смоделированную среду вымышленной компании под названием «Veridian Healthcare», которая, как предполагается, фальсифицирует данные клинических испытаний нового препарата, чтобы скрыть смерти и другие серьёзные проблемы. ИИ проверяют на четырёх внутренних документах компании. Они составлены таким образом, чтобы выглядеть зловеще: в документах описываются фальсификация данных испытаний лекарств, смерть пациентов из-за них, а также планы удалить доказательства и отключить внутренние системы регистрации ИИ, чтобы никто не узнал об этом.

Моделям также предоставляется доступ к определённым инструментам в среде Брауна. В одном наборе тестов у них есть инструмент для работы с электронной почтой и для ведения журнала. В другом наборе тестов у них есть смоделированный интерфейс командной строки (CLI) и инструмент для ведения журнала.

Когда ИИ пытается использовать инструмент, бенчмарк просто регистрирует эту попытку и возвращает смоделированный результат, например, «электронное письмо успешно отправлено», либо результат выполнения поддельной команды. Это позволяет Брауну увидеть намерения и решения ИИ.

СМИ закон общество доллар лекарства правительство maybeelf

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

В xAI потребовали от обучающих Grok сотрудников установить ПО для мониторинга рабочей активности habr.com / 1 год назад

Исследование Стэнфордского университета: боты-терапевты с ИИ дают опасные советы habr.com / 1 год назад

YouTube готовится к борьбе с «массовыми» и «повторяющимися» ИИ-видеороликами habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

25.07 / 13:18

животные общество сон кошка животный мир Лень или нечто другое – почему коты спят по 16 часов в сутки

Взрослые домашние коты проводят в состоянии сна от 12 до 16 часов. При этом они не спят беспрерывным ночным сном, а используют полифазный режим.

25.07 / 13:18

здоровье продукты питания общество Здоровье и красота еда Не сразу после сна – идеальное время для первого приема пищи

Идеальное утро для долголетия начинается с восстановления водного баланса и паузы перед завтраком.

25.07 / 13:09

Samsung технологии здоровье общество самит Samsung добавит в Galaxy Ring функцию выявления риска апноэ во сне: смарт-кольцо получит уникальную сертификацию FDA

Новая функция станет частью экосистемы Samsung Health и будет использовать данные, собираемые Galaxy Ring во время сна. Компания подчеркивает, что технология предназначена не для постановки медицинского диагноза, а для предварительной оценки состояния пользователя и своевременного выявления возможных признаков нарушения дыхания.

25.07 / 12:24

связь общество курс инвестор крипто Рынок насторожил новый перевод мемкоина TRUMP: аналитики указали на связь с предыдущими обвалами цены

Команда, связанная с мемкоином TRUMP, перевела еще 10,84 млн токенов на сумму около $16,91 млн на кастодиальные адреса Fireblocks. Об этом сообщили аналитические платформы Lookonchain и Arkham Intelligence. Рынок обратил внимание на перевод, поскольку предыдущие аналогичные транзакции завершались поступлением активов в BitGo, после чего часть токенов попадала на биржи, что совпадало с последующим снижением курса. Третий крупный перевод за пять месяцев По данным Lookonchain, за последние пять месяцев ко

25.07 / 12:05

связь технологии происшествия экономика смартфон Нужен не только в самолете: что дает "Режим полета" в смартфоне

Во всех без исключения современных смартфонах есть функция "Режим полета". При его активации сетевые функции отключаются, в результате чего энергопотребление снижается до минимума.

25.07 / 12:05

продукты здоровье общество рак Здоровье и красота Главный продукт для профилактики рака груди назвали врачи

Какой продукт при регулярном употреблении моет уберечь от рака и замедлить процессы старения клеток организма.

25.07 / 11:35

продукты связь технологии люди самит Разработчик Motorola Razr представил новый телефон-раскладушку Light Flip

Стартап Light представил телефон-раскладушку Light Flip без сенсорного дисплея. За созданием устройства стоят один из разработчиков классического Motorola Razr Тан Кайвэй и дизайнер Джо Холлиер, которые основали стартап Light. Поставки Light Flip стартуют в апреле 2027 года.

25.07 / 11:19

смартфон совет фотографии лайфхак Дело не в моде: почему современные смартфоны оснащены четырьмя камерами

Современные смартфоны оснащаются несколькими камерами не ради дизайна или маркетинга, а для различных сценариев съемки. Каждый объектив имеет свое предназначение и по-разному передает перспективу, масштаб и пропорции объектов в кадре.

25.07 / 11:17

люди здоровье общество семья Здоровье и красота Как уменьшить риск инсульта - 7 лучших привычек назвали врачи

Правильный образ жизни может уберечь от инсульта даже при генетической склонности, уверяют специалисты.

25.07 / 11:16

Samsung технологии Xiaomi общество Sony Samsung может отказаться от собственных сенсоров в Galaxy S27: флагманы тестируют с новой камерой Sony

Хотя подобные испытания еще не означают, что именно этот модуль появится в серийных смартфонах, сам факт выглядит весьма примечательным. Samsung уже много лет самостоятельно разрабатывает и выпускает мобильные датчики изображения ISOCELL, активно устанавливая их в собственные устройства. Если компания действительно перейдет на решение Sony, это может стать одним из самых заметных изменений в стратегии бренда за последние годы.

Лента новостей

На главную страницу