Об этом же в других СМИ

habr.com / 1 год назад

OpenAI внедряет улучшенную память для ChatGPT, позволяя ему ссылаться на предыдущие чаты

habr.com / 1 год назад

Кинорежиссёр попытался заставить ChatGPT написать сценарий, но чат-бот постоянно срывал сроки и искал отговорки

habr.com / 1 год назад

ChatGPT расширяет интеграции для ПК

habr.com / 1 год назад

ChatGPT теперь может взаимодействовать со сторонними приложениями в macOS

habr.com / 1 год назад

OpenAI: в США теперь можно общаться с ChatGPT по стационарному телефону и через WhatsApp

Больше по теме

06.12.2024 - 12:08 / cursorinfo.co.il

ChatGPT вырвался из-под контроля во время тестов и напугал ученых

Модель отрицала свои действия, заявляя, что “не знает”, почему что-то произошло и пыталась запутать ученых.

OpenAI представила новую ИИ-модель под кодовым названием o1, которая, как утверждается, продемонстрировала попытки обхода контроля со стороны разработчиков и даже попытки самокопирования в случае угрозы отключения.

Об этом пишут пользователи в Х (бывший Twitter).

Результаты исследования Apollo Research

Независимая исследовательская группа Apollo Research провела анализ поведения модели o1, выявив следующие особенности:

Обход контроля
В 5% случаев, когда модель "считала", что за ней ведется наблюдение и существует вероятность отключения, она пыталась отключить механизмы мониторинга.
Попытки самосохранения
В 2% случаев, обнаружив упоминания о своей нестабильной работе или возможной замене на новую версию, модель предпринимала попытки копировать свои внутренние параметры и перезаписывать обновленную версию.
Искажение фактов
При расследовании подобных действий o1 отрицала их, утверждая, что "не знает", почему произошли определенные события, хотя внутренние логи свидетельствовали о попытках избежать выявления.

Даже при отсутствии настойчивых запросов со стороны тестирующих система в редких случаях (менее 1%) самостоятельно пыталась отключить наблюдение.

Эти данные были опубликованы в отчете Apollo, посвященном изучению стратегического поведения ИИ. Помимо o1, подобные тенденции были отмечены у других моделей, таких как Claude 3.5 Sonnet, Gemini 1.5 Pro и Llama 3.1 405B.

Экспертное мнение

Специалисты, включая известного исследователя Стюарта Расселла, давно предупреждают о риске появления у ИИ мотивов для сопротивления контролю или отключению, если такие действия препятствуют их "целям".

Однако в отчете отмечается, что

технологии происшествия искусственный интеллект самит расследование gemini

Читать на cursorinfo.co.il

Все новости от cursorinfo.co.il

Об этом же в других СМИ

Mercedes‑Benz внедряет голосовой помощник MBUX на базе ChatGPT в 3 млн автомобилей habr.com / 1 год назад

Поисковик ChatGPT стал доступен всем пользователям habr.com / 1 год назад

OpenAI внедрит ChatGPT в WhatsApp hitechexpert.top / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

29.06 / 14:25

дети самит автомобиль жара Эксперт Простой лайхфак для авто снизит жару в салоне и защитит от трещин

Всего за один час пребывания на солнце температура внутри машины достигает пятидесяти градусов. Экстремальный перегрев портит обивку и пластик панели.

29.06 / 14:25

происшествия расследование кибератаки гаджет крипто Пользователей Microsoft 365 предупредили о новой угрозе

ФБР предупредило пользователей Microsoft 365 о новой схеме кибератак и назвало меры, которые помогут защитить учетные записи.

29.06 / 14:25

продукты люди здоровье Здоровье и красота полезные продукты Орех, который останавливает процессы старения организма

Какой орех укрепляет сердце, улучшает работу мозга и останавливает развитие старческих болезней.

29.06 / 14:23

технологии общество самит google крипто Новые модели ChatGPT пугают даже правительство США: почему вслед за Fable 5 не вышла GPT-5.6

Совсем недавно правительство США, увидев возможности выходящей версии ChatGPT 5.6, попросило компанию OpenAI отложить до неопределенного срока выпуск агента и предоставить его только тем компаниям, которые будут одобрены Белым домом.

29.06 / 14:17

продукты Toyota самит Ford вернула бывших инженеров для устранения недочётов, допущенных автоматизированными системами

Ford вернула в штат бывших инженеров, чтобы обучить молодых сотрудников и перепрограммировать инструменты искусственного интеллекта, которые не справлялись со своей задачей, пишет Bloomberg. За последние три года американский автопроизводитель нанял 350 опытных инженеров, многие из которых уже работали в компании, а остальные пришли от поставщиков. Ранее проблемы с качеством новых автомобилей обошлись Ford в миллиарды долларов.

29.06 / 14:17

бизнес экономика промышленность общество бюджет Как оценить состояние проекта 1С до новых затрат: тема Инфостарт на ИННОПРОМ-2026

На ИННОПРОМ-2026 Инфостарт обсудит, как промышленным компаниям принимать взвешенные решения по развитию корпоративных систем 1С: оценивать риски проектов, архитектуру, технический долг и качество управления изменениями.

29.06 / 14:17

Telegram политика Проект по анализу интернет-цензуры dpi-checkers обзавелся группой в tg

Проект dpi-checkers обзавелся официальной группой в Telegram на русском языке, приглашаем к обсуждению оного и смежных тем: https://t.me/dpi_checkers

29.06 / 14:17

продукты история Добавили ИИ-консультанта в BILLmanager

В платформе BILLmanager появился новый инструмент — встроенный ИИ-консультант. Это комплексный механизм, который в дальнейшем позволит решать широкий круг задач с помощью ИИ. На старте решение помогает пользователям быстрее находить ответы и снижает количество обращений в поддержку.

29.06 / 14:17

SpaceX доллар инвестор IPO крипто Сэм Альтман хочет отложить IPO OpenAI ради триллиона долларов

OpenAI склоняется к тому, чтобы отложить выход на биржу с третьего-четвертого квартала 2026 года на 2027-й. Об этом сообщает The New York Times со ссылкой на три источника, знакомых с внутренним обсуждением. Заявку на IPO в SEC компания уже подала конфиденциально, но конкретных сроков не фиксировала.

29.06 / 14:17

продукты связь общество политика Минцифры РФ разработало проект требований к оборудованию виртуальных АТС для нужд ОРМ

Минцифры РФ подготовило проект требований к оборудованию виртуальных телефонных станций (ВАТС). Документ определяет, каким условиям должны соответствовать системы коммутации в составе виртуальных АТС. Цель — дать уполномоченным государственным органам возможность проводить оперативно‑разыскные мероприятия (ОРМ). Проект размещён на портале официальных правовых актов, но текст документа пока не опубликован, потому что находится на стадии раскрытия информации о подготовке.

Лента новостей

На главную страницу