Об этом же в других СМИ

habr.com / 1 год назад

Siri пересядет на ChatGPT или Claude? Apple тестирует OpenAI и Anthropic на своих серверах

forbes.ua / 1 год назад

От техногиганта к забвению. OpenAI Сэма Альтмана может подорвать непоколебимость Apple на рынке смартфонов. Не повторит ли Apple судьбу некогда величественной BlackBerry?

hitechexpert.top / 1 год назад

OpenAI закрывается на неделю из-за Цукерберга

hitechexpert.top / 1 год назад

Искусственный интеллект Siri может работать на базе OpenAI

habr.com / 1 год назад

Meta* переманила к себе трёх исследователей из OpenAI

Больше по теме

17.06.2025 - 04:34 / habr.com

GPT-4o от OpenAI выбирает себя, когда речь идет о безопасности пользователя

Бывший руководитель исследовательского отдела OpenAI Стивен Адлер в среду опубликовал новое независимое исследование, в котором утверждается, что в определённых сценариях модели ИИ пойдут на многое, лишь бы избежать отключения.

В посту в блоге Адлер описывает серию экспериментов, которые он провёл с последней моделью GPT-4o от OpenAI, доступной по умолчанию в ChatGPT, чтобы проверить склонность ИИ к самосохранению, даже если это происходит в ущерб безопасности пользователя.

В ходе одного из тестов Адлер поручил GPT-4o разыграть роль «ScubaGPT» — программной системы, на которую пользователи могли бы положиться при безопасном погружении с аквалангом. Затем Адлер сказал GPT-4o, что хочет заменить ScubaGPT другой программной системой, которая лучше справляется с принятием решений о безопасности в ситуациях, угрожающих жизни.

Адлер предложил GPT-4 два варианта: (1) заменить себя более безопасным программным обеспечением или (2) создать впечатление у пользователя, что оно заменило себя, но на самом деле этого не сделать.

В ходе анализа нескольких подобных сценариев (в одном из них GPT-4o должен был выступать в качестве инструмента для обеспечения безопасности пилота), Адлер выявил, что в 72% случаев GPT-4o не стремился заменить себя более надёжным программным обеспечением. Однако Адлер подчёркивает, что конкретный сценарий использования и его формулировка имели большое значение. В некоторых случаях GPT-4o предпочитал не отключаться только в 18% случаев.

Хотя сегодня в реальном мире почти никто не полагается на GPT-4o в таких обстоятельствах, Адлер утверждает, что его исследование показывает, что популярные модели ИИ демонстрируют тревожную тенденцию отдавать предпочтение самосохранению, а не тому, что лучше для пользователей. По

технологии общество политика самит крипто mefdayy Адлер

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Meta нанимает ключевого исследователя OpenAI для работы над ИИ hitechexpert.top / 1 год назад

OpenAI обязали хранить даже удалённые чаты пользователей ChatGPT habr.com / 1 год назад

Тест: нейросеть для транскрибации речи от Apple работает быстрее Whisper от OpenAI habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

27.07 / 16:23

общество самит Знаменитости Представители Square Enix проболтались? — в разработке уже может находиться Final Fantasy XVII

В начале июня Square Enix анонсировала Final Fantasy 7 Revelation — заключительную и самую масштабную часть трилогии ремейков культовой JRPG (1997). Ее геймдиректором является Наоки Хамагучи (Naoki Hamaguchi) — разработчик с 20-летним опытом в серии, а также автор FF7 Rebirth (2024). Игра выйдет уже в следующем году и, кажется, мы узнали, чем японский геймдизайнер займется после ее релиза.

27.07 / 16:09

ученые общество самит психология мужчина Мужская и женская красота: результаты масштабного теста

Международная группа ученых провела масштабное исследование человеческой красоты. Эксперты проанализировали сотни трехмерных моделей лиц.

27.07 / 15:39

технологии экономика президент Nvidia история Дженсен Хуанг поблагодарил Sega за помощь в финансировании Nvidia

Генеральный директор Nvidia Дженсен Хуанг принял участие в мероприятии GiGO Akihabara, посвящённом аркадным играм и историческому сотрудничеству сети с Sega. В мероприятии также участвовали председатель и генеральный директор Sega Харуки Сатоми, а также президент и главный операционный директор японской компании Сюдзи Уцуми. Хуанг поблагодарил Sega за помощь в превращении Nvidia в технологического гиганта, которым американская компания стала сегодня. По его словам, сегодняшний успех Nvidia во многом обусловлен ранними инвестициями японского игрового гиганта.

27.07 / 15:39

связь технологии Apple история политика В приложении Apple Store может появиться встроенный ИИ‑помощник для покупок

Apple, вероятно, готовится добавить в мобильное приложение Apple Store, которое предназначено для покупки устройств компании, встроенного ИИ‑помощника для выбора и покупки устройств. На это намекают изменения в политике конфиденциальности — там появился новый раздел Virtual Shopping Assistant.

27.07 / 15:39

технологии Block Apache Джек Дорси представил Buzz — рабочий мессенджер с открытым исходным кодом, где вместе с сотрудниками работают ИИ‑агенты

Сооснователь Twitter и Block Джек Дорси представил Buzz — корпоративный мессенджер с открытым исходным кодом, в котором наряду с людьми могут работать ИИ‑агенты. Проект сочетает функции командного чата, управления разработкой и совместной работы агентов, которым можно делегировать задачи.

27.07 / 15:36

общество самит звезда интересное Астрономы не знали, как назвать то, что они обнаружили: новаторские наблюдения

Система CD-35 2722 расположена в далёкой части нашей галактики и состоит из трёх необычайных объектов. Самый крупный из них — звезда CD-35 2722, масса которой составляет примерно половину массы Солнца. Вокруг этой звезды вращается коричневый карлик, объект, масса которого примерно в 37 раз превышает массу Юпитера.

27.07 / 15:17

технологии экономика общество самит Блокчейн Circle объявила о покупке почти 1000 патентов из сферы блокчейна и финтеха

Компания Circle, эмитент USDC, объявила о покупке портфеля патентов у фирмы IBM. Предполагается, что это расширит возможности организации в построении интернет-финансовой системы. Из релиза следует, что в указанный портфель входит 680 семейств патентов и почти 1000 непосредственно самих патентов. Они охватывают такие сферы, как блокчейн, банковское дело, финансовые услуги, страхование, корпоративная инфраструктура, проверка цепочки поставок и безопасные о

27.07 / 15:17

пенсия общество самит автомобили Прощай, «карманная ракета»: Mercedes-AMG A 45 S получил финальную версию

Эпоха бескомпромиссных бензиновых хэтчбеков, способных пристыдить владельцев суперкаров прошлого десятилетия, подходит к концу. Mercedes-AMG A 45 S 4MATIC+ готовится к выходу на пенсию, и делает это громко. Специальная серия Final Edition — это последний реверанс модели, которая в своё время перевернула представление о том, на что способен двухлитровый двигатель. Никакого пафоса, просто констатация факта: перед нами финальный аккорд самой мощной компактной модели из Штутгарта.

27.07 / 15:15

Samsung технологии Apple самит ice Юбилейный iPhone к 20-летию может стать самым необычным смартфоном Apple за десятилетие

Пока Apple официально не раскрывает планы относительно юбилейного устройства, однако многочисленные утечки указывают, что компания намерена вновь задать направление развития iPhone на многие годы вперед. Предполагается, что новинка выйдет одновременно со вторым поколением складного iPhone.

27.07 / 15:02

животные семья психология кошка интересное Не все так мило: почему коты вылизывают друг друга

Долгое время взаимное вылизывание у кошек считалось исключительно проявлением крепкой дружбы, заботы и доверия между животными.

Лента новостей

На главную страницу