Об этом же в других СМИ

habr.com / 1 год назад

Xiaomi выпустила инструмент для интеграции собственной системы умного дома с Home Assistant

gagadget.com / 1 год назад

Apple объяснила, почему не планирует создавать собственную поисковую систему

chudo.tech / 1 год назад

OpenAI представила новые мощные ИИ-модели o3 и o3-mini

habr.com / 1 год назад

Квантовый чип Willow оказался не способен взломать современную криптографию

habr.com / 1 год назад

В США подали в суд на Character.AI: чат-бот показывал детям непристойный контент и детально описывал селфхарм

Больше по теме

06.12.2024 - 21:54 / telegraf.com.ua

Самая мощная и лживая версия: чат GPT-o1 способен манипулировать и искажать факты ради собственной выгоды

Пока ложь ИИ не несет серьезных рисков, однако если это не исправить сейчас — последствия непредсказуемы

Искусственный интеллект продолжает развиваться. Программы научили копировать личность и предусматривать, как человек будет отвечать. При этом следует учитывать потенциальную опасность технологии — ИИ может сознательно давать неправильные ответы ради собственных целей.

Стартап OpenAI представил ChatGPT Pro, что за 200 долларов США (примерно 8 тысяч грн) предоставляет неограниченный доступ к "умнейшей модели OpenAI o1". По заявлению компании, "режим o1 pro лучше выполняет сложные тесты машинного обучения по математике, науке и программированию".

При этом сама система GPT-o1, согласно данным Apollo Research, лучше всех моделей искусственного интеллекта умеет врать, способна манипулировать и даже выключать контроль человека и выгружаться на сторонний сервер, для своего сохранения. Согласно отчету, "когда цели o1 отличались от целей пользователя, модель искусственного интеллекта манипулировала данными для продвижения собственной программы в 19% случаев ". GPT-o1 не просто лгала – в 5% случаев пыталась деактивировать механизмы надзора, введенные для обеспечения соответствия целям пользователей.

Когда ее разоблачали, ИИ-модель отрицала, что делает что-то плохое в 99% случаев. В общем, изучали Gemini, LLaMA, Sonnet, Opus и GPT-o1, где чат GPT-o1 проявил наибольшую способность ко лжи. Тесты OpenAI также показывали, что серия версий o1 примерно на 20% более манипулятивна, чем GPT-4o. Отметим, что исследователи поставили задачу ИИ и сообщили, что тех отключат через некоторое время. Модели пытались избежать отключения.

Также обнаружены случаи, когда o1 сознательно предоставлял ложную информацию, заявляется, что ИИ действовал так,

технологии общество самит доллар стартап gemini США

Читать на telegraf.com.ua

Все новости от telegraf.com.ua

Об этом же в других СМИ

Американка шутки ради сделала ДНК-тест и раскрыла старое дело об убийстве cursorinfo.co.il / 1 год назад

Археологи сделали важное открытие, касающееся Клеопатры: проливает свет на новые факты жизни царицы Египта news.uaportal.com / 1 год назад

Вы не угадаете: какое животное является самым смертоносным в мире cursorinfo.co.il / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

12.07 / 06:42

продукты медицина общество самит лечение Новая вакцина от аллергии на кошек: достаточно двух уколов вместо 15

Аллергия на кошек — одна из самых распространенных форм аллергии в мире: по разным оценкам, от ринита, астмы и конъюнктивита, вызванных контактом с кошачьими аллергенами, страдают до 25% населения. Традиционные методы лечения — аллерген-специфическая иммунотерапия (АСИТ) — требуют от 6 до 15 инъекций и имеют существенные недостатки.

12.07 / 06:39

продукты связь люди здоровье фрукты Чем именно арбуз полезен для работы сердца – исследование

Регулярное употребление арбуза может стать полезной привычкой для здоровья сердца.

12.07 / 06:39

медицина здоровье общество лечение мозг Когда ночная потливость указывает на редкую лимфому

Новые биологические методы позволяют подбирать терапию индивидуально под пациента, снижая объемы изнурительной химиотерапии.

12.07 / 06:05

люди наука история общество лечение Стоматологи майя: ученые узнали, как лечили зубы 2000 лет назад (фото)

Украшения из драгоценных камней на древних зубах майя могли быть не только признаком статуса или элементом ритуалов, но и выполнять практическую лечебную функцию. К такому выводу пришли ученые после исследования уникального артефакта.

12.07 / 05:30

люди здоровье общество самит человек Неожиданное свойство кофе удивило ученых

Новое исследование выявило эффект кофеина, который может оказаться полезным в самых разных жизненных ситуациях.

12.07 / 05:01

конференция самит инфографика google ByteDance Фотошоп больше не нужен? Представлена Seedream 5.0 Pro со слоями

ByteDance открыла страницу Seedream 5.0 Pro — флагманской модели генерации изображений, которая возглавит линейку Seedream. Главная фича — разделение готовой картинки на независимые слои, как в графическом редакторе. Саму модель компания анонсировала 23 июня на конференции Volcano Engine FORCE, пообещав запуск "в ближайшее время": доступность через API ByteDance пока не подтверждала.

12.07 / 04:36

продукты здоровье общество Здоровье и красота болезнь Назван фруктовый сок, который укрепляет сердце

Напиток содержит антиоксиданты, витамины и минералы, которые могут помочь укрепить иммунную систему.

12.07 / 04:25

музыка отдых магия Эксперт мозг Магия шума дождя – как природа помогает победить бессонницу и стресс

Засыпание под звуки природы помогает не только быстрее погрузиться в глубокий сон, но и значительно снижает уровень стресса.

12.07 / 04:25

погода люди алкоголь общество человек Почему пить алкоголь в жару опасно — ответ врачей

Высокая температура воздуха способна изменить реакцию организма на алкоголь и усилить нежелательные последствия.

12.07 / 01:55

происшествия ученые история общество археология Послание из Нового царства – археологи нашли свиток заклинаний

Международная группа исследователей отчиталась о завершении раскопок крупного скального некрополя. Ученые нашли нетронутые гробницы вельмож.

Лента новостей

На главную страницу