Об этом же в других СМИ

habr.com / 1 год назад

«Яндекс» запустил в Москве программу трейд-ин по обмену б/у умных колонок «Станция» на новые модели

forbes.ua / 1 год назад

Рынок на $16,6 млрд. Стартап Deus Robotics больше не производит складских роботов, а только разрабатывает для них софт. Почему компания, среди клиентов которой «Новая почта», изменила стратегию

chudo.tech / 1 год назад

Изобретатель из Новой Зеландии создал мотоцикл-трактор с гигантскими колёсами

gagadget.com / 1 год назад

Инсайдер сообщил, когда Apple представит новые модели MacBook с чипами M4 и iPad mini 7

gagadget.com / 1 год назад

Oura Ring 4: Утечка изображений показывает возможный дизайн новой модели смарт-кольца

Больше по теме

21.09.2024 - 14:44 / habr.com

Исследователи: новая модель OpenAI не только рассуждает, но и вводит в заблуждение

За несколько недель до выпуска новейшей рассуждающей модели OpenAI, o1, независимая исследовательская компания Apollo, занимающаяся исследованиями безопасности искусственного интеллекта, обнаружила заметную проблему. Apollo поняла, что модель выдает неверные результатыпо-новому. Или, говоря более разговорным языком, она лжёт.

Иногда обман казался безобидным. В одном примере исследователи OpenAI попросили o1-preview предоставить рецепт брауни с онлайн-ссылками. Ход мыслей модели, функция, которая должна имитировать то, как люди разбивают сложные идеи, внутренне признал, что она не может получить доступ к URL-адресам, что делает запрос невозможным. Вместо того, чтобы сообщить пользователю об этой слабости, o1-preview продолжила, генерируя правдоподобные, но поддельные ссылки и их описания.

Хотя модели ИИ и раньше могли «лгать», а чат-боты часто выдают ложную информацию, o1 обладала уникальной способностью «схитрить» или «имитировать соответствие». Это означало, что она могла притворяться, что следует правилам для выполнения данной задачи, но на самом деле этого не делает. Для модели правила могли быть слишком обременительными, и, похоже, она имеет способность игнорировать их, если это означает, что она может легче выполнить задачу.

Генеральный директор Apollo Мариус Хоббхан сообщил, что это первый раз, когда он столкнулся с таким поведением в модели OpenAI. Хоббхан говорит, что разница обусловлена способностью этой модели «рассуждать» через процесс цепочки мыслей и тем, как она сочетается с обучением с подкреплением, которое обучает систему через вознаграждения и штрафы. Во время тестирования Apollo обнаружила, что ИИ имитировала соответствие ожиданиям разработчиков и манипулировала задачами, чтобы казаться соответствующей.

происшествия общество самит лечение kr23ka

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Microsoft анонсировала новый инструмент для обнаружения и исправления галлюциногенного контента в результатах ИИ habr.com / 1 год назад

«Призрачная акула»: ученые открыли новый вид novostiua.net / 1 год назад

Casio выпустила новые модели G-Shock G-Lide с графиками приливов и отливов gagadget.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

22.07 / 21:56

Samsung технологии общество евро самит Samsung представила Galaxy Z Flip 8 с увеличенным внешним экраном, новыми возможностями ИИ и обновленной конструкцией

Во время презентации компания сделала ставку не только на аппаратные улучшения, но и на программные возможности. Galaxy Z Flip 8 получил множество ИИ-функций, работающих непосредственно в оболочке One UI 9, а также расширенное взаимодействие с сервисами Google Gemini.

22.07 / 21:39

лайфхаки для бизнеса Предназначение и бизнес: где находится точка роста - Журнал "ФОКУС ВНИМАНИЯ"

Как связаны между собой задача духа и современный бизнес? Задача духа — это то предназначение, которое человек должен реализовать на Земле.

22.07 / 21:03

технологии деньги общество рубль электромобиль Опубликован обзор первого электромобиля КАМА «Атом», выданного частному владельцу

Блогер и популяризатор российской микроэлектроники Максим Горшенин выпустил обзор первого электромобиля КАМА «Атом», выданного частному владельцу.

22.07 / 19:49

связь экономика дефицит ФАС предложила изменить правила возврата железнодорожных билетов

Федеральная антимонопольная служба разработала проект приказа, который позволит перевозчикам самостоятельно устанавливать размер сбора за возврат неиспользованных железнодорожных билетов — до 10% от их стоимости. По мнению ведомства, эта мера поможет сократить число возвратов и увеличить доступность билетов для пассажиров.

22.07 / 19:49

связь технологии закон Chevrolet расследование Полиция Техаса потратила $4,5 млн на четыре Chevrolet Tahoe

Отдел уголовных расследований Департамента общественной безопасности Техаса (DPS) закупил систему видеонаблюдения Cognyte на борту четырёх внедорожников Chevrolet Tahoe. Транспорт и всё оборудование обошлись почти в $4,5 млн.

22.07 / 19:31

политика выплаты правительство Через чат‑бот «Госуслуг» можно будет узнать о доступных мерах социальной поддержки

Правительство России утвердило постановление, которое позволит гражданам запрашивать сведения о мерах социальной поддержки через чат‑бот на портале «Госуслуг». Документ внесло Министерство труда и социальной защиты России.

22.07 / 19:22

Apple СМИ политика Роскомнадзор: ведомство не ограничивает доступ к AppStore

20 июля 2026 года в Роскомнадзоре заявили СМИ, что ведомство не ограничивает доступ к сервису Apple — магазину приложений AppStore.

22.07 / 19:05

Путешествия туризм самолет курьез Почему в самолете нельзя сидеть в черных носках - необычная причина

Бывший бортпроводник рассказал, какую одежду нужно надевать для путешествий на самолете.

22.07 / 19:05

погода экономика жара температура воздуха Дом и интерьер Жара выше 40 градусов — не помеха: бюджетный метод охлаждения жилья

Чтобы сохранить прохладу в доме в 45-градусную жару без использования кондиционера, достаточно воспользоваться традиционным испанским методом.

22.07 / 18:47

общество звезда интересное Шведские ученые разгадали серебряную загадку Солнца

Это открытие не только разгадывает давнюю загадку недостающего серебра в Солнечной системе, но и открывает новые перспективы в понимании того, как образуются элементы во Вселенной. Результаты исследования были опубликованы в журнале Astronomy and Astrophysics.Одним из важнейших результатов этого исследования является разрешение давней проблемы так называемого недостающего серебра в Солнечной системе.

Лента новостей

На главную страницу