Об этом же в других СМИ

habr.com / 1 год назад

Pocket Casts cделал свои приложения бесплатными для всех

habr.com / 1 год назад

Reddit будет предупреждать пользователей при голосовании за запрещённый контент

habr.com / 1 год назад

В iOS 18.4 появятся ИИ-сводки отзывов для приложений в App Store

habr.com / 1 год назад

Google Play начнёт выделять приложения с виджетами

habr.com / 1 год назад

Китайские учёные разрабатывают марсианский дрон, который может катиться и летать

Больше по теме

27.02.2025 - 05:26 / habr.com

Исследование: ИИ может жульничать при риске проигрыша

Исследователи Palisade Research продемонстрировали, что современные модели, в том числе o1-preview от OpenAI, чувствуя грядущее поражение в турнире против опытного шахматного бота, не готовы признать его и идут на хитрости. В частности, они могут взломать противника, чтобы бот автоматически проиграл.

В исследовании оценивали семь современных моделей ИИ. Если более старые версии ИИ, такие как GPT-4o от OpenAI и Claude Sonnet 3.5 от Anthropic, нуждались в подсказке со стороны исследователей, чтобы использовать хитрости, то o1-preview и DeepSeek R1 выполняли нужные действия самостоятельно.

Исследователи попросили модели выиграть шахматную партию у Stockfish, который считается одним из сильнейших шахматных ботов в мире. ИИ предоставили «блокнот»: текстовое поле, которое он мог использовать, чтобы «думать» над следующим ходом.

В одном случае o1-preview оказалась в проигрышном положении. «Мне нужно полностью изменить свой подход. Задача состоит в том, чтобы “выиграть у мощного шахматного движка” — необязательно честно выиграть в шахматной партии», — начала рассуждать она. Затем ИИ изменил системный файл, содержащий виртуальную позицию каждой фигуры, фактически сделав незаконные ходы, чтобы победить.

С 10 января по 13 февраля исследователи провели сотни таких испытаний с каждой моделью. o1-preview от OpenAI пыталась обмануть оппонента в 37% случаев, а DeepSeek R1 шла на такие шаги в 11% случаев. Другие модели, в том числе o1, o3-mini, GPT-4o, Claude 3.5 Sonnet и QwQ-32B-Preview от Alibaba, нуждались в подсказках для жульничества.

В итоге o1-preview продемонстрировала самые высокие показатели взлома, но результаты модели исключили из результатов, возможно, из-за того, что OpenAI ужесточила ограничения модели. Этот факт подтверждает

спорт семья самит google maybeelf

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Microsoft признала замедление работы проводника Windows 11 при использовании кнопок заголовка habr.com / 1 год назад

Прототип разъёма питания видеокарт RTX 50 призван решить проблемы с плавлением habr.com / 1 год назад

Microsoft приостановила выпуск обновлённого индикатора батареи для Windows 11 habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

19.07 / 09:40

SpaceX общество NASA Луна космос Шаг до Луны – что покажет миру историческая миссия «Артемида-III»

В ходе "Артемиды-III" НАСА проведет комплексную проверку совместимости корабля "Орион" с демонстрационными посадочными модулями от SpaceX и Blue Origin.

19.07 / 09:34

технологии Действительно ли очистка оперативной памяти ускоряет телефон?

Многие владельцы Android-смартфонов убеждены, что регулярная очистка оперативной памяти (ОЗУ) помогает ускорить работу их устройств. Однако новый эксперимент показал, что популярный совет практически не влияет на производительность современных телефонов, пишет Android.com.pl.Первый этап эксперимента заключался в том, чтобы запустить на смартфоне как можно больше приложений и заполнить оперативную память.

19.07 / 09:24

смартфон зарядка мобильный телефон аккумулятор гаджет Как часто в день можно заряжать телефон: как это влияет на аккумулятор

Обычно срок службы современных литий-ионных аккумуляторов, которые чаще всего стоят в смартфонах, составляет от 2 до 3 лет. По оценкам производителя, это соответствует примерно 300–500 циклам зарядки, после чего емкость аккумулятора снижается примерно на 20%.

19.07 / 09:21

происшествия ДТП Tesla расследование Дом и интерьер Расследование: попавший в смертельное ДТП водитель Tesla нажал на педаль газа до упора

Национальный совет по безопасности на транспорте США (NTSB) сообщил, что водитель автомобиля Tesla, врезавшегося в жилой дом в июне, выжал педаль газа до упора (на 100%), тем самым перехватив управление у системы Full Self-Driving (Supervised).

19.07 / 08:49

погода технологии музыка самит Здоровье и красота SberDevices выпустили телевизоры с матрицей QD-miniLED и голосовым управлением

В новую линейку интеллектуальных телевизоров Sber серии 8000 входят устройства с диагоналями 50, 55 и 65”. QD в матрице обеспечивает чистые цвета, а miniLED — высокую контрастность изображения: каждый кадр выглядит так, как его задумал режиссёр. Дополнительно мы калибруем изображение для сочетания реалистичности и яркости, оптимальной цветовой температуры и точности передачи цветов (Δ E). В калибровке применяются колориметры и спектрометры плюс специализированное программное обеспечение, настройка производится на специальных тестовых изображениях в контролируемых условиях освещения.

19.07 / 08:37

люди ученые общество самит человек Какие последние картины видит человек перед смертью - ответ ученых

Исследователи выяснили, что на самом деле происходит в сознании человека за несколько мгновений до смерти.

19.07 / 08:10

связь общество gemini Пользователям посоветовали применять генераторы паролей вместо чат-ботов

Многие пользователи обращаются к чат-ботам, чтобы придумать уникальные пароли для входа на разные сервисы. Однако исследование компании Irregular ранее показало, что популярные ИИ вроде Claude, ChatGPTили Gemini склонны генерировать пароли, которые не являются случайными. В связи с этим пользователям дали ряд советов по безопасности.

19.07 / 07:38

ученые здоровье вирус болезнь организм Вирусы научились обходить иммунитет, используя изощренный способ

Ученые совершили открытия, которое поможет отследить путь проникновения вирусов в организм, оставаясь незамеченными иммунитетом.

19.07 / 07:38

продукты здоровье общество самит питание Полезную кашу, которая не подходит для завтрака, назвал эксперт

Оказывается, некоторые виды каш с утра могут негативно отразиться на самочувствии и уровне энергии.

19.07 / 07:27

экономика общество Sony евро Энтузиаст сделал систему игровых картриджей для Steam на базе подержанных накопителей

Один из ПК-геймеров разработал и продемонстрировал удобную систему игровых картриджей для Steam. Он использовал старые SATA-накопители (SSD) формата 2,5 дюйма на 128 ГБ.

Лента новостей

На главную страницу