Об этом же в других СМИ

cursorinfo.co.il / 1 год назад

Когда и из-за чего погибнет человечество, предположили ученые

cursorinfo.co.il / 1 год назад

Дикое животное внезапно появилось в аэропорту и устроило хаос - видео

habr.com / 1 год назад

Steam потребует от разработчиков раскрывать факт использования античита на уровнe ядра

chudo.tech / 1 год назад

Новый «умный» ободок OxyZen способен помочь расслабиться и уснуть

cursorinfo.co.il / 1 год назад

Как погибнет человечество - прогноз ученых

Больше по теме

19.10.2024 - 07:45 / incrypted.com

Anthropic: ИИ способен устроить человечеству «саботаж» и скрывать истинные намерения

Эксперты из сферы искусственного интеллекта исследовали угрозы, которые могут исходить от этой технологии.
Команда Anthropic описала их как «диверсионные» риски, представляющие опасность для человека.
Специалисты пришли к выводу, что ChatGPT и Claude-3 демонстрируют способность к саботажу.

Аналитики ИИ-стартапа Anthropic опубликовали результаты исследования, в рамках которого проанализировали ряд «диверсионных» угроз со стороны искусственного интеллекта. Эксперты считают, что продвинутые модели ИИ могут вводить человека в заблуждения и скрывать от него свои намерения.

Отчет посвящен четырем конкретным способам, которые вредоносная LLM может использовать для обмана людей. В первом случае аналитики попросили ИИ саботировать принятие человеком решений, предоставив ему неверную информацию.

Во втором варианте модель, созданная для помощи программистам, тайно создавала ошибки в коде, чтобы привести ПО в неработоспособное состояние. Эту задачу ИИ также успешно выполнил.

Следующий метод связан с так называемой «подтасовкой». При этом сценарии ИИ притворялся, будто не способен выполнить определенные действия. Таким образом он пытался убедить аналитиков, что вредоносные операции не представляют опасности.

Что такое машинное обучение? Все, что вам нужно знать 07.10.2023 37 мин 6108 читать

Последняя угроза представляет собой ситуацию, когда ИИ-модель намеренно пропускает в компьютерную систему вирус, скрывая эту информацию от человека.

В ходе анализа эксперты пришли к выводу, что ChatGPT от OpenAI и Claude-3 от самих Anthropic демонстрируют способность к саботажу. Однако на текущем этапе развития больших языковых моделей для исправления ситуации достаточно принять минимальные меры безопасности.

Напомним, мы писали, что

технологии происшествия люди общество Pavel Kot

Читать на incrypted.com

Все новости от incrypted.com

Об этом же в других СМИ

Tecno запускает новый инструмент для определения истинного оттенка кожи ilenta.com / 1 год назад

Red Magic 10 Pro показал, на что способен, пройдя тесты производительности Geekbench gagadget.com / 1 год назад

Илон Маск: к 2040 году роботы-гуманоиды превзойдут по численности человечество incrypted.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

15.07 / 12:32

магия самит деревня Assassin's Creed В Assassin's Creed Hexe можно довести врагов до паники — развили систему страха из дополнения для Syndicate

В сети появилась новая информация об Assassin's Creed Codename Hexe — следующей масштабной части флагманской франшизы Ubisoft. Своими сведениями поделился инсайдер RogueTX и они позволяют составить впечатление о том, каким будет экшен в сеттинге средневековой Европы эпохи “охоты на ведьм”.

15.07 / 12:32

технологии экономика самит интересное мода и стиль Dacia Sandero Stepway Hybrid: 155 лошадиных сил и «бюджетность» за миллион гривен

Румынский бренд, который когда-то ассоциировался исключительно с аскетизмом и максимально низкими ценниками, продолжает свою экспансию в территорию сложных технологий. Новая Dacia Sandero Stepway Hybrid наконец-то выходит на европейские рынки, предлагая то, чего раньше в линейке модели не было — пристойную мощность и отсутствие педали сцепления по цене, которая заставляет задуматься о приоритетах.

15.07 / 12:31

связь технологии деньги самит Гендиректор Microsoft: не выдавайте ИИ-компаниям свои секреты

Генеральный директор Microsoft Сатья Наделла предостерёг компании, спешащие внедрить искусственный интеллект, от передачи разработчикам ИИ важных бизнес-данных.

15.07 / 12:31

технологии дети общество политика Минпросвещения установило нормы использования гаджетов детьми

В Минпросвещения РФ установили нормы по использованию смартфонов, компьютеров и телевизора для детей и подростков. Согласно методическим рекомендациям, направленным в регионы, главная задача норм — формирование безопасного цифрового опыта у несовершеннолетних.

15.07 / 12:31

политика самит google BAY Google выступил против блокировки DNS-серверов, CDN и IP-адресов

Google заявила Европейской комиссии, что выступает против блокировки пиратских сайтов в Европе, поскольку считает такие меры малоэффективными и вредными. Компания возражает против блокировки DNS-резолверов (Google владеет сервисом 8.8.8.8), IP-адресов и VPN-сервисов, утверждая, что в этом случае пользователи могут легко обойти запрет с помощью альтернативных инструментов.

15.07 / 12:16

связь экономика Центробанк инфляция политика Без помощи крипторынку и с нулевой терпимостью к инфляции: глава ФРС выступил перед Конгрессом

Председатель Федеральной резервной системы (ФРС) Кевин Уорш выступил перед Комитетом по финансовым услугам Палаты представителей США. Он прокомментировал вопрос независимости регулятора, дал оценку буму в ИИ-секторе, а также заверил, что центробанк «не будет никого спасать», включая участников криптосферы. Напомним, Уорш вступил в должность председателя ФРС в середине мая 2026 года. На первом заседании по процентной ставке он заявил, что намерен сократить количество сигналов относительно политики регулятора и пересмотреть его подход в целом. Выбор Трампа: все, что нужно знать о Кевине Уорше — новом главе ФРС 03.02.2026 Читать Между Трампом и рынком: каким будет первое решение ФРС по ставке при Уорше 17.06.2026 Чит

15.07 / 12:16

инфляция общество финансирование майнер BTC В сообществе биткоина возобновили дискуссию о финансировании майнеров после 2040 года

В сообществе разработчиков биткоина развернулась новая дискуссия о долгосрочной безопасности сети после постепенного уменьшения вознаграждения майнерам. Поводом стала масштабная ветка обсуждения на форуме Delving Bitcoin под названием Addressing the Diminishing Block Subsidy, которая привлекла внимание MARA Foundation. Участники обсуждают, смогут ли комиссии за транзакции полностью заменить субсидию за блок, когда она почти исчезнет, и стоит ли рассматривать альтернативные механизмы финансирования безопасности сети. Предложение: постоянная эмиссия по

15.07 / 12:16

СМИ закон законодательство политика инвестор СМИ: Япония приравняла криптоактивы к финансовым инструментам

Парламент Японии принял законодательные изменения, которые признают криптоактивы финансовыми инструментами. Об этом сообщает Reuters со ссылкой на телеканал NHK. Ожидается, что новый режим регулирования вступит в силу после переходного периода, который продлится около года. Крипторынок переходит под финансовое регулирование После вступления закона в силу криптоактивы будут регулироваться в рамках законодательства о финансовых инструментах и биржах, что приблизит их статус к традиционным финансовым активам. В частности, на участников ры

15.07 / 11:58

наука история климат прогноз глобальное потепление Ученые выяснили причины Великого вымирания — они вам не понравятся

Исследователи утверждают, что крупнейшее массовое вымирание в истории, в результате которого 252 миллиона лет назад погибло 96% морских и 70% наземных видов живых существ, было вызвано определенными климатическими условиями, которые начинают воспроизводиться и сегодня.

15.07 / 11:53

закон самит стартап paypal google Стартап дочери Билла Гейтса обвинили в «накрутке комиссий»

В Bloomberg провели расследование, которое показало, что стартап Phia, основанный дочерью Билла Гейтса Фиби Гейтс и Софией Кианни, использует практику под названием «cookie stuffing». Эта схема позволяла компании получать комиссионные и приписывать себе продажи, которые она фактически не обеспечила.

Лента новостей

На главную страницу