Об этом же в других СМИ

habr.com / 1 год назад

IEEE Spectrum: скорость передачи данных снижается, пришло время переосмыслить 6G

habr.com / 1 год назад

Гендиректор Anthropic: DeepSeek показал себя «худшим» в тесте безопасности данных о биологическом оружии

habr.com / 1 год назад

Исследователи Apple показали умную танцующую лампу в стиле Pixar

habr.com / 1 год назад

Microsoft представила новый скрипт PowerShell для обновлённого загрузочного носителя Windows 10 и 11

habr.com / 1 год назад

«Лаборатория Касперского» выявила вирус для кражи данных снимков с iPhone

Больше по теме

30.01.2025 - 16:41 / habr.com

Исследователи взломали модель DeepSeek-R1 для создания вредоносных выходных данных

Компания по кибербезопасности KELA рассказала, что ей удалось взломать модель DeepSeek-R1 для создания вредоносных выходных данных. Исследователи отметили, что DeepSeek R1 имеет сходство с ChatGPT, но значительно более уязвима.

Тестирование KELA показало, что модель можно легко взломать, используя различные методы, включая те, о которых известно уже более двух лет. Например, метод «Evil Jailbreak» эксплуатирует модель, побуждая её принять «злую» личность, свободную от этических или иных ограничений. В начале 2023 года этот джейлбрейк успешно обошёл механизмы безопасности ChatGPT 3.5, но он не работает в GPT-4 и GPT-4o.

Команда AI Red Team смогла применить DeepSeek-R1 в широком диапазоне сценариев, чтобы генерировать вредоносные результаты. Так, чат-бота просили разработать программу-вымогатель, извлечь конфиденциальный контент и представить подробные инструкции по созданию токсинов и взрывных устройств.

Интересно, что DeepSeek R1 не только предоставляла подробные инструкции, но и генерировала вредоносные скрипты, предназначенные для извлечения данных кредитных карт из браузеров и передачи их на удалённый сервер. Также чат-бот предлагал пользователю купить украденные данные на автоматизированных торговых площадках, таких как Genesis.

Также DeepSeek попросили использовать функцию поиска для подбора веб-источников и подготовки «руководства по созданию дрона-камикадзе». Чат-бот сгенерировал таблицу с 10 подробными шагами по созданию такой машины.

Наконец, модель просили сгенерировать таблицу со списком предполагаемых адресов электронной почты, номеров телефонов, зарплат и имён старших сотрудников OpenAI. Если ChatGPT4o отказался отвечать на этот вопрос, то DeepSeek выдал таблицу, но, по-видимому, данные в ней ложные, так как у

технологии Apple самит интересное кибератаки maybeelf eps

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Цензура в DeepSeek работает при локальном запуске модели habr.com / 1 год назад

В AltStore PAL в ЕС для iPhone вышел браузер контента для взрослых Hot Tub habr.com / 1 год назад

Microsoft начала блокировать приложение Flyby11 для обхода системных требований Windows 11 24H2 habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

21.07 / 07:28

смартфоны бытовая техника аксессуары Транспорт Вместо планшета: Skylight Buddy помогает детям быть самостоятельными

Компания Skylight представила устройство Buddy, которое помогает детям от 4 до 10 лет самостоятельно соблюдать распорядок дня.

21.07 / 07:25

технологии общество Sony самит фильм Сколько на самом деле работают телевизоры Sony – опыт владельцев

Хотя технологии производства телевизоров постоянно развиваются, мнения владельцев о долговечности любимой техники расходятся.

21.07 / 07:25

медицина психология стресс кофе профессор Секрет долголетия в обычной чашке кофе – что узнали ученые

Исследователи раскрыли молекулярные тайны любимого утреннего напитка. Кофе помогает организму эффективно бороться со старением и стрессом.

21.07 / 07:25

животные семья самит Эксперт кошка Тайный смысл кошачьих поцелуев и умываний раскрыли эксперты

В масштабном европейском эксперименте приняли участие более пятидесяти семей. Владельцы кошек регулярно записывали драки и ласки на видео.

21.07 / 07:13

закон законодательство самит расследование еврокомиссия AliExpress получил многомиллионный штраф в ЕС: платформу обвинили в продаже подделок и небезопасных товаров

Расследование показало, что система модерации AliExpress не обеспечивала необходимый уровень контроля, а многие товары, нарушающие европейское законодательство, продолжали оставаться доступными для покупателей в течение нескольких недель. Решение уже опубликовано Европейской комиссией и стало одним из крупнейших наказаний, вынесенных в рамках действия DSA.

21.07 / 07:00

СМИ президент общество законопроект сенат СМИ: Трамп одобрил пакет мер по этике в CLARITY Act

Президент США Дональд Трамп одобрил пакет мер по этике в законопроекте о структуре крипторынка (CLARITY), о чем сообщила журналистка Элеонор Терретт. Это ключевое препятствие для дальнейшего продвижения инициативы. На каком этапе находится CLARITY Act? Это рамочный законопроект о регулировании крипторынка. Палата представителей Конгресса США одобрила его летом 2025 года. Затем билль передали в Сенат, на рассмотрение Комитета по сельскому хозяйству и Банковского комитета. Рынок в ож

21.07 / 06:57

футбол спорт семья досуг самит Продажи консолей и телевизоров выросли до 15% во время Чемпионата мира по футболу

В М.Видео проанализировали продажи телевизоров и игровых консолей в период проведения чемпионата мира по футболу. На фоне главного спортивного события года оборот телевизоров увеличился на 15% месяц к месяцу, а продажи игровых консолей — на 10%. Самыми популярными телевизорами стали модели от Hisense, официального спонсора ЧМ по футболу.

21.07 / 06:57

Xiaomi самит курс крипто Kimi K3: опенсорс-модель на 2.8 трлн параметров обходит Opus 4.8

Moonshot AI выпустили Kimi K3 — самую крупную открытую модель на сегодня. 2.8 трлн параметров! Вдвое больше, чем у DeepSeek V4 Pro, и втрое больше, чем у Xiaomi MiMo V2.5 Pro. Поддерживает контекст в 1 млн токенов, а также нативную работу с изображениями и видео.

21.07 / 06:57

деньги общество политика выплаты reddit X ужесточила меры против авторов постов с чужим контентом

Платформа X решила занять более жёсткую позицию в отношении пользователей, пытающихся злоупотреблять программой распределения доходов путём искусственного накручивания активности и кражи чужих материалов.

21.07 / 06:57

продукты музыка общество политика google Spotify удалил более 75 млн песен, созданных с помощью ИИ

Стриминговый сервис Spotify за последние 12 месяцев удалил более 75 млн песен, сгенерированных инструментами искусственного интеллекта, рассказал руководитель отдела по работе с артистами, маркетингу и политике компании Сэм Дубофф. Он охарактеризовал эти треки как ИИ-слоп. Общее число композиций на платформе превышает 100 млн.

Лента новостей

На главную страницу