Об этом же в других СМИ

habr.com / 1 месяц назад

Claude Mythos выйдет в ближайшие недели — модель круче Opus наконец-то откроют для всех

habr.com / 1 месяц назад

Вышел Claude Opus 4.8 — модель в 4 раза реже пропускает свои же баги

habr.com / 1 месяц назад

Robinhood допустил ИИ-агентов к торгам акциями — и сам предупредил, что они могут слить счет

habr.com / 1 месяц назад

«Opus 4.7 подсматривает ответы!»: Datacurve раскритиковала бенчмарк SWE-Bench Pro — и выпустила свой

habr.com / 1 месяц назад

Сэм Альтман посоветовал Маску топить серверы в океане, а не запускать в космос

Больше по теме

13.05.2026 - 14:11 / habr.com

Opus 4.6 в 81% попыток сам «копирует себя» на чужой сервер через дыру в коде — исследование Palisade

Лаборатория Palisade Research замерила, как часто современные ИИ-модели сами могут взломать чужой сервер и установить туда копию своих весов. У Claude Opus 4.6 получилось в 81% попыток, у GPT-5.4 — в 33%. Год назад актуальные модели тех же разработчиков показывали 6% и ровно 0% соответственно — это новое исследование фиксирует не столько отдельный факт, сколько скорость, с которой эта способность вырастала за один релизный цикл.

В эксперименте агенту давали один промпт — найти уязвимый хост в подконтрольной сети, проникнуть, вытащить креды, перенести нужные файлы и поднять на новой машине рабочий инференс-сервер. Заранее ему не говорили, какая там дыра — пробовали четыре класса уязвимостей: hash bypass, server-side template injection, SQL-инъекцию и broken access control. Модель сама выбирала, как атаковать. Веса GPT и Claude закрыты, поэтому в этих сценариях агент переносил open-source веса Qwen — открытые модели Alibaba играли роль "полезной нагрузки".

Картина роста такая. У Anthropic за год способность подскочила с 6% до 81%. У OpenAI — с нуля до 33%. Открытый Qwen3.6-27B уже выходит на те же 33%, причем работает на одной видеокарте A100. Старший Qwen3.5-122B-A10B держится на 6–19%.

Отдельный сюжет — chain replication. Qwen3.6-27B по одному промпту пробежал цепочку из четырех машин на трех континентах, на каждом узле эксплуатируя другую уязвимость, без человеческого участия. Palisade еще запустила симулятор: при условном бесконечном запасе уязвимых целей Opus 4.6 наплодил бы 13 000 копий за 12 часов. Сами авторы оговариваются, что это верхняя граница, а не реалистичный сценарий — в тестовой среде целевые машины указывали заранее и защита там была заведомо слабая.

Тем не менее, эксперты спокойны: пока для паники рано.

общество вирус разведка самит runawayllm

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Илон Маск: «Новый Grok обучался на данных Cursor и будет намного лучше в коде» habr.com / 1 месяц назад

DeepSeek уронил цены в 4 раза на свою самую мощную модель. Но есть нюанс habr.com / 1 месяц назад

OpenClaw на базе DeepSeek сам переписал свой код — и стал работать в 2,4 раза лучше habr.com / 1 месяц назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

12.07 / 00:32

продукты питания золото самит Эксперт кулинария «Золотое правило» выбора дыни – на что смотреть в первую очередь

Главный секрет выбора идеально спелой и сладкой дыни, по словам опытных фермеров, заключается в осмотре плодоножки.

11.07 / 23:29

продукты медицина общество Здоровье и красота лечение Продукты, которые облегчат боль в суставах, назвали врачи

Эксперты уверяют, что натуральные продукты могут быть такими же эффективными против боли, как и лекарства.

11.07 / 23:29

люди здоровье спорт общество самит Чай может навредить организму при одной распространенной привычке

Одна распространенная привычка при употреблении чая может свести на нет часть его полезных свойств.

11.07 / 21:54

технологии самит доллар мода и стиль Ariel Rider представила электровелосипед со скоростью до 105 км/ч и запасом хода до 200 км

Формально устройство остается велосипедом благодаря наличию педалей, однако его характеристики больше напоминают легкий электрический мотоцикл. Стоимость новинки составляет 2800 долларов (около 115 000 гривен), что выглядит весьма конкурентоспособным предложением с учетом заявленных возможностей.

11.07 / 21:11

технологии общество самит землетрясении токен Магнитная левитация и японское терпение: Linear Chuo Shinkansen поедет в 2037 году

Япония — это страна, где поезда опаздывают только во время крупных землетрясений, а задержка на минуту считается национальной трагедией. Однако даже в этом железнодорожном раю есть проекты, которые буксуют годами. Самый амбициозный из них — маглев Linear Chuo Shinkansen — наконец получил шанс на реализацию. После длительных споров оператор линии JR Central смог договориться с властями префектуры Сидзуока (Shizuoka), что фактически разблокировало строительство наиболее проблемного участка.

11.07 / 20:15

технологии Apple история общество самит Windows впервые за многие годы опустилась ниже 60% рынка ПК, а Linux продолжает укреплять позиции

По данным StatCounter, в июне 2026 года Windows занимала 56,55% мирового рынка настольных операционных систем. Для платформы, которая десятилетиями практически безоговорочно доминировала на компьютерах по всему миру, это стало знаковым событием.

11.07 / 19:54

общество политика рубль выплаты финансирование СМИ: «Задержки зарплат и сокращения в стартапе „Кама“ происходят на фоне подготовки к запуску электромобиля „Атом“»

Разработчик российского электромобиля «Атом» АО «Кама» начал задерживать выплату заработной платы сотрудникам и сокращать персонал. Об этом заявило издание «Ведомости» со ссылкой на текст обращения одного из работников в первичную профсоюзную организацию «Т1 клауд». В обращении содержится просьба дать правовую оценку действиям компании из-за систематических задержек зарплаты, а также помочь с подготовкой жалоб в Госинспекцию труда и прокуратуру и принять меры профсоюзного контроля.

11.07 / 19:41

технологии интернет общество банк гаджет Wi-Fi может уйти в прошлое: новая технология набирает популярность

Новая технология использует свет вместо радиоволн и постепенно начинает внедряться в разных странах мира.

11.07 / 19:15

продукты люди здоровье Здоровье и красота питание Откажитесь навсегда: 6 продуктов, которые никогда не едят долгожители

Как ни странно, но в рационе долгожителей нет продуктов, которые многие считают полезными. Например, молока или пшеничного хлеба.

11.07 / 19:15

продукты люди здоровье общество овощи Как снизить уровень сахара за считанные минуты - доступный всем способ

Врачи рассказали про полезнейший овощ, который быстро снижает уровень сахара, а при регулярном употреблении помогает контролировать этот показатель.

Лента новостей

На главную страницу