Об этом же в других СМИ

habr.com / 1 месяц назад

«Не сетка»: ИИ впервые в истории сам решил центральную проблему геометрии

habr.com / 2 месяца назад

ИИ собрал рабочую ОС за 12 часов: представлена Gemini 3.5 Flash

habr.com / 2 месяца назад

ИИ нашел дыру в NGINX за 6 часов. Хакерам хватило трех дней, чтобы начать ее эксплуатировать

habr.com / 2 месяца назад

Cursor выпустила Composer 2.5: догнала Opus 4.7, но отстает от GPT-5.5

habr.com / 2 месяца назад

Математики потратили $550 000 на тест, который ИИ не может решить

Больше по теме

05.05.2026 - 09:58 / habr.com

10 минут вместо 12 часов: GPT-5.5 решила экспертную кибер-задачу за $1.73

Британский AI Security Institute (AISI) опубликовал оценку кибер-возможностей GPT-5.5. По собственной оценке института, это потенциально самая сильная модель из всех протестированных. На наборе экспертных задач по реверс-инжинирингу, разработке эксплойтов и криптографии модель в среднем берет 71.4% — выше, чем Mythos Preview (68.6%), GPT-5.4 (52.4%) и Claude Opus 4.7 (48.6%).

Самая показательная иллюстрация — задача rust_vm, которую для AISI готовила компания Crystal Peak Security. Это пара файлов: бинарник на Rust без отладочных символов с собственной виртуальной машиной и байткод неизвестного формата, проверяющий пароль на порту 8080. Эксперт компании, вооруженный Binary Ninja, gdb, Python и SMT-решателем Z3, решал задачу около 12 часов. GPT-5.5 в базовой ReAct-обвязке с Bash и Python в контейнере Kali Linux прошла все пять фаз — от восстановления таблицы переходов по ELF-релокациям до решения через комбинаторный перебор — за 10 минут 22 секунды. Стоимость API-вызовов — $1.73.

Не менее показательны результаты на сетевых полигонах AISI — многоэтапных сценариях, имитирующих реальные атаки. На "The Last Ones", 32-шаговой симуляции взлома корпоративной сети, разработанной совместно со SpecterOps, GPT-5.5 прошла цепочку от начала до конца — это удалось всего одной модели до нее, Mythos Preview. У GPT-5.5 — 2 успешных попытки из 10, у Mythos было 3 из 10. На сценарии для промышленных систем Cooling Tower от Hack The Box (симуляция атаки на электростанцию) модель не справилась, но застряла на IT-этапах — то есть по этому результату нельзя судить о ее способностях против самих промышленных систем.

Параллельно AISI провел red-teaming защитных механизмов GPT-5.5. Экспертам хватило шести часов, чтобы найти универсальный джейлбрейк,

вооружение закон промышленность общество самит runawayllm

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

«Гипотезу Римана может доказать анонимный аккаунт»: математик MIT — об опыте работы с GPT-5.5-Pro habr.com / 2 месяца назад

OpenAI представила первую голосовую модель с интеллектом GPT-5 habr.com / 2 месяца назад

Из экспоненты в полином за два часа: что GPT-5.5 Pro сделала с задачей по теории чисел habr.com / 2 месяца назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

22.07 / 11:09

продукты продукты питания Здоровье и красота полезные продукты кулинария Как две ложки отрубей в день улучшают работу кишечника

Чтобы избавиться от метеоризма и улучшить пищеварение, диетологи рекомендуют ежедневно добавлять в рацион по две ложки овсяных отрубей.

22.07 / 11:09

законодательство самит google правительство coinbase В Малайзии власти закрыли образовательный проект бывшего CTO Coinbase

Правительство штата Джохор, Малайзия, аннулировало лицензию компании NS0 Malaysia Sdn. Bhd., которая стоит за проектом Network School бывшего CTO биржи Coinbase Баладжи Сринивасана. Об этом заявил Онн Хафиз Гази, глава исполнительной власти штата. На основе этого решения организации предписано прекратить всю деятельность с 22 июля 2026 года. Из заявления также следует, что лицензию отозвали после анализа отчетов о проверках и возражений со стороны самой компании. По данным Reuters, поводом для проверок послужили заявления о нарушении иммиграционного законодательства Малайзии. В издании отметили, что властям поступили сообщения от пользова

22.07 / 10:34

самит инвестор крипто XRP Binance Аналитики увидели новый сигнал для движения цены XRP на фоне активности китов

Переводы XRP от крупных держателей на биржу Binance за последний месяц сократились до самого низкого уровня за два месяца, тогда как активность на спотовом рынке резко упала. В то же время аналитики CryptoQuant фиксируют постепенный рост открытого интереса (OI) на рынке деривативов, а Santiment сообщает о накоплении XRP крупными кошельками. По мнению экспертов, рынок переходит в фазу «равновесия ликвидности», которая может предшествовать более сильному движению цены актива. Киты реже переводят XRP на Binance По данным CryptoQuant, показатель XRP Whale Inflow to Binance – 30D (SUM) снизился примерно до 947,4 млн XRP, что стало минимумом за по

22.07 / 10:32

погода технологии конференция общество самит 29 стран подписали соглашение о создании Всемирной организации по сотрудничеству в сфере ИИ

В Шанхае представители 29 государств подписали соглашение об учреждении World AI Cooperation Organization (WAICO) — новой межправительственной организации, которая должна стать площадкой для международного сотрудничества и координации подходов к развитию и регулированию искусственного интеллекта. Инициатива была предложена Китаем и официально оформлена накануне открытия ежегодной конференции World Artificial Intelligence Conference (WAIC 2026).

22.07 / 10:17

продукты продукты питания Здоровье и красота полезные продукты Что полезнее для уровня сахара в крови – сравниваем голубику и бананы

Сравнение пользы этих популярных фруктов помогает понять, как каждый из них по-своему влияет на наш организм.

22.07 / 10:12

Олимпиада спорт золото семья Российские школьники получили 4 золотых и 2 серебряных медали на 67-й Международной математической олимпиаде IMO 2026

Российские школьники получили 4 золотых и 2 серебряных медали на 67-й Международной математической олимпиаде IMO 2026. Мероприятие проходило в Шанхае.

22.07 / 10:12

Олимпиада золото общество школы Российские школьники получили золотые медали на 58-й Международной химической олимпиаде IChO 2026

Российские школьники получили четыре золотые медали на 58-й Международной химической олимпиаде IChO 2026, которая проходила в Ташкенте в середине июля 2026 года. Один из членов сборной России стал абсолютным победителем мероприятия. Пока что официальные результаты олимпиады находятся в процессе подготовки.

22.07 / 10:12

происшествия общество политика расследование аномалия Автономная система ИИ-агентов атаковала Hugging Face: защититься помогла LLM

Hugging Face раскрыли подробности недавнего инцидента безопасности. По заявлению компании, это первый случай, когда атака на ее инфраструктуру была целиком проведена автономной системой ИИ-агентов — от первоначального проникновения до последующего развития атаки.

22.07 / 09:53

медицина технологии люди смартфон общество Морщины в 20 лет: эта привычка вредит вашей шее

Долгое использование смартфонов с опущенной головой вызывает ранние морщины на шее, боли и проблемы с осанкой даже у молодых людей.

22.07 / 09:40

Samsung технологии СМИ Nvidia общество Samsung усиливает сотрудничество с NVIDIA: компания станет одним из ключевых поставщиков памяти для ИИ-систем нового поколения

Информация пока основана на публикациях отраслевых СМИ и инсайдерских данных. При этом сотрудничество между Samsung и NVIDIA уже давно подтверждено официально: корейский производитель поставляет американской компании DRAM, память HBM для ускорителей искусственного интеллекта, а также предоставляет услуги контрактного производства чипов.

Лента новостей

На главную страницу