Об этом же в других СМИ

habr.com / 4 месяца назад

Anthropic объяснила, почему ИИ ведет себя как человек — и почему иначе не получится

habr.com / 4 месяца назад

«Бежала к Mac Mini как сапер к бомбе»: директор по ИИ-безопасности Meta* не смогла остановить OpenClaw

habr.com / 4 месяца назад

Самый амбициозный ИИ-проект разваливается на глазах: OpenAI уходит из Stargate

habr.com / 4 месяца назад

Как китайские открытые ИИ забрали почти половину рынка токенов на OpenRouter

habr.com / 4 месяца назад

Новый DeepSeek Moment: как Anthropic обрушила акции кибербезопасности

Больше по теме

10.02.2026 - 08:13 / habr.com

Как GPT-5.3-Codex создавала саму себя и получила рейтинг «высокой киберугрозы»

OpenAI выпустила GPT-5.3-Codex — и это первая модель в истории компании, которая помогала создавать саму себя. Ранние версии модели отлаживали собственный тренинг, управляли деплоем и анализировали результаты тестов. "Наша команда была поражена тем, как сильно Codex ускорила собственную разработку", — написала компания в блоге.

Модель работает на 25% быстрее предшественницы и показывает лучшие результаты в отрасли на бенчмарке SWE-Bench Pro (56,8%) — он охватывает четыре языка программирования и считается устойчивым к утечкам данных. На Terminal-Bench 2.0, который измеряет навыки работы в терминале, GPT-5.3-Codex набрала 77,3% против 64% у предыдущей версии. А на OSWorld, где ИИ выполняет задачи в визуальном окружении рабочего стола, модель приблизилась к человеческому уровню: 64,7% против примерно 72% у людей.

Но те же способности, которые делают модель эффективной в написании и анализе кода, вызывают и серьезные опасения. GPT-5.3-Codex стала первой моделью OpenAI, получившей рейтинг High в категории кибербезопасности по внутренней системе оценки рисков Preparedness Framework. Это означает, что компания считает модель достаточно мощной, чтобы потенциально помогать в проведении реальных кибератак — особенно при автоматизации.

Из-за этого OpenAI задержала открытый доступ к API и развернула "самый полный стек защиты от киберугроз на сегодняшний день". Доступ к продвинутым возможностям модели в области безопасности получат только проверенные специалисты через программу Trusted Access for Cyber. Параллельно компания расширяет закрытое бета-тестирование Aardvark — собственного ИИ-агента для поиска уязвимостей — и выделяет $10 млн в виде кредитов на API для исследователей, работающих над защитой открытого ПО и критической

история общество самит кибератаки runawayllm

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Разработчик создал локальную память для Claude Code, Codex и Cursor habr.com / 4 месяца назад

Скриншот за 28 млн токенов: как Opus попытался взломать свои ограничения — и почти преуспел habr.com / 4 месяца назад

IT-аутсорсинг убьет сам себя? Infosys строит агентов на Claude habr.com / 4 месяца назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

17.07 / 08:48

бизнес ВТБ общество политика банк Утверждён план доступа цифровых платформ и банков к данным ФТС, ФНС и Росреестра с реализацией через API

Вице-премьер Дмитрий Григоренко утвердил «дорожную карту» по предоставлению и упрощению доступа цифровых платформ и банков к данным ФТС, ФНС и Росреестра. Документ был утверждён 7 июля 2026 года. Об этом сообщает «Коммерсантъ» со ссылкой на аппарат вице-премьера. «Дорожную карту» подготовили Минцифры РФ и Ассоциация больших данных, куда входят «Сбер», «Яндекс», ВТБ, «Авито» и другие крупные компании.

17.07 / 08:48

технологии Telegram Обновление Telegram: расширенное Markdown-форматирование и сообщества, напоминающие Discord

Команда Telegram выпустила большое обновление мессенджера. Ключевыми нововведениями стали расширенный Markdown-редактор и сообщества в формате, похожем на сервера в Discord.

17.07 / 08:48

технологии Apache Sun Представлен открытый проект BottleShip для запуска тяжёлых Windows-игр в браузере с высокоуровневой эмуляцией

Разработчик и энтузиаст ретро-гейминга Евгений Смирнов (@jenissimo ) представил открытый проект под названием BottleShip. Это решение для запуска тяжёлых игр для Windows в браузере с принципиально новым подходом к высокоуровневой эмуляции. Исходный код проекта написан на TypeScript и распространяется под лицензией Apache License 2.0.

17.07 / 08:48

продукты связь общество рубль Cisco Больше трети российских компаний продолжает использовать зарубежное сетевое оборудование

Компания OCS провела исследование, по которому в 2026 году 36% средних, крупных и крупнейших компаний не перешли на российские решения для сетевой инфраструктуры. Исследование проводилось посредством опроса и охватило коммутаторы, маршрутизаторы, точки доступа и другое оборудование. В опросе участвовали 185 организаций из разных отраслей.

17.07 / 08:46

люди общество самит инфекция гигиена Названы самые грязные предметы, которых люди касаются каждый день

После каких привычных нам бытовых предметов нужно обязательно мыть руки или хотя бы использовать антисептик.

17.07 / 08:44

наука SpaceX космос расследование интересное SpaceX отменила запуск ракеты Starship прямо во время зажигания двигателей

Этой ночью должен был состояться 13-й тестовый полет обновленной ракеты Starship, однако полет прервали в последнюю секунду, когда уже началось зажигание двигателей. Как сообщил глава космической компании Илон Маск, несколько двигателей не запустились во время старта, что привело к автоматической отмене запуска. SpaceX заменит два несработавших двигателя, проведет расследование инцидента и попытается осуществить запуск на следующей неделе.

17.07 / 08:33

продукты люди ученые здоровье общество Привычки, которые помогут стать долгожителем, назвали ученые

Исследователи выяснили, что некоторые повседневные привычки помогают сохранять здоровье, активность и ясный ум до глубокой старости.

17.07 / 08:33

технологии ученые промышленность общество океан Океан обеспечит человечество ресурсами – ученые нашли способ добычи

Американские ученые работают над технологией, которая позволит промышленно добывать критически важные металлы из океана.

17.07 / 08:31

Samsung закон общество прогноз самит Samsung Galaxy Tab S12 Ultra показали на качественных рендерах: раскрыт дизайн нового флагманского планшета

В сети появились новые CAD-рендеры будущего флагманского планшета Samsung Galaxy Tab S12 Ultra, которые не только демонстрируют его внешний вид, но и раскрывают ряд технических деталей. Информация основана на утечке, опубликованной изданием Smartphone Checker совместно с авторитетным инсайдером OnLeaks, чьи прогнозы нередко подтверждаются перед официальными анонсами Samsung.

17.07 / 08:27

смартфоны аксессуары Транспорт Наушники HealingFit TWS не только воспроизводят музыку, но и помогают расслабиться

Компания MobiFren выпустила беспроводные наушники HealingFit TWS, которые сочетают привычные функции и систему микротоковой стимуляции.

Лента новостей

На главную страницу