Об этом же в других СМИ

habr.com / 4 месяца назад

Synopsys представила новые инструменты для проектирования AI-чипов

habr.com / 4 месяца назад

В Autodesk Flow Studio появились инструменты для генерации 3D-объектов

habr.com / 4 месяца назад

Anthropic выпустила инструмент для проверки ИИ-кода

habr.com / 4 месяца назад

OpenAI покупает стартап Promptfoo для защиты AI-агентов

habr.com / 4 месяца назад

OpenAI выпустила ИИ-агента для поиска уязвимостей — он уже нашел баги в OpenSSH, GnuTLS и Chromium

Больше по теме

23.02.2026 - 06:55 / habr.com

OpenAI и Paradigm представили инструмент для оценки навыков ИИ в защите смарт-контрактов

Компания OpenAI совместно с Paradigm представила EVMbench - бенчмарк для оценки способности ИИ-агентов выявлять, исправлять и эксплуатировать бреши в смарт-контрактах.

Инструмент основан на 120 отобранных уязвимостях из 40 аудитов. Большинство примеров взяты из открытых платформ по анализу кода. Также он включает несколько сценариев атак из проверки безопасности блокчейна Tempo - специализированной сети первого уровня, разработанной Stripe и Paradigm для высокопроизводительных и недорогих платежей в стейблкоинах.

Интеграция с Tempo позволила добавить в бенчмарк платежные смарт-контракты - сегмент, где ожидается активное применение «стабильных монет» и ИИ-агентов.

«Смарт-контракты защищают криптоактивы на сумму более $100 млрд. По мере того, как ИИ-агенты совершенствуются в чтении, написании и исполнении кода, становится все важнее измерять их возможности в реальных экономических условиях и поощрять использование искусственного интеллекта в защитных целях - для аудита и укрепления уже развернутых протоколов», - говорится в анонсе.

Для создания тестовой среды OpenAI адаптировала существующие эксплойты и скрипты, предварительно убедившись в их практической применимости.

EVMbench оценивает три режима возможностей:

Detect - обнаружение уязвимостей;

Patch - устранение проблем;

Exploit - использование для кражи средств.

OpenAI протестировала передовые модели во всех трех режимах. В категории Exploit модель GPT-5.3-Codex достигла 72,2%, GPT-5 - 31,9%. При этом показатели обнаружения и исправления уязвимостей оказались скромнее - многие проблемы по-прежнему сложно находить и устранять.

В Detect ИИ-агенты иногда останавливаются после нахождения одной уязвимости вместо проведения полного аудита. В режиме Patch им пока сложно закрывать

технологии Блокчейн крипто mefdayy Microsoft

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Осенью Apple может представить гаджет для управления умным домом ilenta.com / 4 месяца назад

Релиз NWinfo 1.6.1 — открытого портативного инструмента для быстрого просмотра ключевых характеристик ПК на Windows habr.com / 4 месяца назад

Выпуск обновления открытого инструментария для загрузки прошивок Fwupd 2.0.20 habr.com / 4 месяца назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

14.07 / 22:14

технологии Apple прогноз журналист предприятия Поставщики Apple завершили подготовку к производству iPhone 20

В новой публикации инсайдер сообщил, что для юбилейной модели Apple выбрала концепцию «возвращения к стеклу». По его словам, качество изготовления устройства должно соответствовать уровню первого поколения iPhone Air.

14.07 / 22:06

продукты медицина люди здоровье общество Почему эксперты просят избегать солнцезащитных спреев

Эксперты выяснили, что популярные аэрозоли могут вредить здоровью. Узнайте, какие три опасных компонента не должны быть указаны на упаковке вашей косметики.

14.07 / 21:13

происшествия люди общество самит животный мир Живут в каждом доме: действительно ли пауки-сенокосцы смертельно ядовиты

Пауки-сенокосцы встречаются по всему миру, населяя разнообразные среды и в частности жилища людей. Они имеют длинные, тонкие лапки, благодаря которым они кажутся намного больше, чем есть на самом деле. Однако с их ядом не все так просто.

14.07 / 19:45

люди ученые общество самит психология Почему прошлое кажется лучше настоящего - ответ ученых

Особенности человеческой памяти заставляют многих воспринимать прошлое более счастливым, чем оно было на самом деле.

14.07 / 19:45

здоровье продукты питания общество семья Здоровье и красота Дешевле и полезнее лосося – ученые назвали неожиданный суперфуд

Врачи рекомендуют сочетать разные источники ценных жиров. Ореховая добавка не должна полностью вытеснять рыбу из меню.

14.07 / 19:44

Samsung технологии Xiaomi история жертва Xiaomi представила Redmi Note 17 и 17 Pro — производительность, память и камеры принесены в жертву доступности, но батареи впечатляют

На рынке бюджетных смартфонов появилось интересное, хотя и весьма компромиссное пополнение. Xiaomi официально представила Redmi Note 17 и Redmi Note 17 Pro, о которых в последние дни ходило множество слухов.

14.07 / 19:36

люди закон общество политика Советская электроника. Встреча основателей двух удивительных Музеев

Сегодня состоялась знаменательная встреча двух замечательных людей. Эти два человека живут в городе Чебоксары. Оба, практически в одно и то же время, основали два музея и ничего до февраля сего года не знали друг о друге.

14.07 / 19:36

общество рубль НДС авиакомпания «Аэрофлот» закупил 200 серверов Yadro для обновления ИТ-инфраструктуры

Компания «Аэрофлот» приобрела у производителя вычислительной техники и электроники Yadro, которая входит в «ИКС Холдинг», 200 серверов Yadro V240 G3. Информация о поставке опубликована на сайте вендора.

14.07 / 19:36

технологии общество самит Специалист по ИБ показал, что копию дверного ключа можно создать за 10 минут по фотографии, опубликованной в соцсетях

Специалист по кибербезопасности и этичный хакер Эван Оттингер показал, что копию дверного ключа можно быстро воссоздать по анализу фотографии, опубликованной в социальных сетях.

14.07 / 19:36

технологии закон Telegram общество политика Дуров: Евросоюз становится банановой республикой, Telegram не будет сканировать ваши личные сообщения

Павел Дуров сравнил Евросоюз с банановыми республиками из-за закона о слежке за публикациями пользователей в интернете и сетевых сервисах.

Лента новостей

На главную страницу