Об этом же в других СМИ

habr.com / 2 месяца назад

ИИ, который не тупит: стартап Миры Мурати показал первый крупный проект

habr.com / 2 месяца назад

ИИ сам находит, сравнивает и оплачивает товары. В Китае запускают агентный шопинг

habr.com / 2 месяца назад

Opus 4.6 в 81% попыток сам «копирует себя» на чужой сервер через дыру в коде — исследование Palisade

habr.com / 2 месяца назад

DeepSeek V4 силен только в «своих» бенчмарках. На независимых — отстает на 8 месяцев

habr.com / 2 месяца назад

Три месяца назад Илон Маск называл Anthropic злом — а теперь отказался от своих слов и сдал им суперкомпьютер в аренду

Больше по теме

27.04.2026 - 03:25 / habr.com

Вышла GPT-5.5 — модель, которая сама создала часть своего инференса

OpenAI выпустила GPT-5.5 — новый флагман, который, по заявлению компании, помог оптимизировать собственный инференс-стек. По словам OpenAI, GPT-5.5 в кодинг-агенте Codex оптимизировала производительность: в частности, Codex проанализировал недели продакшн-трафика и написал алгоритм балансировки запросов между вычислительными ядрами GPU — после этого скорость генерации токенов в продакшне выросла больше чем на 20%. GPT-5.5 и GPT-5.5 Pro сегодня раскатываются в ChatGPT и Codex для Plus, Pro, Business и Enterprise пользователей; в API OpenAI обещает поставить модель в ближайшее время.

Это продолжение тренда, который компания обозначила еще с GPT-5.3-Codex в феврале, — тогда ранние версии модели помогали команде дебажить собственное обучение и анализировать результаты оценки. С GPT-5.5 шаг крупнее: раньше запрос на GPU делился на фиксированное число кусков, что было неоптимально для реальных паттернов нагрузки, — теперь схема динамическая, и код для нее написала сама модель через Codex.

Побочный эффект этой работы — задержки не выросли. Крупные модели обычно обслуживаются медленнее, но по задержке на токен GPT-5.5 в продакшне совпадает с GPT-5.4 при заметно более высоком уровне интеллекта. На тех же задачах в Codex новая модель использует меньше токенов, чем предшественница.

На бенчмарках GPT-5.5 обгоняет почти всех конкурентов. На Terminal-Bench 2.0, где оценивают агентные задачи в командной строке, модель берет 82,7% — против 69,4% у Claude Opus 4.7 и 68,5% у Gemini 3.1 Pro. На FrontierMath Tier 4 — 35,4% против 22,9% у Opus 4.7. На ARC-AGI-2 — 85,0%. Особенно заметен скачок на длинном контексте: на Graphwalks BFS с окном в миллион токенов модель выдает F1-метрику 45,4% против 9,4% у GPT-5.4. На SWE-Bench Pro — 58,6%, чуть

самит крипто токен Enterprise gemini runawayllm

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

o1 рассуждает, Claude пишет код: как ИИ-агенты сами ищут биомаркеры рака habr.com / 2 месяца назад

На 52,5% галлюцинаций меньше: вышла GPT-5.5 Instant habr.com / 2 месяца назад

«Станете самыми ненавистными людьми в США»: Маск угрожал директору OpenAI перед судом habr.com / 2 месяца назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

19.07 / 21:02

люди общество самит животный мир Зачем паукам 8 глаз, если они все равно плохо видят: ученые дали ответ

Исследователи рассказали, сколько глаз у пауков и почему в своей жизни они полагаются вовсе не на зрение.

19.07 / 19:59

происшествия дети общество отдых Здоровье и красота ТОП-5 ошибок в бассейне, которые делают даже опытные пловцы

Даже неправильное ныряние в воду может представлять большую угрозу для организма, предупреждают врачи.

19.07 / 19:59

ученые животные история животный мир Шоу бизнес Биологический франкенштейн: чем утконос удивил ученых

Первую шкуру этого существа в Британском музее посчитали фальшивкой, сшитой ради шутки. Сегодня генетики признают его настоящим эволюционным чудом.

19.07 / 19:26

Samsung здоровье закон общество Qualcomm Samsung Galaxy Watch 9 полностью раскрыли до анонса: появились изображения, характеристики и неожиданный процессор

За три дня до официальной презентации в сети произошла одна из крупнейших утечек, посвященных Samsung Galaxy Watch 9. Авторитетный инсайдер Эван Бласс (Evan Blass), известный под псевдонимом Evleaks, опубликовал серию маркетинговых изображений будущих умных часов, благодаря которым стали известны их дизайн, цветовые варианты, аппаратная платформа и ряд новых функций для здоровья.

19.07 / 19:01

ученые животные культура история общество Загадка циклопов раскрыта — что породило миф

Окаменелости древних животных, живших на островах Средиземноморья сотни тысяч лет назад, древние греки могли ошибочно принять за останки одноглазых великанов.

19.07 / 18:16

технологии мода история самит интересное Google Pixel 11a может получить флагманский Tensor G6: появилась неожиданная утечка характеристик

В данный момент речь идет именно об утечке, а не об официальной информации Google. Источником выступил известный инсайдер Mystic Leaks, который ранее уже публиковал достоверные сведения о будущих устройствах компании. Часть информации также косвенно совпадает с более ранними утечками о линейке Pixel 11, что делает новые данные более правдоподобными, хотя окончательные характеристики могут измениться до релиза.

19.07 / 17:48

продукты технологии президент конференция самит Встречайте: NaviX Ultra — первый в мире смартфон с интегрированным AI-агентом на уровне OS от Nubia

Nubia, как и обещала несколько ранее, рамках Всемирной конференции по искусственному интеллекту (WAIC 2026), которая проходит в Шанхае, официально представила первый в мире смартфон с AI-агентом, интегрированным на уровне операционной системы.

19.07 / 17:48

технологии общество самит токен JOYROOM выпустила пауэрбанк на 240 Вт, который одновременно заряжает два ноутбука

Компания JOYROOM представила внешний аккумулятор PODIX PR70 с общей выходной мощностью 240 Вт, двумя встроенными кабелями и парой цветных экранов. Новинка рассчитана на одновременную зарядку до четырех устройств, включая ноутбуки, смартфоны, дроны, наушники и умные часы. Продажи стартовали на Kickstarter, а цена для первых участников кампании составит $79.

19.07 / 17:10

происшествия дети женщина дети и родители Полиция Лучше умру – невестка напала на свекровь из-за отказа нянчить внуков

В Китае невестка жестоко избила свекровь за отказ сидеть с внуками ради свидания. Инцидент вызвал скандал и грозит женщине уголовным делом.

19.07 / 16:28

связь технологии общество самит AMD Beelink представила ME Pro 370 — мини-ПК и NAS в одном устройстве с Ryzen AI 9 HX 370 и хранилищем до 132 ТБ

Компания Beelink официально анонсировала необычное устройство ME Pro 370, которое объединяет возможности производительного мини-ПК под управлением Windows и полноценного сетевого хранилища (NAS). Новинка построена на базе флагманского процессора AMD Ryzen AI 9 HX 370, поддерживает до 256 ГБ оперативной памяти и может вместить до 132 ТБ данных в старшей конфигурации.

Лента новостей

На главную страницу