




OpenAI представили новый флагман — GPT-5.5
OpenAI выпустила GPT-5.5 — новый флагман, который, по заявлению компании, помог оптимизировать собственный инференс-стек.
По словам компании, GPT-5.5 в кодинг-агенте Codex оптимизировала производительность: в частности, Codex проанализировал недели продакшн-трафика и написал алгоритм балансировки запросов между вычислительными ядрами GPU. После этого скорость генерации токенов в продакшне выросла больше чем на 20%.
GPT-5.5 и GPT-5.5 Pro сегодня появляются в ChatGPT и Codex для Plus, Pro, Business и Enterprise подписок; в API OpenAI обещает поставить модель в ближайшее время.
Это продолжение тренда, который компания обозначила еще с GPT-5.3-Codex в феврале, — тогда ранние версии модели помогали команде дебажить собственное обучение и анализировать результаты оценки. С GPT-5.5 вышел шаг крупнее: раньше запрос на GPU делился на фиксированное число кусков, что было неоптимально для реальных паттернов нагрузки. Теперь же схема динамическая, и код для нее написала сама модель через Codex.
Побочный эффект этой работы — задержки не выросли. Крупные модели обычно обслуживаются медленнее, но по задержке на токен GPT-5.5 в продакшне совпадает с GPT-5.4 при заметно более высоком уровне интеллекта. На тех же задачах в Codex новая модель использует меньше токенов, чем предшественница.
OpenAI приводит несколько примеров, где GPT-5.5 сделала то, что раньше не удавалось моделям. Внутренняя версия с кастомной обвязкой нашла новое доказательство давно известной асимптотической оценки для недиагональных чисел Рамсея — одного из центральных объектов комбинаторики; результат был формально проверен в Lean. Другой сюжет связан с кибербезопасностью. GPT-5.5 получила уровень High по кибербезопасности и биологии/химии в Preparedness Framework —
Читать на habr.com