Вышла OpenAI GPT 4.1 — новая главная модель для программирования
Компания OpenAI представила новую линейку моделей GPT-4.1: GPT-4.1, GPT-4.1 mini и GPT-4.1 nano. Эти модели значительно превосходят предыдущие версии (GPT-4o и GPT-4o mini), особенно в программировании, следовании инструкциям и работе с большим контекстом (до 1 миллиона токенов). Обновление модели также включает актуализацию базы знаний до июня 2024 года.
Да, это тот самый загадочный Quasar, который случайно заметили на OpenRouter ещё неделю назад. А вот теперь карты вскрылись.
GPT-4.1 показывает рекордный результат 54,6% на SWE-bench Verified, улучшив показатели GPT-4o на 21,4%.
Лучше работает с diff-форматами (изменения в коде), что существенно сокращает время и затраты.
Меньше посторонних правок в коде (снижение с 9% до 2%).
Веб-приложения, созданные с помощью GPT-4.1, более функциональны и эстетичны. В 80% случаев пользователи предпочли результаты GPT-4.1 предыдущей версии GPT-4o.
Меня впечатлило следующее заявление от Windsurf:
GPT‑4.1 набрал на 60% больше баллов, чем GPT‑4o во внутреннем бенчмарке Windsurf по программированию, что сильно коррелирует с тем, как часто изменения кода принимаются после первой генерации. Их пользователи отметили, что GPT 4.1 был на 30% эффективнее в вызове инструментов и примерно на 50% менее склонен повторять ненужные правки или читать код слишком узкими, пошаговыми действиями.
GPT-4.1 значительно лучше следует сложным и многошаговым инструкциям, особенно на трудных заданиях.
Улучшена обработка негативных промптов, форматирование ответов и соблюдение точных требований (по формату или контенту).
На внутреннем тесте OpenAI (сложные инструкции) GPT-4.1 набрал 49% против 29% у GPT-4o.
Поддержка контекста до 1 миллиона токенов (ранее было до 128 тысяч).
Модели эффективно извлекают информацию («needle
Читать на habr.com
