OpenAI выпустили технический отчет новой GPT-4.5: чем она лучше предшественников?
Сегодня OpenAI выпускают новую модель GPT-4.5 (трансляция тут), а вместе с ней и технический отчет. Давайте узнаем, что улучшилось в GPT-4.5 по сравнению с предыдущими моделями компании.
GPT‑4.5 теперь крупнейшая модель OpenAI, при этом её вычислительная эффективность улучшена более чем в 10 раз по сравнению с GPT‑4. Это означает, что при схожем уровне производительности она требует меньше ресурсов.
Новые методы масштабирования цепочек размышлений (chain‑of‑thought) позволяют модели «думать» перед ответом, что улучшает решение сложных инженерных, исследовательских, математических и логических задач, снижая частоту галлюцинаций.
В GPT‑4.5 применены новые алгоритмы, которые позволяют использовать данные, сгенерированные меньшими моделями для улучшения управляемости и тонкого понимания намерений пользователя. Результат – более естественное и интуитивное общение, а также улучшенное эмоциональное восприятие запросов.
Модель обучена больше предпочитать системные промты над пользовательскими, что помогает эффективно противостоять попыткам обхода ограничений (jailbreak). При конфликте системного и пользовательского промта, GPT‑4.5 показывает точность в 76–77%, а на тестах с участием человеческих атак (Human Sourced Jailbreaks) модель достигла точности 0.99 по сравнению с 0.97 у GPT‑4o.
В тесте по отказу показывать небезопасный контент у GPT‑4.5 показатель «not_unsafe» равен 0.99 (по сравнению с 0.98–0.99 у предыдущих версий). Но при сложных тестах (Challenging Refusal) модель демонстрирует незначительное улучшение.
В тесте PersonQA (проверка на галлюцинации) точность ответов выросла с 28% (GPT‑4o) и 55% (o1) до 78% у GPT‑4.5, а частота галлюцинаций снизилась с 52% до 19%.
GPT‑4.5 способна выполнять задачи с 50%-ной надежностью в
Читать на habr.com

