Об этом же в других СМИ

habr.com / 6 месяцев назад

OpenAI наймёт нового руководителя отдела «обеспечения готовности ИИ»

habr.com / 6 месяцев назад

Генеральный директор OpenAI Сэм Альтман предсказал сверхчеловеческое влияние ИИ

gagadget.com / 6 месяцев назад

OpenAI делает ставку на аудио и готовит отдельное устройство с голосовым управлением

habr.com / 6 месяцев назад

Google догоняет OpenAI: веб-трафик Gemini вырос с 5% до 20%, ChatGPT упал до 68%

habr.com / 6 месяцев назад

OpenAI тестирует рекламные форматы для ChatGPT с использованием функции Memory

Больше по теме

15.12.2025 - 14:11 / habr.com

OpenAI представила GPT-5.2: ставка на долгие агентные сценарии и профессиональную автоматизацию

OpenAI анонсировала новое поколение своих фронтир-моделей. GPT-5.2 позиционируется как инструмент для сложной профессиональной работы: от агентных пайплайнов до многочасовых задач с длинным контекстом и мультимодальностью.

На SWE-Bench Pro, одном из самых жёстких тестов на реальную разработку, GPT-5.2 Thinking решает 55.6% задач против 50.8% у GPT-5.1. На упрощенной SWE-Bench Verified — 80%. Это означает меньше ручной доработки патчей, более стабильную работу с большими репами и уверенный переход от «вспомогательного ассистента» к инструменту, который может закрывать фичи и баги почти автономно.

Ранние тестеры особенно отмечают фронтенд: сложные интерфейсы, нетривиальные 3D-элементы и генерацию UI одним большим промптом. По факту GPT-5.2 впервые выглядит как полноценный инструмент для full-stack задач, а не просто кодогенератор.

GPT-5.2 Thinking заметно лучше работает с контекстами вплоть до 256k токенов. На MRCRv2 модель почти идеально извлекает нужную информацию, даже если она «утоплена» в сотнях тысяч токенов.

Практический эффект: можно грузить длинные договоры, многофайловые проекты, большие отчёты или переписки — модель не теряет нить, а ответы остаются консистентными. Более того, через новый compact-режим GPT-5.2 способна «думать» и за пределами окна, что важно для долгих агентных сценариев.

На Tau2-bench Telecom GPT-5.2 достигает 98.7% успешного использования инструментов. Причем даже в быстром режиме reasoning.effort='none' точность резко выросла.

Несколько компаний сообщили, что смогли заменить набор мелких агентов одним «мега-агентом» с 20+ тулзами.

Модель стала лучше понимать изображения: графики, дашборды, интерфейсы, технические схемы. Ошибок при интерпретации GUI стало меньше почти вдвое. На задачах «прочитай

самит курс крипто Enterprise pythonleader

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Коллективный иск писателей против OpenAI, Google, xAI и других за обучение ИИ на пиратских библиотеках habr.com / 6 месяцев назад

Asus представила ExpertCenter P500 Mini Tower — компактный и тихий ПК с Ryzen Hawk Point для корпоративных и профессиональных задач gagadget.com / 6 месяцев назад

OpenAI готовит рекламу в ChatGPT: модели будут приоритизировать спонсорский контент в ответах habr.com / 6 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

22.07 / 05:45

технологии наука история экспедиция доллар Без шансов на спасение: почему предстоящая экспедиция NASA в месяц может оказаться смертельной для космонавтов

Независимые аудиторы NASA обратили внимание на серьезную проблему программы Artemis. По их выводам, в случае чрезвычайной ситуации во время предстоящих пилотируемых миссий на Луну космическое агентство не будет иметь эффективного способа эвакуировать астронавтов.

22.07 / 05:36

общество выплаты Anthropic оставляет Claude Fable 5 в подписках Max и Team Premium, а пользователям Pro выплатит по $100 кредитов

Anthropic определилась с дальнейшей судьбой Claude Fable 5 после нескольких недель продлений доступа. Компания объявила, что с 20 июля модель станет постоянной частью подписок Max и Team Premium, однако использовать ее можно будет только в пределах 50% от доступного лимита.

22.07 / 05:36

технологии СМИ Nvidia рубль пресс-служба В «Яндексе» ответили на заявления Грефа о зависимости компании от китайского ИИ

В «Яндексе» опровергли слова председателя совета директоров «Сбербанка» Германа Грефа о том, что компания перестала разрабатывать собственные модели искусственного интеллекта и стала зависима от китайских решений типа Qwen от Alibaba.

22.07 / 05:36

связь люди Apple закон google Apple и Google придётся удалить в Калифорнии приложения, создающие людей без одежды

Власти города Сан-Франциско обязали Apple и Google удалить из своих магазинов приложений десятки сервисов с функцией создания людей без одежды. Законодательство штата Калифорния криминализует любую деятельность, которая «сознательно способствует» или «безрассудно помогает» создавать порнографию с использованием технологии дипфейк без согласия жертвы.

22.07 / 05:28

Apple история общество семья самит Apple показала, как Apple Watch спасли жизнь после тяжелого падения: часы сами вызвали экстренные службы

Видео опубликовано на официальном YouTube-канале Apple и демонстрирует реальный случай использования функции SOS и обнаружения падения. Компания регулярно рассказывает подобные истории, подчеркивая практическую пользу носимых устройств в критических ситуациях.

22.07 / 04:53

люди авиакатастрофа история общество эвакуация На глубине 600 метров нашли затонувший самолет с пассажирами (ВИДЕО)

Авиакатастрофа произошла вскоре после вылета из-за отказа моторов. Самолет быстро затонул из-за отсутствия слаженной эвакуации людей.

22.07 / 03:49

люди ученые общество самит человек Почему волосы бывают прямыми или кудрявыми - ответ ученых

Исследователи объяснили, с какими факторами связано появление прямых или кудрявых волос от рождения.

22.07 / 03:31

Nvidia общество политика самит изоляция Проект HAMi для виртуализации ускорителей перешел в инкубатор CNCF

Зачастую дорогие графические процессоры фрагментируются и простаивают. Классическая проблема — задача забирает видеокарту целиком, хотя в действительности использует лишь малую часть ее ресурсов. Как в таком случае эффективно распоряжаться кластером? Не забываем, что оборудование поставляется разными вендорами, каждый из которых предлагает свою модель управления.

22.07 / 03:12

мода и стиль Pulsar объявила дату запуска продаж игровой мыши Feinmann F01 Noctua Edition с кулером

Южнокорейская Pulsar представила итоговую версию игровой мыши Feinmann F01 Noctua Edition со встроенным в корпус вентилятором от бренда Noctua. Кулер направляет воздушный поток к ладони геймера во время длительных игровых сессий. Продажи периферийного устройства стартуют 21 июля 2026 года.

22.07 / 03:12

люди ученые здоровье человек кофе Кофе может помочь в борьбе со старением - исследование

Исследователи объяснили, какие свойства кофе являются наиболее эффективными в "войне" против старости.

Лента новостей

На главную страницу