Об этом же в других СМИ

habr.com / 1 год назад

Новая небольшая модель искусственного интеллекта Ai2 превосходит аналогичные по размеру модели от Google и Meta*

habr.com / 1 год назад

Xiaomi представляет MiMo-7B — компактную модель для решения математических задач и задач по кодированию

habr.com / 1 год назад

DeepSeek обновляет свою математическую модель искусственного интеллекта Prover

gagadget.com / 1 год назад

Индийские заводы Tata и Foxconn начинают выпуск iPhone моделей 16 и 16e

gagadget.com / 1 год назад

Вытеснить Китай: США готовят новый оборонный пакет для Саудовской Аравии на 100 млрд долларов

Больше по теме

17.04.2025 - 07:43 / habr.com

Вышла OpenAI GPT 4.1 — новая главная модель для программирования

Компания OpenAI представила новую линейку моделей GPT-4.1: GPT-4.1, GPT-4.1 mini и GPT-4.1 nano. Эти модели значительно превосходят предыдущие версии (GPT-4o и GPT-4o mini), особенно в программировании, следовании инструкциям и работе с большим контекстом (до 1 миллиона токенов). Обновление модели также включает актуализацию базы знаний до июня 2024 года.

Да, это тот самый загадочный Quasar, который случайно заметили на OpenRouter ещё неделю назад. А вот теперь карты вскрылись.

GPT-4.1 показывает рекордный результат 54,6% на SWE-bench Verified, улучшив показатели GPT-4o на 21,4%.

Лучше работает с diff-форматами (изменения в коде), что существенно сокращает время и затраты.

Меньше посторонних правок в коде (снижение с 9% до 2%).

Веб-приложения, созданные с помощью GPT-4.1, более функциональны и эстетичны. В 80% случаев пользователи предпочли результаты GPT-4.1 предыдущей версии GPT-4o.

Меня впечатлило следующее заявление от Windsurf:

GPT‑4.1 набрал на 60% больше баллов, чем GPT‑4o во внутреннем бенчмарке Windsurf по программированию, что сильно коррелирует с тем, как часто изменения кода принимаются после первой генерации. Их пользователи отметили, что GPT 4.1 был на 30% эффективнее в вызове инструментов и примерно на 50% менее склонен повторять ненужные правки или читать код слишком узкими, пошаговыми действиями.

GPT-4.1 значительно лучше следует сложным и многошаговым инструкциям, особенно на трудных заданиях.

Улучшена обработка негативных промптов, форматирование ответов и соблюдение точных требований (по формату или контенту).

На внутреннем тесте OpenAI (сложные инструкции) GPT-4.1 набрал 49% против 29% у GPT-4o.

Поддержка контекста до 1 миллиона токенов (ранее было до 128 тысяч).

Модели эффективно извлекают информацию («needle

технологии общество самит крипто токен Nano Reuters

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Новые языковые модели от OpenAI оставляют скрытые водяные знаки в сгенерированном тексте habr.com / 1 год назад

Состоялся релиз SkyReels V2 — открытой модели для генерации видео по текстовому описанию habr.com / 1 год назад

«Сбер» разработал и опубликовал первую в России модель для кибербезопасности искусственного интеллекта habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

16.07 / 13:05

технологии санкции общество политика самит Эксперты: санкции ЕС против VK и Max ударят по международному сотрудничеству, а не по работе сервисов

Евросоюз ввёл санкции против холдинга VK (ему принадлежат соцсети «Вконтакте» и «Одноклассники»), разработчика национального мессенджера Max (ООО «Коммуникационная платформа», тоже принадлежит VK), а также генерального директора компании Елены Багудиной. Решение опубликовали в официальном журнале ЕС 13 июля. Представитель VK заявил «Ведомостям», что санкции ЕС не влияют на работу VK и Мax. Приложения и сервисы доступны пользователям в привычном режиме, добавил он.

16.07 / 13:05

самит GitHub перестал работать в России

GitHub перестал работать в России — пользователи жалуются, что сервис недоступен без VPN.

16.07 / 13:05

дети творчество рубль Здоровье и красота сад и огород Владислав Бакальчук: маркетплейс М.Видео по итогам первого полугодия 2026 года увеличил оборот в 4 раза год к году

По итогам первого полугодия 2026 года оборот платформы превысил 17,7 млрд рублей, увеличившись в 4 раза по сравнению с аналогичным периодом прошлого года. Рост обеспечили расширение ассортимента, развитие новых категорий, увеличение количества партнеров-продавцов и устойчивый рост спроса как на электронику и бытовую технику, так и на товары повседневного спроса. Сегодня ассортимент маркетплейса М.Видео насчитывает более 900 тыс. SKU, что почти в шесть раз больше, чем годом ранее, а покупатели все чаще используют платформу для широкого спектра ежедневных покупок.

16.07 / 13:05

банк самит nintendo Software Doom запустили на консоли Casio Loopy

Автор YouTube-канала Throaty Mumbo презентовал порт классического шутера Doom на 32-битной консоли Casio Loopy, которая выходила на японском рынке в 1995-1996 годах. Игровая система была ориентирована на девочек-геймеров и получила всего 10 игр.

16.07 / 13:05

общество google В России полностью перестал быть доступен GitHub

Как показывает сервис detector404, с 10 утра по Москве GitHub почти полностью недоступен. Не проходит почти 100% сетевых соединений. В других странах подобные проблемы отсутствуют. На хостингах сервис также недоступен.

16.07 / 13:00

продукты люди ученые здоровье общество Какой популярный продукт может разрушать ДНК - исследование

Эксперты определили продукт, который наносит непоправимый вред здоровью, если есть его часто.

16.07 / 13:00

люди общество вирус фрукты Здоровье и красота Как правильно есть цитрусовые для максимальной пользы, рассказал врач

Чтобы получить максимальную витаминов, микроэлементов и антиоксидантов от цитрусовых, не выбрасывайте кожуру.

16.07 / 12:41

самит Casio выпустила в США две новые модели ударопрочных часов G-Shock в тонком металлическом корпусе и строгом дизайне

Casio представила на американском рынке две новые модели из серии премиальных ударопрочных часов G-Shock, которые входят в линейку G-Steel — GST-B1000BD-1A и GST-B1000BD-2A и вышли в Японии в мае. Главными особенностями новинок стали черное ионное напыление на деталях корпуса, минималистичный безель и существенно уменьшенная толщина по сравнению с классическими моделями G-Shock.

16.07 / 12:34

люди общество рак самит врачи Рак легких может начинаться не с кашля: врачи назвали тревожные призна

Некоторые признаки рака легких не связаны с дыханием, поэтому их нередко принимают за симптомы других заболеваний.

16.07 / 12:34

происшествия экономика оружие политика авианосец Бесславный финал: авианосец РФ превращается в металлолом после ремонта

РФ списывает единственный авианосец «Адмирал Кузнецов» на металлолом после 9 лет ремонта и затрат в 1 миллиард долларов, которые не дали результата.

Лента новостей

На главную страницу