Об этом же в других СМИ

habr.com / 1 год назад

TikTok рассматривает возможность строительства центра обработки данных в Финляндии стоимостью €1 млрд

cursorinfo.co.il / 1 год назад

habr.com / 1 год назад

Microsoft сокращает расходы на центры обработки данных — Oracle и CoreWeave получают выгоду

habr.com / 1 год назад

Yandex B2B Tech предоставила бизнесу доступ к опенсорсным нейросетям для обработки изображений

habr.com / 1 год назад

Канадский университет отменил конкурс по программированию из-за мошенничества студентов с использованием ИИ

Больше по теме

17.04.2025 - 07:43 / habr.com

ChatGPT-4.1: Революционный скачок в программировании и обработке длинного контекста

Компания OpenAI представила новое семейство моделей GPT-4.1 с впечатляющими улучшениями в области программирования, следования инструкциям и работы с длинным контекстом. Рассмотрим ключевые особенности новинок и их преимущества для разработчиков.

P.S кратко написал об этом в Телеграм канале, cсылка на пост

OpenAI выпустила сразу три модели: флагманскую GPT-4.1, более компактную GPT-4.1 mini и сверхлегкую GPT-4.1 nano. Все они значительно превосходят предыдущее поколение GPT-4o по ключевым показателям и поддерживают контекстное окно до 1 миллиона токенов. Обновленная база знаний моделей включает информацию до июня 2024 года.

GPT-4.1 демонстрирует выдающиеся результаты по трем ключевым направлениям:

Программирование: 54,6% на SWE-bench Verified, что на 21,4% лучше GPT-4o и на 26,6% лучше GPT-4.5

Следование инструкциям: 38,3% на MultiChallenge, превосходя GPT-4o на 10,5%

Длинный контекст: 72,0% на Video-MME в категории длинных видео без субтитров, что на 6,7% лучше GPT-4o

Особенно впечатляет GPT-4.1 mini, которая превосходит GPT-4o по многим показателям, при этом работая почти вдвое быстрее и стоит на 83% дешевле. GPT-4.1 nano, самая компактная модель в линейке, показывает отличные результаты при минимальных затратах ресурсов.

Пока что везде мысленно добавляем "якобы".

В области разработки ПО GPT-4.1 делает огромный шаг вперед. На бенчмарке SWE-bench Verified, измеряющем навыки реального программирования, новая модель выполняет 54,6% задач против 33,2% у GPT-4o.

Модель также значительно лучше работает с форматом diff при редактировании кода, более чем вдвое превосходя GPT-4o в Aider's polyglot diff benchmark и даже превосходя GPT-4.5 на 8%.

Компания Windsurf отмечает, что GPT-4.1 на 60% лучше справляется с их внутренним

самит крипто Nano Reuters

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

OpenAI o3 демонстрирует почти идеальную производительность в тесте с длинным контекстом habr.com / 1 год назад

Полезные продукты, которые вызывают резкие скачки сахара cursorinfo.co.il / 1 год назад

OpenAI запускает гибкую обработку данных для более дешевых и медленных задач habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

22.07 / 08:09

технологии общество экспедиция журналист школы Проект «Дни научного кино ФАНК» открывает бесплатный доступ к научным фильмам лекциям и квизам

Проект «Дни научного кино ФАНК» запускает бесплатную онлайн‑платформу «ДНК Онлайн». Платформа будет работать с 4 июля по 7 декабря 2026 года. «Дни научного кино ФАНК» реализуется при грантовой поддержке Министерства науки и высшего образования Российской Федерации в рамках Десятилетия науки и технологий. Дополнительную поддержку оказывают Московский институт психоанализа, компания «Норникель» и Российская академия наук.

22.07 / 08:09

технологии Apple санкции СМИ общество Правительство утвердило перевод всех служебных коммуникаций госслужащих на платформу «Макс» к 2030 году

Премьер-министр России Михаил Мишустин подписал распоряжение о переводе государственных и муниципальных служащих на платформу «Макс» к 2030 году. Документ опубликован на официальном портале правовых актов.

22.07 / 08:08

происшествия вода происшествие курьез Курьезный потоп в США – не обошлось без шеста для стриптиза (ВИДЕО)

Пострадавшая девушка призналась, что испытала сильный шок от случившегося происшествия. Она до последнего не верила в реальность аварии.

22.07 / 08:05

связь технологии смартфон самит электроэнергия Можно ли пользоваться телефоном во время зарядки: ответ экспертов

Современные смартфоны оснащены защитными системами, которые позволяют одновременно подключать их к сети и запускать приложения. Однако техническая возможность ещё не означает, что это полезно для аккумулятора. Если телефон не нужен срочно, лучше на время отложить его в сторону и дать ему зарядиться.

22.07 / 07:50

люди СМИ общество рубль электромобиль В России начались первые официальные отгрузки электромобилей «Атом»

Электромобиль «Атом» начали отгружать первым покупателям. Две машины были вручены 17 июля 2026 года. Об этом сообщил портал Drom со ссылкой на сообщение генерального директора АО «Кама» Игоря Поваразднюка. Кроме того, блогер и популяризатор российского импортозамещения Максим Горшенин заявил, что официально первым получил электромобиль в России.

22.07 / 07:45

дети общество самит психология психика 5 традиций родителей, с которыми дети растут близкими

Что на самом деле укрепляет доверие между родителями и детьми: опыт экспертов.

22.07 / 07:45

культура наука золото история Знаменитости О ней упоминают во многих летописях: в Перу обнаружили уникальную цитадель инков (фото)

Археологи в Перу сообщили о масштабном открытии в Южных Андах — они обнаружили древнюю крепость инков Такрачульо, площадь которой примерно в четыре раза превышает знаменитый Мачу-Пикчу. На территории комплекса исследователи зафиксировали сотни построек и нашли тысячи артефактов.

22.07 / 07:45

люди туризм самит курорт Знаменитости Загадочный объект на пляже Уэльса удивил туристов

Отдыхающие сравнивают загадочную инсталляцию с известным фантастическим фильмом. Объект напоминает монолит из знаменитой Космической одиссеи.

22.07 / 07:23

продукты технологии люди мозг стартап Китай провёл первую в мире коммерческую операцию по имплантации интерфейса «мозг–компьютер»

Китай провёл первую в мире коммерческую операцию с использованием инвазивного интерфейса «мозг–компьютер». Согласно заявлению Комиссии по науке и технологиям муниципалитета Шанхая, китайские хирурги имплантировали чип размером с монету пациенту с нарушением подвижности кисти, вызванным повреждением спинного мозга в результате автомобильной аварии, произошедшей 10 лет назад.

22.07 / 07:23

технологии Apple деньги общество рубль По опросу, рынок ИИ-поиска в России вырастет на фоне спроса на работу с закрытыми данными и корпоративными ИИ‑сервисами

Российский рынок ИИ-поиска в 2026 году может вырасти на 33%. Об этом сообщило издание «Ведомости» со ссылкой на проведённый среди разработчиков искусственного интеллекта опрос. Под ИИ‑поиском понимаются решения для поиска информации в интернете и во внутренних системах с помощью искусственного интеллекта.

Лента новостей

На главную страницу