Об этом же в других СМИ

habr.com / 4 месяца назад

Пока Stack Overflow угасает, для ИИ-агентов строят десятки аналогов

habr.com / 4 месяца назад

Релиз Trayy 3.0 — открытого приложения для Windows 10/11, которое расширяет возможности системного трея

habr.com / 4 месяца назад

Выпуск открытого проекта для создания и хранения в электронной библиотеке книг разного формата Calibre 9.3

habr.com / 4 месяца назад

Вышло обновление StaxRip 2.50.8 — открытой утилиты для Windows для кодирования видео/аудио с поддержкой HEVC, AVC и AV1

habr.com / 4 месяца назад

Cohere запустил семейство открытых моделей Tiny Aya для локальной работы

Больше по теме

05.02.2026 - 14:02 / habr.com

Вышла Qwen3-Coder-Next: модель с открытыми весами для кодинг-агентов

Команда Qwen представила Qwen3-Coder-Next — языковую модель с открытыми весами, разработанную специально для программирующих агентов и локальной разработки. Она построена на базе Qwen3-Next-80B-A3B-Base, в которой используется новая архитектура с гибридным механизмом внимания и MoE (Mixture of Experts, «смесь экспертов»). Qwen3-Coder-Next прошла масштабное агентное обучение на данных, включающих синтез исполняемых задач, взаимодействие со средой и обучение с подкреплением, благодаря чему получила сильные навыки программирования и агентного поведения при заметно более низкой стоимости инференса.

Вместо того чтобы полагаться только на масштабирование числа параметров, Qwen3-Coder-Next делает акцент на масштабировании обучающих сигналов для агентного поведения. Мы обучаем модель на больших коллекциях проверяемых задач по программированию, связанных с исполняемыми окружениями, чтобы модель могла учиться напрямую на обратной связи от среды. Это включает:

Продолженное предобучение на данных, ориентированных на код и работу агентов

Обучение с учителем на данных с высококачественными траекториями агента

Обучение специализированных экспертов по доменам (например, разработка ПО, QA, веб/UX)

Дистилляцию экспертов в единую модель, готовую к развёртыванию

Этот рецепт делает упор на рассуждения на длинном горизонте, использование инструментов и восстановление после сбоев при выполнении, что критично для реальных программирующих агентов.

Результаты на агентно-ориентированных бенчмарках

На рисунке ниже показаны результаты на нескольких широко используемых бенчмарках для программирующих агентов, включая SWE-Bench (Verified, Multilingual и Pro), TerminalBench 2.0 и Aider.

Рисунок показывает, что:

Qwen3-Coder-Next набирает более 70% на SWE-Bench

связь история курс кулинария

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

OpenAI запустила бенчмарк для ИИ-агентов по поиску уязвимостей в экосистеме Ethereum incrypted.com / 4 месяца назад

Выпуск обновления HopToDesk 1.45.8 — безопасного открытого решения для удалённого рабочего стола habr.com / 4 месяца назад

Флагманская модель MiniMax M2.5 для кодинга и агентных задач уже доступна бесплатно в KodaCode habr.com / 4 месяца назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

17.07 / 02:46

люди здоровье Здоровье и красота лечение питание Какие крупы помогают "чистить" кровь от токсинов и вредных веществ

Какие каши нужно включить в рацион, чтобы укрепить здоровье и улучшить самочувствие.

17.07 / 01:24

продукты google Google переименовала NotebookLM в Gemini Notebook: что изменилось после ребрендинга

Google официально переименовала свой сервис для исследований и работы с документами NotebookLM в Gemini Notebook. Компания объясняет, что новое название должно объединить продукт с остальной экосистемой Gemini, хотя сервис и дальше будет функционировать как отдельное приложение.

17.07 / 01:24

история общество netflix стриминг Шоу бизнес Netflix выпустил первый сезон "Очень странных дел" в формате VHS: сериал можно посмотреть в стиле 80-х

Netflix представил специальную VHS-версию первого сезона сериала "Очень странные дела" (Stranger Things). Несмотря на окончание истории, стриминговый сервис сделал ставку на ностальгию и предложил зрителям просмотр в духе домашних видеокассет 1980-х годов.

17.07 / 01:20

технологии экономика ученые культура наука Как читать мысли растений – новый сенсор изменит фермерство

Американские инженеры создали уникальные нательные сенсоры для агрокультур. Новая технология способна предупредить фермеров о болезнях растений.

17.07 / 00:50

здоровье продукты питания общество самит правильное питание Вместо кофе — почему перед спортзалом нужно понюхать шоколад

Новое исследование показало, что вдыхание аромата горького шоколада помогает сделать тренировку эффективнее и одновременно снижает чувство голода.

17.07 / 00:39

продукты YouTube reddit google gemini Google интегрировала Canva, YouTube Music и Instacart в режим AI Mode в своём поисковом сервисе

Google объявила о новых возможностях режима AI Mode в своём поисковом сервисе. Теперь пользователи в США могут подключать к нему Canva, YouTube Music и Instacart, чтобы выполнять различные задачи с помощью ИИ через поиск. Интеграции начали внедрять на этой неделе.

16.07 / 23:19

связь люди здоровье общество самит Количество кофе, которое может продлить жизнь, назвали ученые

Ученые проанализировали данные почти 450 тысяч человек и определили оптимальную ежедневную норму кофе

16.07 / 23:17

продукты Amazon экспорт Nvidia самит Google открыла k8s-aibom — контроллер Kubernetes для инвентаризации ИИ-нагрузок

Google Cloud опубликовала исходный код k8s-aibom — контроллера Kubernetes, который обнаруживает запущенные в кластере ИИ-компоненты и автоматически формирует ведомости компонентов машинного обучения в формате CycloneDX 1.6 ML-BOM. Инструмент собирает данные из фактического состояния кластера, поэтому способен находить в том числе нагрузки, которые не были зарегистрированы во внутренних системах компании.

16.07 / 22:38

технологии экономика общество В последнее время многие современные ноутбуки стали выходить без HDMI-порта

Производители ноутбуков стали чаще исключать порты HDMI из-за желания уменьшить размеры лэптопа и расширения возможностей USB-C, пишет журнал SlashGear.

16.07 / 21:57

Sony Разработчикам эмулятора KytyPS5 удалось запустить GTA V, Quake II и другие трёхмерные игры

Разработчики эмулятора PlayStation 5 KytyPS5 выпустили обновление, в котором им впервые удалось запустить GTA V, QuakeII и другие трёхмерные игры. Проекты запускаются с разной производительностью, но разработчики считают, что сейчас важно добиться максимальной совместимости.

Лента новостей

На главную страницу