Об этом же в других СМИ

habr.com / 2 месяца назад

«Сбер» представил модель для редактирования и создания изображений Kandinsky 6.0 Image

habr.com / 2 месяца назад

OpenAI снова убила Codex – GPT-5.5 навсегда поглотила отдельную модель для кодинга

habr.com / 2 месяца назад

xAI выпустила флагманскую голосовую модель для реального общения

habr.com / 2 месяца назад

DeepSeek выпустил V4 — открытую модель с контекстом в миллион токенов

habr.com / 2 месяца назад

OpenAI против OpenAI: компания открыла модель для защиты данных от ChatGPT

Больше по теме

10.04.2026 - 15:06 / habr.com

GLM-5.1: Z.ai представила открытую модель для длинных агентных задач и сложной разработки кода

Z.ai представила GLM-5.1 — новое флагманское поколение своей модели для агентной разработки. По заявлению компании, модель заметно прибавила именно в задачах программирования по сравнению с предыдущей версией.

Судя по опубликованным результатам, GLM-5.1 показывает лучший на текущий момент результат на SWE-Bench Pro, а также с большим отрывом опережает GLM-5 на NL2Repo, где оценивается генерация репозиториев, и на Terminal-Bench 2.0, который проверяет работу модели в реальных терминальных сценариях.

Разработчики делают акцент не только на качестве первого ответа, но и на работе модели вдолгую. По их словам, многие предыдущие модели, включая GLM-5, быстро упираются в потолок: сначала дают быстрый прирост, а затем почти перестают улучшать результат, даже если дать им больше времени.

GLM-5.1, как утверждает Z.ai, лучше приспособлена к длинным агентным сценариям. Модель дольше сохраняет продуктивность в многошаговых задачах: разбивает проблему на части, проводит эксперименты, анализирует результаты, находит ограничения и корректирует стратегию по ходу работы. За счет этого она может улучшать решение на протяжении сотен итераций и тысяч вызовов инструментов.

Этот подход компания показывает на трех типах задач: оптимизации векторного поиска с одной числовой метрикой, бенчмарке GPU-ядер с измеряемым ускорением и открытой задаче по созданию веб-приложения, где модель сама определяет, что именно стоит улучшать дальше.

В первом сценарии разработчики взяли VectorDBBench — открытый бенчмарк, где модели нужно по заготовке на Rust собрать производительную векторную базу для приближенного поиска ближайших соседей. В стандартной версии теста на чтение и правку файлов, сборку, тесты и профилирование дается 50 вызовов инструментов, а итог

самит

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Playmaji представила USB-устройство для оцифровки физических копий ретро-игр Polymega Remix habr.com / 2 месяца назад

Kimi выпустили открытую модель K2.6 для долгих задач по программированию habr.com / 2 месяца назад

OpenAI выпустила GPT-Rosalind: модель для создания лекарств обошла 95% экспертов в задаче по РНК habr.com / 2 месяца назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

14.07 / 13:23

дети общество самит психология гаджет Откройте, свои: 10 безумных привычек из детства 1970-х

Полвека назад дети пользовались безграничной автономией во время прогулок. Родители не контролировали каждый шаг своих наследников.

14.07 / 13:23

продукты происшествия здоровье семья самит Семь привычных вещей, которые могут оказаться смертельно опасными

Даже обычные повседневные вещи могут стать источником серьезной угрозы, если не соблюдать простые меры предосторожности.

14.07 / 13:23

продукты связь люди общество вредные продукты Перец чили – врач объяснила, стоит ли добавлять острое в рацион

Регулярное употребление перца чили может способствовать увеличению продолжительности жизни.

14.07 / 13:01

курс google крипто токен coinbase CEO Coinbase признал провал creator coins

CEO биржи Coinbase Брайан Армстронг признал тот факт, что концепция creator coins или content coins фактически провалилась. Ранее компания, а также команда ее сети Base столкнулась с критикой из-за поддержки таких активов и нарратива SocialFi-экономики. Что это за токены? Creator coins — это цифровое представление определенных публикаций известных авторов, которым можно торговать. Такие активы набрали популярность на фоне интеграции проекта Zora Protocol в суперапп Base App в июле 2025 года. Base App и Zora: как суперапп от Coinbase вдохнул второе дыхание в Soci

14.07 / 12:54

Lego анонсировала новый набор по космической тематике — реплику телескопа «Хаббл»

Lego анонсировала новый набор Hubble Space Telescope (#11382) — реплику орбитального телескопа из 1252 деталей. Продажи стартуют 1 августа, цена составит $140 (около 11 тысяч рублей). Набор входит в серию Icons и рассчитан на покупателей от 18 лет.

14.07 / 12:54

экономика эфир Вебинар: узнайте, как использовать S3-совместимое объектное хранилище в связке с Postgres Pro

14 июля в 12:00 обсудим все: от резервного копирования через pg_probackup и S3 Selectel до хранения паркетных данных с pg_axe и результатов TPC-тестов. А еще сравним производительности S3 и локальных дисков, разберемся во влиянии сетевой архитектуры на скорость работы и оценим экономику хранения данных в разных моделях. После вебинара вы узнаете лучшие практики эксплуатации в продакшн-средах.

14.07 / 12:54

продукты технологии президент политика саммит ГК «Элемент» заключила соглашение о подготовке кадров в сфере микроэлектроники во Вьетнаме

Группа компаний (ГК) «Элемент» будет готовить специалистов по микроэлектронике и наноэлектронике во Вьетнаме. НИИ молекулярной электроники (НИИМЭ, входит в ГК «Элемент») подписал соглашение с Народным комитетом Ханоя, Ханойским университетом науки и технологий, а также вьетнамскими компаниями G‑Group и National Security Technology. Об этом сообщили «Ведомостям» со ссылкой на генерального директора НИИМЭ.

14.07 / 12:41

продукты люди здоровье человек Здоровье и красота Лучший продукт для спасения от жары назвали диетологи

По словам диетологов, правильный перекус летом помогает избежать обезвоживания и чувства тяжести после еды.

14.07 / 12:41

животные самит гигиена кошка животный мир Худшее место для кошачьего лотка в дома назвали эксперты

Правильный выбор места для кошачьего туалета убережет дом от грязи. Ветеринары назвали идеальные и самые худшие зоны для лотка.

14.07 / 12:39

NASA самит звезда интересное Дом и интерьер Млечный Путь оказался шире: рентгеновское «эхо» отодвинуло границы нашей галактики

Рисовать карту собственной галактики — это как пытаться составить план огромного поместья, не выходя из ванной комнаты из-за заклинившей двери. Поскольку Солнечная система расположена глубоко внутри диска Млечного Пути, мы вынуждены смотреть на свой «дом» изнутри, пробираясь сквозь густые облака пыли и газа. Однако астрономы нашли способ использовать космические катастрофы как гигантскую рулетку.

Лента новостей

На главную страницу