Об этом же в других СМИ

habr.com / 1 месяц назад

DeepSeek V4 запустил ценовую войну в Китае: Xiaomi срезала цены на API до 99%

habr.com / 1 месяц назад

Вышел SWE-Marathon: бенчмарк, где агенты часами пишут код — и почти никто не доходит до финиша

habr.com / 1 месяц назад

DeepSeek привлекает $7,4 млрд — цена компании всего 5% от стоимости OpenAI и Anthropic

habr.com / 1 месяц назад

ИИ пишет код, чтобы искать в разы эффективнее: новая технология Perplexity

gagadget.com / 1 месяц назад

DeepSeek готовит раунд на 59 миллиардов долларов: как китайский ИИ «отрезвил» Кремниевую долину

Больше по теме

25.05.2026 - 19:14 / habr.com

OpenClaw на базе DeepSeek сам переписал свой код — и стал работать в 2,4 раза лучше

Китайские исследователи представили MOSS — систему, в которой ИИ-агент переписывает собственный исходный код, а не промпты или скиллы. На тестах с OpenClaw на базе DeepSeek V3.2 средний скор на четырех задачах вырос с 0.25 до 0.61 за одну итерацию без участия человека — при пороге прохода в 0.75.

Современных ИИ-агентов можно разделить на три уровня: сама модель, обвязка из кода вокруг нее (harness) и текстовые артефакты — промпты, скиллы, схемы памяти. Сейчас пользователь может дорабатывать только артефакты, что заметно ограничивает возможности ИИ-агента. Поменять веса модели сложно, поэтому авторы MOSS взялись за обвязку — роутинг сообщений, порядок срабатывания хуков, управление сессией, и т. д. Логика простая: если баг живет в коде, а не в тексте, никакая правка промпта до него не достанет. MOSS — первый, кто лезет именно туда.

Работает он так. Когда пользователь жалуется в чате на плохой ответ или фоновый сканер сам находит проблемные сессии, формируется батч провалов. Дальше запускается конвейер:

диагностика проблемы;

план фикса и его ревью;

написание кода и его ревью;

проверка результата;

финальный вердикт.

По итогам проверки редактирование кода делает внешний кодинг-агент — на выбор Claude Code, Codex, DeepSeek-TUI или OpenCode. Кандидата проверяют на временных контейнерах с тем же образом, что пойдет в продакшен. Если все нормально, агент сам сообщает пользователю в чате, что готов обновиться, и после согласия фоновый процесс выполняет обновление.

В контрольном тесте на четырех задачах из бенчмарка claweval (аудит SLA и проверка цепочек пополнения склада) базовый OpenClaw показывал скор 0.21–0.33 при пороге прохода 0.75. Агент сам нашел проблему: внутренний посредник, который собирает результаты нескольких инструментов,

общество самит Claude Code runawayllm eps

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Вышел Claude Opus 4.8 — модель в 4 раза реже пропускает свои же баги habr.com / 1 месяц назад

Robinhood допустил ИИ-агентов к торгам акциями — и сам предупредил, что они могут слить счет habr.com / 1 месяц назад

«Невыездные» из-за ИИ: топ-менеджерам Alibaba и DeepSeek закрыли свободный выезд habr.com / 1 месяц назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

17.07 / 10:05

продукты здоровье самит Здоровье и красота напитки Как кофе помогает худеть и насколько это безопасно

Исследования подтверждают, что кофе ускоряет метаболизм и на самом деле помогает организму сжигать подкожный жир.

17.07 / 10:00

связь технологии происшествия Telegram общество Дуров купил t.you в дополнение к t.me

15 июля 2026 года Павел Дуров сообщил, что купил для мессенджера Telegram домен для коротких ссылок t.you в дополнение к t.me. У регистратора этого домена отмечено, что он уже занят, но в сервисе whois пока нет данных об этом событии.

17.07 / 10:00

технологии Релиз композитного сервера Weston 16.0

В середине июля 2026 года состоялся релиз композитного сервера Weston 16.0. В рамках этого открытого проекта развиваются технологии, содействующие появлению полноценной поддержки протокола Wayland в Enlightenment, GNOME, KDE и других пользовательских окружениях. Выпуск Weston 14.0 случился в сентябре 2024 года. Версия Weston 15.0 вышла в феврале 2026 года.

17.07 / 09:57

происшествия ученые здоровье общество семья Что больше всего влияет на продолжительность жизни, выяснили ученые

Что сокращает жизнь больше, чем неправильное питание или отсутствие физических нагрузок, рассказали специалисты.

17.07 / 09:57

общество самит звезда инопланетяне интересное Планету, где могут прятаться инопланетяне, обнаружили ученые

Исследователи обнаружили загадочную «суперземлю» с идеальными условиями для развития жизни.

17.07 / 09:57

связь технологии люди смартфон общество Какая привычка со смартфоном портит память даже у молодых людей

Ученые объяснили, как смартфон и информация, которая в нем хранится, может влиять на нашу память.

17.07 / 09:53

наука история космос экзопланеты звезда Жизнь? Астрономы впервые нашли атмосферу на потенциально обитаемой планете

Астрономы обнаружили атмосферу на тщательно изученной, потенциально обитаемой «суперземле», получившей название LHS 1140 b. Это первый в истории случай обнаружения атмосферы на каменистой планете в обитаемой зоне другой звезды, заявили ученые.

17.07 / 09:50

продукты экономика SpaceX общество google BingX отчиталась о росте направления TradFi и запуске EventX во II квартале 2026 года

Криптобиржа BingX опубликовала итоги работы за II квартал 2026 года. Компания сообщила о росте направления TradFi, запуске новых продуктов и расширении мультиактивной торговой экосистемы. Об этом Incrypted сообщили в компании. По словам представителей платформы, в течение квартала компания расширила доступ пользователей к мировым финансовым рынкам благодаря стремительному развитию направления TradFi, запуску новых продуктов и дальнейшим инвестициям в совершенствование торговой инфраструктуры. Рост популярности мультиактивной торговли Во II квартале одним из ключевых направлений развития BingX стала торговля активами традиционного финансового рынка. На м

17.07 / 09:50

google Ethereum usdt Объем токенизированных активов на BNB Chain достиг рекорда

По данным Token Terminal, совокупная стоимость токенизированных активов в сети BNB Chain впервые превысила $19 млрд по состоянию на июль 2026 года, установив исторический максимум. Крупнейшим сегментом остаются стейблкоины, где лидирует USDT с предложением $9,2 млрд, тогда как USD1 от World Liberty Financial уже занимает второе место с $1,7 млрд. Кроме того, сеть продолжает укреплять позиции в сфере токенизированных фондов, акций и товаров, сокращая отставание от Ethereum в нескольких категориях. В частности, токенизированные акции на BNB Chain уже превысили $620 млн, а сектор токенизированных фондов вырос до $3,6 млрд. BNB Chain нарастила объем токенизированных активов до $2 млр

17.07 / 09:36

Tesla история общество предприятия От Model S до Optimus: Tesla меняет вектор своего производства

На месте производственной линии Tesla в Фримонте, где 14 лет собирали Model S и Model X, компания начинает реализацию проекта по созданию робота-гуманоида.

Лента новостей

На главную страницу