Об этом же в других СМИ

habr.com / 11 месяцев назад

Сервис «VK Доска» получил новый раздел «Избранное», быстрый переход к элементам по ссылке и цветовые инструменты

cursorinfo.co.il / 11 месяцев назад

Назван напиток, способный замедлить старение, который каждый день присутствует в рационе

habr.com / 11 месяцев назад

Инструмент для обхода проверки требований Windows 11 получил новое название и функцию OOBE

habr.com / 11 месяцев назад

Инструмент Google использовали для удаления из поиска информации о гендиректоре одной компании

gagadget.com / 11 месяцев назад

В Украине заработала онлайн-платформа DroneState - инструмент для координации дроновой отрасли

Больше по теме

17.07.2025 - 04:28 / habr.com

ИИ-инструменты замедляют опытных разработчиков: результаты исследования METR

METR провела контролируемое исследование с участием опытных разработчиков (правда только на 16-ти), которые решали реальные задачи по программированию. Участники были разделены на две группы:

Одна группа использовала ИИ-инструменты, такие как Cursor и Claude.

Другая работала без ИИ.

Задачи включали разнообразные сценарии из открытого ПО, чтобы отразить реальные условия работы. Время выполнения измерялось точно, а разработчики оценивали свою производительность субъективно.

Когда ребята подвели итоги, они выделили три ключевых фактора:

Замедление вместо ускорения: Среднее время на задачу увеличилось на 19% при использовании ИИ.

Самообман: Участники с ИИ переоценивали свою скорость, предполагая ускорение на 20%.

Качество кода: Несмотря на замедление, качество кода не пострадало значительно, но и не улучшилось заметно.

Использование ИИ может вводить в заблуждение, создавая иллюзию продуктивности, в то время как реальное время тратится на корректировку подсказок и проверку результатов.

Итерации с промптами: Разработчики тратили много времени на доработку запросов к ИИ, чтобы получить полезный ответ.

Проверка вывода: ИИ часто генерирует код с ошибками, требующий дополнительной отладки.

Переоценка инструментов: Опытные разработчики, привыкшие к самостоятельной работе, не всегда эффективно интегрируют ИИ в свой workflow.

В отчете METR отмечается, что эти результаты относятся к текущим инструментам (на момент исследования в 2025 году) и могут измениться с развитием технологий.

Это не первый случай, когда ИИ показывает неоднозначные результаты. Например, в задачах по анализу кода или генерации, ИИ иногда ускоряет новичков, но замедляет экспертов. METR подчеркивает важность эмпирических тестов: "Мы рекомендуем читать полный отчет или тред с

технологии общество Twitter

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Google представил ИИ-инструмент "Эней" для расшифровки древних текстов: как он будет работать obozrevatel.com / 11 месяцев назад

Грибы, которые приостанавливают старение - неожиданные результаты исследования cursorinfo.co.il / 11 месяцев назад

В каком возрасте люди чувствуют себя наиболее несчастными - неожиданные результаты исследования cursorinfo.co.il / 11 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

15.07 / 11:10

технологии Amazon google Утечка раскрыла цены и характеристики серии Google Pixel 11: сколько будут стоить все модели в США

После публикации рендеров Pixel 11, Pixel 11 Pro, Pixel 11 Pro XL и Pixel 11 Pro Fold стали известны предполагаемые цены устройств для американского рынка, а также часть их технических характеристик. Согласно данным издания Droid Life, которое обнаружило уже удаленные страницы товаров на Amazon, Google может отказаться от базовой версии с 128 ГБ памяти. Если информация подтвердится, все модели линейки будут стартовать с накопителя объемом 256 ГБ.

15.07 / 11:06

продукты здоровье Здоровье и красота лечение питание Какие ошибки в питании могут привести к диабету

Диабет 2 типа часто связан с нездоровым образом жизни, в частности неправильным питанием.

15.07 / 11:06

продукты Здоровье и красота биологи гигиена мода и стиль Как сохранить молодость после 40 лет - ТОП полезных привычек

Эксперты рассказали, как правильно ухаживать за собой, чтобы долго оставаться молодой.

15.07 / 11:06

Путешествия туризм общество отпуск самолет Туристы допускают распространенную ошибку при складывании чемоданов

Эксперты рассказали, какие правила необходимо соблюдать туристам, чтобы сборка чемоданов не превратилась в кошмар.

15.07 / 11:06

связь происшествия люди здоровье общество Как понять, что ваши отношения токсичны - тест из одного вопроса

Граница между настоящей любовью и эмоциональной зависимостью очень тонкая, говорят психологи.

15.07 / 11:01

экономика самит инвестор google Курс bitcoin CryptoQuant: долгосрочные инвесторы накапливают биткоин, пока рынок проходит этап формирования дна

Рынок биткоина продолжает находиться в фазе формирования дна, которая сопровождается «перераспределением боли» между разными категориями инвесторов. Об этом заявили аналитики CryptoQuant. Давление постепенно переходит к долгосрочным держателям По данным экспертов, скорректированный индикатор aNUPL демонстрирует разную динамику для краткосрочных (STH) и долгосрочных держателей (LTH). В случае STH показатель начинает улучшаться — каждый новый минимум становится менее негативным, хотя биткоин и дальше тестирует н

15.07 / 10:59

деньги самит Здоровье и красота Знаменитости Дом и интерьер Jaguar E-Type в исполнении LEGO: 1673 детали британского аристократизма

Энцо Феррари (Enzo Ferrari) в свое время назвал Jaguar E-Type самым красивым автомобилем в мире. Датчане из LEGO, очевидно, решили, что эта красота пора стать кучей пластиковых кирпичиков, которые вы обязательно рассыпете при сборке. Новый набор серии Icons воссоздает легендарный родстер 60-х годов, предлагая фанатам автоклассики еще один способ потратить деньги и место на полке.

15.07 / 10:59

продукты Apple журналист стартап OpenAI Умнее умной колонки: Марк Гурман раскрыл подробности амбициозного AI-гаджета от OpenAI и Джони Айва

Известно, что OpenAI совместно со стартапом io Products, основанным бывшим главным дизайнером Apple Джони Айвом (Jony Ive), работает над линейкой AI-гаджетов. Еще в феврале появлялась информация, что первым таким продуктом станет умная колонка с расширенными возможностями и теперь журналист Bloomberg Марк Гурман раскрыл немного подробностей о ней.

15.07 / 10:59

продукты технологии Apple Huawei самит Torras Big Eye Pro: Зарядка, которая хочет заменить ваши кабели (и почти не раздражает дизайном)

Компания Torras, которая обычно ассоциируется с аксессуарами для смартфонов, решила выйти на территорию компактных энерго-решений. Новинка под названием Big Eye Pro — это попытка создать универсальный хаб для тех, кто живет в экосистеме Apple, но не хочет таскать с собой кучу проводов. Устройство оценили в $50 (2220 грн), что для рынка аксессуаров формата «все в одном» выглядит вполне разумно.

15.07 / 10:33

история общество Знаменитости звезда Шоу бизнес Звезда “Подпольной империи”, “Бешеных псов” и “Фарго” Стив Бушеми снимется в сериале Far Cry

Киностудия FX Productions постепенно переходит к активной работе над сериалом по мотивам знаменитой игровой франшизы Far Cry.

Лента новостей

На главную страницу