Об этом же в других СМИ

habr.com / 1 год назад

Сотрудники Meta* обсуждали использование защищенного авторским правом контента для обучения ИИ

gagadget.com / 1 год назад

Китайские ученые создали ИИ-анализ крови, который диагностирует болезни за 15 лет до появления симптомов

habr.com / 1 год назад

Nvidia запускает платформу искусственного интеллекта для обучения языку жестов

gagadget.com / 1 год назад

Claude 3.7 Sonnet от Anthropic может писать код, исправлять ошибки и играть в Pokémon

telegraf.com.ua / 1 год назад

График усеян новыми магнитными бурями. Ученые дали прогноз на неделю

Больше по теме

08.02.2025 - 13:54 / habr.com

Тесты помогают быстрее и дешевле учить ИИ писать код. Новая работа китайских ученых: TDD для обучения ИИ

Сегодня в HuggingFace Daily papers ачивку "#3 daily paper" завоевала работа китайских исследователей из TigerLab. Мне она показалась настолько логичной и классной, что захотелось побольше рассказать об этой новости.

Итак, при классическом обучении моделей есть этап Supervised Fine-Tuning, на котором люди вручную подготавливают датасет с примерами качественных ответов для ИИ. Собственно, эти примеры используются для до-обучения модели.

Проблема в том, что подготовка таких датасетов — их разметка, проверка и прочие этапы — требует участия человека, а это самый дорогой и ресурсоемкий процесс в обучении искусственного интеллекта.

В последнее время мы наблюдаем, что модели, обучаемые без ручной разметки, оказываются дешевле и обучаются быстрее, при таком же уровне качества. Прекрасный пример — DeepSeek R1-Zero, который был обучен исключительно на синтетических данных с использованием механизмов Reinforcement Learning, и обошелся в 25 раз дешевле, чем модели с аналогичным качеством.

Исследователи использовали ИИ для создания коллекции пар "[задача] + [тесты для её проверки]". Эта работа не требует больших интеллектуальных способностей ИИ, для написания тестов подходят даже простенькие модели.

Скажем, тест может использовать "наивный" алгоритм с полным перебором, и при этом качественно проверять правильные ли ответы выдает "основной" код.

В частности, используемая авторами методика привела к росту на 10 процентных пунктов производительности модели Llama-3.1-8B-Ins и росту на 5 процентных пунктов Qwen2.5-Coder-7B-Ins, сравняв ее по качеству с гораздо более крупной DeepSeek-V2.5 (236B параметров).

Ещё раз: модель в 7 миллиардов параметров стала выдавать качество модели в 236 миллиардов, в 33 раза большей (справедливости ради, DeepSeek

бизнес люди общество самит

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Новое обновление безопасности Galaxy A54: защита смартфона становится еще надежнее gagadget.com / 1 год назад

Некоторые новые джуны на самом деле не умеют писать код без ИИ-помощников habr.com / 1 год назад

Китайские ученые обнаружили новый вид динозавров-зауроподов hitechexpert.top / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

19.07 / 03:01

экспедиция интересное животный мир Жил 110 миллионов лет назад: австралийские ученые нашли коготь огромного плотоядного динозавра

Теперь ученым придется разгадать палеонтологическую загадку

19.07 / 02:38

люди ученые общество БПЛА животный мир Война объявлена – инженеры создали дрон-убийцу комаров

Инженеры представили инновационного автономного дрона, который «вычисляет» комаров по звуку взмаха крыльев и уничтожает их с высокой точностью.

19.07 / 01:47

ученые животные наука общество Знаменитости Главный миф об облике и жизни тираннозавра разрушили ученые

Палеонтологи полностью пересмотрели скорость взросления знаменитого тираннозавра. Выяснилось, что этот хищник рос почти до сорока лет.

19.07 / 00:48

продукты медицина продукты питания Здоровье и красота лекарства Дешевая зелень из магазина может спасти от тяжести в желудке

Исследования подтвердили, что обычная мята не просто украшает летние блюда, но и эффективно помогает пищеварению, снижает стресс и повышает тонус.

18.07 / 23:30

здоровье общество человек Здоровье и красота врачи Привычки, которые незаметно ускоряют старение организма, назвали врачи

Многие совершают эти ошибки ежедневно, не подозревая, что они постепенно приближают старость.

18.07 / 22:37

люди здоровье общество мозг возраст Какая привычка убережет от слабоумия людей в возрасте

Врачи уверяют, что есть простой способ существенно снизить риски болезни Альцгеймера.

18.07 / 22:17

технологии Apple Релиз инструмента для работы с MKV-файлами MKVToolNix 100.0

В июле 2026 года состоялся стабильный релиз инструмента для работы с MKV‑файлами MKVToolNix 100.0 под кодовым названием «Do Hot Girls Like Chords». Предыдущая версия проекта вышла в мае 2026 года.

18.07 / 22:17

технологии Apache крипто Вышло обновление FreeRDP 3.29 с 22 патчами безопасности

14 июля 2026 года состоялся выпуск открытого проекта FreeRDP 3.29. Это реализация протокола удалённого рабочего стола Microsoft (Remote Desktop Protocol — RDP), опубликованная на GitHub под лицензией Apache License 2.0. Исходный код проекта написан на С и С++. Разработка решения ведётся более 15 лет. Стабильная версия FreeRDP 3.20 вышла в декабре 2025 года.

18.07 / 22:03

Samsung технологии общество семья политика Samsung прекратила поддержку сразу четырех популярных смартфонов Galaxy: владельцам стоит задуматься об обновлении

Речь идет об официальной информации, опубликованной после обновления перечня поддерживаемых устройств Samsung. Компания выполнила ранее данное обещание, предоставляя обновления безопасности в течение четырех лет с момента выхода этих моделей на рынок.

18.07 / 21:26

технологии самит доллар Work Louder и OpenAI выпустили Codex Micro — макропад для управления AI-агентами в Codex

OpenAI совместно с компанией Work Louder выпустила Codex Micro — макропад, с помощью которого можно управлять AI-агентами в Codex. Устройство позволяет отслеживать состояние задач, запускать сценарии и регулировать глубину рассуждений модели с помощью физических кнопок, джойстика и поворотного энкодера.

Лента новостей

На главную страницу