Об этом же в других СМИ

habr.com / 11 месяцев назад

Компания Scale AI увольняет 14% сотрудников, в основном из отдела разметки данных

habr.com / 11 месяцев назад

Google представил продвинутые ИИ-инструменты для поиска: теперь ИИ может звонить от имени пользователей

habr.com / 1 год назад

Исследователи использовали видео c YouTube, чтобы показать, как модели ИИ справляются с неожиданными ситуациями

habr.com / 1 год назад

МТС представил ИИ-агента для корпоративных данных

habr.com / 1 год назад

Microsoft представила технологию Phi-4-mini-flash-reasoning, которая повышает пропускную способность токенов в 10 раз

Больше по теме

02.07.2025 - 05:11 / habr.com

Исследователи говорят, что, возможно, они нашли способ преодолеть «стену данных»

Исследователи из Массачусетского технологического института представили новую платформу под названием SEAL, которая позволяет большим языковым моделям (LLM) генерировать собственные синтетические обучающие данные и совершенствоваться без посторонней помощи.

SEAL работает в два этапа. На первом этапе модель учится создавать эффективные «саморедактируемые» модели с помощью обучения с подкреплением. Эти саморедактируемые модели представляют собой инструкции на естественном языке, которые определяют новые обучающие данные и задают параметры оптимизации. На втором этапе система применяет эти инструкции и обновляет собственные веса с помощью машинного обучения.

Ключевой частью SEAL является алгоритм ReST^EM, который действует как фильтр: он сохраняет и усиливает только те правки, которые действительно улучшают производительность. Алгоритм собирает различные правки, проверяет, какие из них работают, а затем обучает модель, используя только успешные варианты. SEAL также использует адаптеры низкого ранга (LoRA) — метод, который позволяет быстро и легко обновлять модель без переобучения всей модели.

Исследователи протестировали SEAL в двух сценариях. В первом они использовали Qwen2.5-7B для понимания текста. Модель генерировала логические выводы на основе текста, а затем обучалась на собственных результатах.

SEAL достиг точности в 47%, превзойдя метод сравнения с 33,5%. Качество сгенерированных им данных даже превзошло качество GPT-4.1 от OpenAI, несмотря на то, что базовая модель была намного меньше.

Во втором тесте команда использовала Llama 3.2-1B для решения задачи на рассуждение. Здесь модель выбирала различные методы обработки данных и параметры обучения из предустановленного набора инструментов. С помощью SEAL модель достигла

общество крипто mefdayy

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Сообщается, что Nvidia планирует выпустить новый ИИ-чип, разработанный для Китая habr.com / 1 год назад

Злоумышленник использовал ИИ, чтобы выдать себя за министра и связаться с высокопоставленными чиновниками habr.com / 1 год назад

OpenAI усиливает меры безопасности, чтобы не дать конкурентам скопировать свои передовые модели ИИ habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

20.07 / 15:11

экономика СМИ перемирие wsj google СМИ: Ирану передали предложение о перемирии с США

Посредники из Катара передали Ирану предложение о вводе десятидневного перемирия, что в перспективе может привести к деэскалации конфликта. Об этом сообщает The Wall Street Journal со ссылкой на свои источники. По данным издания, иранская сторона уже получила несколько предложений вернуться за стол переговоров. Но, как отметили источники, Корпус стражей исламской революции (КСИР) не ответил ни на одно из них. Однако

20.07 / 15:04

Moonshot.ai выпустили Kimi K3

Модель стала доступна буквально час назад.

20.07 / 14:53

люди здоровье общество болезнь напитки Какой напиток может в разы увеличить риск инсульта

Врачи предупреждают: чем чаще вы употребляете сладкую газировку, тем выше риски для вашего здоровья.

20.07 / 14:53

здоровье работа общество отдых Как меньше уставать на работе - назван идеальный график перерывов

Чтобы не терять продуктивность в течение, нужно знать, как часто делать перерывы на то, чтобы просто встать со стула и "размяться".

20.07 / 14:53

продукты животные здоровье общество питание Названы привычные продукты, которые можно давать домашним животным

Не только корм безопасен для животных, но и некоторые обычные продукты, уверяют ветеринары.

20.07 / 14:53

люди здоровье общество Здоровье и красота кровь Какой показатель в анализе крови может сказать, сколько вы проживете

Эксперты уверяют, что приведение уровня сахара в норму может почти вдвое снизить риск смерти от сердечно-сосудистых заболеваний.

20.07 / 14:53

связь технологии ученые общество самит Точка невозврата: в каком возрасте начинается старение на самом деле

Ученые выяснили, в каком возрасте начинается угасание умственной и физической деятельности.

20.07 / 14:51

наука общество экспедиция космос астероид В Китае хотят отбивать астероиды с помощью «космического тарана»

Национальное космическое управление Китая взялось за миссию по перехвату астероида, назначенную на 2030 год. Ее сравнивают с экспериментом NASA DART 2022 года: тогда человечество изменило траекторию движения астероида под названием Диморфос. Но если в том случае астероид был смещен относительно орбиты другого, то в Китае хотят напрямую изменить орбиту астероида относительно Земли «или даже разрушить его структуру».

20.07 / 14:13

реклама музыка дети история общество Spotify расширила возможности родительского управления учётными записями для бесплатных пользователей

Spotify открыла доступ к функции управляемых аккаунтов (Managed Accounts) пользователям бесплатного тарифа с рекламой. Теперь родители и опекуны смогут создавать отдельные учётные записи для детей младше 13 лет даже в том случае, если не используют платную подписку Premium Family.

20.07 / 14:13

технологии происшествия музыка закон общество Исходный код Suno раскрыл использование 2 млн треков с YouTube Music и сотен тысяч подкастов для обучения

В результате утечки исходного кода музыкального ИИ‑сервиса Suno стали известны подробности о данных, использовавшихся для обучения его моделей. Как сообщает 404 Media, хакер, получивший доступ к внутренним репозиториям компании, обнаружил инструкции и метаданные, свидетельствующие о сборе миллионов музыкальных записей и подкастов с различных онлайн‑платформ.

Лента новостей

На главную страницу