Об этом же в других СМИ

fokus-vnimaniya.com / 1 год назад

Какие 5 препаратов работают как препараты для снижения веса - ФОКУС ВНИМАНИЯ

habr.com / 1 год назад

Четыре поведенческие стратегии для улучшения рассуждающих языковых моделей

habr.com / 1 год назад

Foxconn запустила собственную большую языковую модель

habr.com / 1 год назад

Новый метод подсказок повышает точность и проверяемость ответов языковых моделей

cursorinfo.co.il / 1 год назад

С какого возраста начинается старение и как его отсрочить - научные факты

Больше по теме

24.02.2025 - 18:20 / habr.com

Разобучаем языковые модели: как заставить ИИ забыть только определенные знания

Привет, Хабр! Сегодня я расскажу о новом подходе в области «разобучения» (unlearning) больших языковых моделей – методе ReLearn, который позволяет не просто «забывать» нежелательную информацию, но и сохранять высокое качество генерируемого текста. Давайте подробно разберем как это работает.

Современные LLM обучаются на огромных датасетах, содержащи приватные и авторские защищенные данные. Это создает серьезные юридические и этические проблемы – ведь модели могут запоминать чувствительную информацию, что противоречит требованиям GDPR и других нормативов.

Поэтому китайские исследователирешили разработать метод разобучения, способный эффективно удалять целевое знание, сохраняя при этом полезную не запрещенную информацию, и способный поддерживать высокое качество генерируемого текста.

Предлагаемый исследователями метод ReLearn генерирует синтетические варианты вопросов и ответов для датасета с информацией, подлежащей удалению. При этом используются четыре типа вариантов:

Простые варианты, позволяющие избежать переобучения на конкретных формулировках;

Контекстные, добавляющие ситуативные детали;

С вариантами шума, для повышения устойчивости к ошибкам;

Логические варианты, меняющие логику вопроса для дополнительного разнообразия.

Эти данные объединяются с оригинальными и общими данными, что позволяет избежать эффекта масштабного забывания.

А позитивная оптимизацияв отличие от традиционных методов обратной оптимизации, таких как Gradient Ascent (GA) и Negative Preference Optimization (NPO) помогает избежать «эффекта качель» (seesaw), когда вероятность целевого токена резко падает, что приводит к ухудшению языковой когерентности.

Позитивная оптимизация усиливает вероятность безопасных и корректных ответов вместо подавления целевых

бизнес общество интересное крипто токен

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Как сбросить вес без каких-либо изменений рациона - лайфхак от эксперта cursorinfo.co.il / 1 год назад

Тест BIG-Bench Extra Hard: как он выявляет недостатки в больших языковых моделях habr.com / 1 год назад

Deepseek: как превратить языковые модели в прибыльный бизнес, несмотря на снижение цен на рынке habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

04.07 / 06:55

технологии политика профессия курс интересное В ТюмГУ протестировали искусственный интеллект в качестве преподавателя

Учёные ТюмГУ предложили новую модель преподавания университетских курсов, где преподаватель-человек выступает в роли наставника, а ИИ — как консультант, партнёр для проверки идей или собеседник. Однако такая модель требует специально подготовленных ИИ‑решений, подчёркивают в пресс-службе университета.

04.07 / 06:43

реклама происшествия Amazon криптовалюта майнинг Amazon обвинила вредоносное ПО в прекращении возможности установки сторонних приложений на новые Fire Stick

Amazon объяснила отказ от выпуска новых телевизионных приставок Fire Stick с поддержкой установки приложений из сторонних источников угрозой вредоносного программного обеспечения.

04.07 / 06:43

общество самит крипто Игровой движок Godot с открытым исходным кодом больше не будет принимать код и тексты, написанные ИИ

Godot Foundation объявила об обновлении правил для участников проекта бесплатного игрового движка Godot Engine: теперь будет запрещено принимать сегенерированные ИИ код и пул‑реквесты, а также написанные с помощью нейросетей тексты в переписке мейнтейнеров с авторами вклада.

04.07 / 06:12

люди животные жара кошка животный мир Жара и кошки – при какой температуре жизни питомца грозит опасность

Чтобы ваш питомец чувствовал себя хорошо в жаркие дни, создайте для него условия с оптимальной температурой.

04.07 / 06:10

продукты технологии люди общество VK запускает нейропоиск Discovery AI — ИИ будет искать контент и генерировать ответы внутри сервисов компании

VK внедряет в свои продукты нейропоиск Discovery AI — функцию поиска и генерации ответов на базе собственной большой языковой модели, рекомендательной системы и поисковых технологий компании. На первом этапе обновление появится в VK Видео, Медиапроектах Mail и «Дзене», рассказали Хабру в компании.

04.07 / 05:51

происшествия наука история общество самит Каких стран не станет в 2100 году: ученые показали карту (фото)

Повышение уровня Мирового океана к концу XXI века может повлечь за собой исчезновение целых островных государств и серьезно угрожать прибрежным мегаполисам с миллионами жителей. По данным наблюдений, в XX веке уровень моря рос примерно на 1,4 мм ежегодно.

04.07 / 05:14

самит Здоровье и красота овощи инфекция интересное Овощ, который действует как натуральное омолаживающее средство

Добавьте этот овощ в свой рацион, чтобы меньше болеть и чувствовать себя моложе и бодрее.

04.07 / 04:27

связь происшествия здоровье общество рак Какой популярный завтрак может повысить риск развития рака

Ученые считают, что самый популярный в мире вид завтрака может нести угрозу здоровью, если им злоупотреблять.

04.07 / 03:25

общество жизнь человек организм На лице человека находится множество существ - исследование

Ученые выяснили, какую функцию выполняют десятки существ, живущих на лице человека.

04.07 / 01:55

происшествия золото история книги расследование Детектив на глубине 18 метров: что нашли у берегов Британии

Случайное открытие на морском дне положило начало масштабному историческому расследованию. Экспертам понадобились десятилетия для поиска ответов.

Лента новостей

На главную страницу