Об этом же в других СМИ

habr.com / 1 год назад

Meta* усиливает позиции в сфере ИИ: новые назначения и планы по разработке

habr.com / 1 год назад

Исследование Pfizer о причинах трудностей больших языковых моделей при решении задач

habr.com / 1 год назад

Meta* нанимает ключевого исследователя OpenAI для работы над моделями рассуждений ИИ

habr.com / 1 год назад

Федеральный судья поддержал Meta* в иске о обучении ИИ на книгах, защищенных авторским правом

habr.com / 1 год назад

ИИ-агенты — новый повод для беспокойства?

Больше по теме

18.06.2025 - 10:38 / habr.com

Новый метод адаптирует языковые модели без обучения

Исследователи из Sakana AI представили метод Text-to-LoRA (T2L), который адаптирует большие языковые модели к новым задачам, используя только простое текстовое описание — никаких дополнительных обучающих данных не требуется.

Большие языковые модели обычно специализируются с помощью таких методов, как LoRA (адаптация с низким рангом). LoRA работает путём вставки небольших матриц с низким рангом в определённые слои модели, что делает процесс адаптации гораздо более эффективным, чем полная тонкая настройка. Вместо обновления миллиардов параметров требуется настроить всего несколько миллионов.

Тем не менее, для каждой новой задачи обычно требуются собственные обучающие данные и тщательно подобранные гиперпараметры, что делает процесс трудоёмким и ресурсозатратным. Text-to-LoRA автоматизирует этот этап. Система использует гиперсеть, обученную на 479 задачах из набора данных Super Natural Instructions. Научившись связывать описания задач с правильными настройками LoRA, T2L может генерировать веса LoRA для новой задачи всего за один шаг — даже если она никогда не выполнялась ранее.

Компания Sakana AI разработала три варианта T2L: T2L-L (55 миллионов параметров) генерирует сразу обе матрицы LoRA, T2L-M (34 миллиона параметров) использует общий выходной слой для обеих матриц, а T2L-S (5 миллионов параметров) генерирует только отдельные ранги матриц.

Команда сравнила два подхода к обучению T2L: обучение реконструкции, при котором система учится воссоздавать существующие адаптеры LoRA, и контролируемую тонкую настройку (SFT), при которой она обучается непосредственно на целевых задачах.

Модели SFT превзошли модели, основанные на реконструкции, в среднем достигнув 66,3% от эталонного показателя по сравнению с 61,8%. Исследователи

технологии общество крипто mefdayy

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Исследователи обучают ИИ генерировать длинные тексты, используя только метод обучения с подкреплением habr.com / 1 год назад

Google представляет новую модель Gemini, которая может работать на локальных роботах habr.com / 1 год назад

Новый эксперимент с Othello подтверждает гипотезу о модели мира для больших языковых моделей habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

24.07 / 03:08

Samsung технологии Apple Amazon Samsung объявила о запуске своей первой кредитной карты на рынке США под названием Samsung Galaxy Card

Samsung представила свою первую кредитную карту Samsung Galaxy Card для пользователей в США. Новинка предлагает существенный кешбэк при покупке продукции южнокорейского производителя.

24.07 / 02:39

происшествия история ядерное оружие самит пилот Одна из самых странных ядерных катастроф – что произошло в 1968 году

Ошибка пилота превратила рутинный вылет в смертельную ловушку для экипажа. Пожар на борту заставил военных эвакуироваться посреди полярной ночи.

24.07 / 01:50

происшествия золото история самит археология Пропуск в загробный мир: в Египте нашли гробницы с золотыми языками

Ученые связывают обнаруженные гробницы с античным торговым городом Левкаспис. Этот крупный прибрежный центр процветал во времена Римской империи.

23.07 / 23:30

люди экономика общество человек Здоровье и красота Почему людям с ожирением так трудно похудеть - исследование

Ученые изучили данные 1754 человек и обнаружили необычную реакцию организма на увеличение физических нагрузок.

23.07 / 23:17

продукты Alibaba представила Qwen3.8 — 2,4-триллионную ИИ-модель и пообещала открыть ее веса

Alibaba анонсировала новую флагманскую модель Qwen3.8. Китацы заявляют, что модель содержит 2,4 трлн параметров. Обещают и выложить веса.

23.07 / 22:49

Огурцы по-корейски — хрустящая закуска с насыщенным вкусом - Журнал "ФОКУС ВНИМАНИЯ"

Огурцы по-корейски — одна из самых популярных корейских закусок, которая сочетает свежесть овощей, пикантные специи и насыщенный аромат кунжутного масла.

23.07 / 22:49

Как изменился путь клиента: сегодня вас «гуглят» раньше, чем покупают - Журнал "ФОКУС ВНИМАНИЯ"

Еще несколько лет назад путь клиента выглядел достаточно просто. Человек увидел рекламу, перешёл на сайт, посмотрел предложение, пообщался с менеджером и принял решение.

23.07 / 22:28

продукты связь технологии экспорт общество Документация Delta Design обновилась: варианты исполнений, веб-панель Identity, новые аппертуры DeltaCAM

Сегодня в пользовательской документации Eremex вышло несколько новых статей, а также провели техническое обслуживание самого сайта: поправили битые ссылки, ускорили загрузку и улучшили поиск.

23.07 / 22:28

технологии Центробанк деньги закон общество Центробанк предложил запретить подросткам регистрировать электронные кошельки без согласия родителей

Центробанк предложил перекрыть ещё один канал, через который мошенники вовлекают подростков в финансовые схемы, пишут «Известия». В рамках пакета «Антифрод 3.0» несовершеннолетним могут запретить регистрировать электронные средства платежа (ЭСП) без согласия родителей. Поправки затронут подростков в возрасте от 14 до 18 лет.

23.07 / 22:28

реклама СМИ общество самит Ozon В России зафиксировали рост доли ИИ-трафика на сайтах СМИ и электронной коммерции

Лидерами по количеству ИИ‑трафика в июне 2026 года стали сайты электронной коммерции и медиа, рассказали «Ъ» в Servicepipe. На нейросети и ботов, которые обращаются к ресурсам СМИ и e‑com, приходится по 1% от всего трафика, анализируемого компанией. За аналогичный период 2025 года у СМИ было 0,5%, у e‑com — 0,3%. При этом в период крупных распродаж доля ботов на ресурсах электронной коммерции вырастала в пике до 3%, а на новостных сайтах в дни острых информационных поводов — до 3,5%, говорят в компании.

Лента новостей

На главную страницу