Об этом же в других СМИ

habr.com / 1 год назад

Foxconn запустила собственную большую языковую модель

habr.com / 1 год назад

Новый метод подсказок повышает точность и проверяемость ответов языковых моделей

habr.com / 1 год назад

Тест BIG-Bench Extra Hard: как он выявляет недостатки в больших языковых моделях

habr.com / 1 год назад

Как сократить затраты на системы ИИ: новый метод исследователей Zoom Communications

gagadget.com / 1 год назад

Титановый корпус, двойная камера и никакого Face ID: инсайдер поделился интересной информацией о первой складной модели iPhone

Больше по теме

21.02.2025 - 12:36 / habr.com

Китайская LLaDa: как зашумленный текст превращается в осмысленный диалог – новая эра диффузионных языковых моделей

Привет, Хабр! В этой статье расскажу о новом подходе - больших языковых диффузионных моделях (LLaDA).

Большие языковые диффузионные модели - альтернатива традиционным большим языковым моделям, которые генерируют текст токен за токеном. Метод диффузии сначала "зашумляет" текст, а затем модель обучается восстанавливать его целиком. Такие модели можно также использовать и для создания новых белков с заданными свойствами. Давайте подробнее разберем, как все это работает.

Большинство современных языковых моделей работают по принципу «предскажи следующий токен», то есть генерируют текст поэтапно. Но недавно китайские исследователи предложили другой подход — использовать диффузию в LLM. Вместо пошагового предсказания модель сначала «зашумляет» текст, а затем обучается восстанавливать его целиком.

Процесс обучения: Исходный текст постепенно "маскируется" (заменяется специальными токенами), и модель учится по шагам возвращать исходные слова. Таким образом, она изучает не только прямую последовательность слов, но и взаимосвязи между ними со всех сторон.

Дообучение: После базового обучения модель дообучали на 4,5 млн пар «вопрос–ответ», чтобы она лучше понимала инструкции и могла вести осмысленные диалоги.

Результаты: Модель LLaDA с 8 млрд параметров показывает результаты, сравнимые с лучшими существующими языковыми моделями в "своей весовой категории". Например, на математической задаче GSM8K точность достигала 70,7%, а задачи, где требуется генерировать текст задом наперед («обратное рассуждение»), модель справлялась лучше, чем GPT‑4.

Диффузионный подход позволяет:

Генерировать текст параллельно, а не по токенам, что может ускорить работу LLM;

Улучшить качество вывода на сложных задачах, например, там, где нужно учитывать контекст с

бизнес медицина мода интересное крипто токен

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Deepseek: как превратить языковые модели в прибыльный бизнес, несмотря на снижение цен на рынке habr.com / 1 год назад

Возможное ограничение использования новой языковой модели OpenAI GPT-4.5 через API habr.com / 1 год назад

Как люди могут ощущать вкус кожей - новое исследование ученых cursorinfo.co.il / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

12.07 / 14:05

экономика пенсия самит автомобили интересное Китайская Weichai Power сертифицировала 600-сильный водородный двигатель: дизелю на пенсию?

Пока мир ведёт ожесточённые споры о весе аккумуляторов для магистральных грузовиков и целесообразности полной электрификации, китайцы из Weichai Power решили пойти по пути наименьшего сопротивления. Они взяли привычную архитектуру двигателя внутреннего сгорания и научили её работать на водороде. Их новый агрегат WP15 только что прошёл сертификацию по экологическому стандарту China VI, став первым в мире тяжёлым водородным ДВС, официально допущенным к коммерческой эксплуатации.

12.07 / 13:46

Samsung мода и стиль Thermaltake Capo X: Двухэтажный небоскреб для ПК за $190

Если вы когда-либо мечтали о том, чтобы запихнуть два компьютера в один корпус, но не хотели строить для этого отдельный серверный шкаф, Thermaltake имеет для вас решение. После июньских анонсов на Computex, нетипичный корпус Capo X наконец поступил в продажу. Цена вопроса — $190 (8500 грн), что по меркам специфического железа выглядит вполне разумно, если вы понимаете, зачем вам такой гигант на столе.

12.07 / 13:46

технологии Apple книги мода и стиль криптобиржи HMD Asha 305: ностальгия за копейки или очередная попытка продать пластик?

HMD Global продолжает своё экскурсию по кладбищу забытых брендов. Компания, которая постепенно отказывается от названия Nokia в пользу собственного имени, решила, что настало время для «триумфального» возвращения Asha. Когда-то это были промежуточные устройства между обычными «звонилками» и смартфонами, но новая итерация HMD Asha 305 — это чистокровный, хоть и крайне скромный, Android-смартфон.

12.07 / 13:43

происшествия ученые общество вирус пандемия Внезапная пандемия хантавируса – ученые сделали важное предупреждение

Исследователи изучили весеннюю вспышку вируса на судне и пришли к выводу, что общественный страх опередил реальные факты.

12.07 / 13:15

технологии Acer представила смартфон Sospiro A15 с двумя экранами, Android 16 и камерой на 64 Мп

Acer Sospiro A15 оснащен 6,67-дюймовым IPS-дисплеем с разрешением HD+, частотой обновления 120 Гц и каплевидным вырезом под фронтальную камеру.

12.07 / 13:04

происшествия животные дети природа дети и родители Кошмар в США: гигантский крокодил напал на ребенка

Огромный хищник атаковал юного рыбака и намертво зажал его руку своими челюстями. Находившийся рядом отец сразу бросился на помощь сыну.

12.07 / 13:04

происшествия общество жизнь человек мозг Комары могут переносить болезнь, поражающую мозг - исследование

Ученые обнаружили вид комаров, укус которых может закончится параличом и представляет угрозу для жизни.

12.07 / 12:55

экономика общество криптовалюта Ethereum Binance Weekly: тактика Сэйлора против прогнозов JPMorgan, сила Binance, новые «фокусы» ИИ и криптооперация Интерпола

Редакция Incrypted подготовила для вас очередной дайджест о главных событиях в сфере Web3 за неделю. В нем мы расскажем о продаже биткоинов компанией Strategy, первых сигналах восстановления спроса на первую криптовалюту, новом этапе развития Ethereum, стремительном сближении традиционных финансов с блокчейном, масштабной экспансии ИИ и укреплении позиций Binance несмотря на регуляторное давление, а также о других ключевых трендах и вызовах отрасли. Главные но

12.07 / 12:38

связь экономика Госдума закон общество Госдума приняла закон о поддержке Почты России сразу в двух чтениях

Госдума 8 июля 2026 года приняла закон о поддержке Почты России во втором и третьем чтениях. Документ закрепляет новые правила работы оператора и вводит электронную почтовую систему для доставки юридически значимых сообщений.

12.07 / 12:38

технологии общество рубль бюджет СМИ:«„Яндекс Маркет“ сокращает штат и бюджет»

«Яндекс Маркет» планирует сократить бюджет и штат. Об этом сообщило издание «Ведомости» со ссылкой на неназванные источники. По словам источников, речь идёт о снижении бюджета с 14 млрд до 2 млрд рублей. При этом представитель «ЯндексМаркета» сообщил изданию, что общий бюджет маркетплейса в этом году не меняется, но не уточнил, на какие направления ранее выделялись 14 млрд рублей.

Лента новостей

На главную страницу