Об этом же в других СМИ

habr.com / 1 год назад

Исследователи использовали видео c YouTube, чтобы показать, как модели ИИ справляются с неожиданными ситуациями

habr.com / 1 год назад

Операторов персональных данных обяжут использовать только российское ПО

habr.com / 1 год назад

Китайские исследователи представили MemOS: операционную систему памяти для ИИ-систем

habr.com / 1 год назад

Китай планирует использовать чипы Nvidia для расширения инфраструктуры ИИ в Синьцзяне

cursorinfo.co.il / 1 год назад

Как происходят катастрофы – израильские исследователи раскрыли механизм природных коллапсов

Больше по теме

27.06.2025 - 14:41 / habr.com

Исследователи обучают ИИ генерировать длинные тексты, используя только метод обучения с подкреплением

Исследовательская группа из Сингапура и Китая представила LongWriter-Zero — модель искусственного интеллекта, которая использует обучение с подкреплением для написания текстов объёмом более 10 000 слов без использования синтетических обучающих данных.

Существующие языковые модели часто испытывают трудности при создании очень длинных текстов: по мере увеличения объёма текста снижается связность, увеличивается количество повторений и структурных проблем. Большинство современных подходов решают эти проблемы с помощью контролируемой тонкой настройки (SFT) на искусственно созданных длинных текстах. Но создание таких наборов данных требует больших трудозатрат, а результаты часто не соответствуют требованиям как по стилю, так и по содержанию.

LongWriter-Zero, разработанный исследователями из Сингапурского университета технологий и дизайна и Университета Цинхуа, использует другой подход. Вместо использования готовых обучающих примеров модель полагается исключительно на обучение с подкреплением (RL) для создания связных текстов большой длины. Команда опирается на свои более ранние исследования LongWriter.

В основе обучения LongWriter-Zero лежат три специализированные модели вознаграждения, которые оценивают длину текста, качество написания и структуру. Исследователи также представили техническую инновацию под названием «усреднение преимуществ», которая балансирует вознаграждения по различным параметрам качества. Базовой моделью для LongWriter-Zero является Qwen2.5-32B.

Уникальной особенностью LongWriter-Zero является использование «наводящих вопросов». Перед тем как сгенерировать ответ, модель получает задание спланировать структуру и содержание своего ответа. По мнению команды разработчиков, этот шаг значительно повышает связность

технологии крипто mefdayy Китай Сингапур Сингапур

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Исследователи Сбера стали лучшей российской командой на конкурсе рекомендательных систем RecSys Challenge 2025 habr.com / 1 год назад

Meta обучает чат-ботов с искусственным интеллектом отправлять сообщения без запроса hitechexpert.top / 1 год назад

Исследователи научились из космоса отслеживать движение пластиковых отходов habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

21.07 / 09:34

Samsung технологии Nvidia общество курс Samsung первой получила новый сертификат VESA для OLED-дисплеев: экраны ноутбуков стали ярче и долговечнее

Производитель уже начал поставки новых панелей партнерам, а первым ноутбуком с таким экраном стал Lenovo Yoga Pro 9i Aura Edition 11-го поколения. В ближайшие месяцы аналогичные дисплеи должны появиться в моделях Asus, Dell и MSI, что подтверждает курс производителей на массовое внедрение новой технологии.

21.07 / 09:19

продукты технологии происшествия самит UserGate присвоил системному интегратору STEP LOGIC статус сервисного партнёра

UserGate, ведущий российский разработчик решений в области информационной безопасности и архитектор сетевого доверия, присвоил системному интегратору STEP LOGIC статус авторизованного сервисного партнёра. Новый статус подтверждает высокий уровень компетенций компании в работе с технологиями вендора.

21.07 / 09:19

экономика Audi самит электроэнергия предприятия Horse Powertrain D20: Возрождение метанола и «блины» вместо цилиндров

Пока индустрия лихорадочно ищет способ заставить электромобили ездить дольше без остановок на зарядку, совместное предприятие Renault и Geely под названием Horse Powertrain решило пойти по пути наименьшего сопротивления. Или наибольшего, в зависимости от того, как вы относитесь к метанолу. Компания представила установку D20 Methanol — гибридный генератор, который превращает спирт в электроэнергию с эффективностью, заставляющей задуматься о целесообразности чистых электрокаров в их нынешнем виде.

21.07 / 09:19

семья Sony playstation Rise of the Ronin, Avatar: Frontiers of Pandora и еще пять игр уже доступны подписчикам PlayStation Plus Extra и Premium

Sony не перестает радовать подписчиков PlayStation Plus бесплатными подборками отличных игр. Сегодня — 21 июля — пользователи расширенных тарифов Extra и Premium получили возможность добавить в библиотеку семь тайтлов, из которых отдельно следует выделить красочный экшен в открытом мире Avatar: Frontiers of Pandora, хардкорную экшен-RPG в сеттинге феодальной Японии Rise of the Ronin и культовый зомби-экшен Dying Light (2013).

21.07 / 09:19

экономика деньги президент отдых бюджет Fiat Argo X: бразильская «Панда» с амбициями кроссовера и большим бюджетом

Fiat официально подтвердил, что следующей большой новинкой для бразильского рынка станет модель Argo X. Об этом объявил Эрландер Зола (Herlander Zola), президент Stellantis в Южной Америке, во время торжеств по случаю 50-летия бренда и завода в Бетиме (Betim). Если вы ожидали, что новое поколение просто заменит старое, то у Fiat для вас есть классическая схема из прошлого.

21.07 / 09:19

погода засуха интересное Спутники НАСА зафиксировали формирование мощного явления «Эль-Ниньо» в Тихом океане

В июне 2026 года вернулось явление «Эль-Ниньо», о чём свидетельствовали более тёплые, чем обычно, воды в центральной и восточной частях экваториального Тихого океана. Национальное управление океанических и атмосферных исследований объявило о начале явления 11 июня после того, как температура поверхности моря в течение нескольких месяцев оставалась как минимум на 0,5°C выше нормы. К тому времени НАСА и его партнёры уже отслеживали из космоса ещё один предупреждающий признак: повышение уровня поверхности моря.

21.07 / 09:19

пенсия Audi климат самит интересное Audi Q7 (2026): Больше экранов, меньше кнопок и двери, живущие своей жизнью

Немецкий автопром продолжает свою бесконечную игру в «оцифровку всего», и обновленный Audi Q7 (2026) — очередной ход в этой партии. Пока мир ждет полного перехода на электричество, инженеры из Ингольштадта решили, что ихному флагманскому кроссоверу с ДВС еще рано на пенсию. Автомобиль получил не просто косметический ремонт, а серьезную порцию технологического «допинга», который должен оправдать его пребывание в высшей лиге премиальных SUV.

21.07 / 09:13

экономика общество самит электроэнергия доллар Зеленая энергия – какие проблемы ждут владельцев солнечных панелей

Хотя домашние солнечные электростанции помогают сэкономить на коммуналке, их установка требует крупных первоначальных вложений.

21.07 / 09:13

закон общество законодательство самолет лекарства Одна ошибка в аэропорту может стоить 10 лет тюрьмы

Перед международным рейсом путешественникам рекомендуют тщательно осмотреть чемоданы, чтобы избежать неприятностей уже на границе.

21.07 / 09:04

технологии LG общество семья журналист Телевизоры LG записывают разговоры, а мониторы устанавливают ПО без разрешения, — журналисты

В устройствах LG обнаружен ряд спорных функций, нарушающих конфиденциальность пользователей. Некоторые мониторы этой компании устанавливают программное обеспечение на компьютер без отдельного согласия пользователя.

Лента новостей

На главную страницу