Об этом же в других СМИ

habr.com / 1 год назад

OmniGen 2 сочетает в себе генерацию изображений и текста, как GPT-4o, но имеет открытый исходный код

habr.com / 1 год назад

Исследование Pfizer о причинах трудностей больших языковых моделей при решении задач

habr.com / 1 год назад

Meta* нанимает ключевого исследователя OpenAI для работы над моделями рассуждений ИИ

habr.com / 1 год назад

Suno улучшает свои ИИ-редакторы с помощью приобретения WavTool

habr.com / 1 год назад

OpenAI начинает использовать тензорные процессоры Google для своих ИИ-продуктов

Больше по теме

19.06.2025 - 05:38 / habr.com

Rednote выпускает свою первую языковую модель с открытым исходным кодом и архитектурой Mixture-of-Experts

Компания Rednote, занимающаяся социальными сетями, выпустила свою первую большую языковую модель с открытым исходным кодом. Система Mixture-of-Experts (MoE), получившая название dots.llm1, предназначена для того, чтобы соответствовать производительности конкурирующих моделей при значительно меньшей стоимости.

Согласно техническому отчёту Rednote, в dots.llm1 используется 14 миллиардов активных параметров из 142 миллиардов в общей сложности. Архитектура MoE делит модель на 128 специализированных экспертных модулей, но для каждого токена активируются только шесть лучших модулей, а также два модуля, которые работают постоянно. Такой выборочный подход позволяет экономить вычислительные ресурсы без ущерба для качества.

Rednote заявляет о значительном повышении эффективности. Для обучения dots.llm1 на одном триллионе токенов потребовалось всего 130 000 часов работы графического процессора по сравнению с 340 000 часами для Qwen2.5-72B. В целом, полный процесс предварительного обучения для dots.llm1 занял 1,46 миллиона часов работы графического процессора, в то время как для Qwen2.5-72B потребовалось 6,12 миллиона часов — примерно в четыре раза больше. Несмотря на это, Rednote утверждает, что модели дают схожие результаты.

Тесты показывают, что dots.llm1 особенно хорошо справляется с задачами на китайском языке. В таких тестах, как C-Eval (который измеряет уровень владения китайским языком) и CMMLU (китайский вариант MMLU), модель превосходит Qwen2.5-72B и Deepseek-V3.

По результатам тестов на английском языке dots.llm1 немного отстаёт от лидеров. По результатам MMLU и более сложного MMLU-Pro, которые проверяют общие знания и способность рассуждать, модель немного отстаёт от Qwen2.5-72B.

Что касается математики, то dots.llm1

технологии экономика общество самит крипто токен mefdayy

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Creative Commons представляет CC signals — платформу для открытой экосистемы ИИ habr.com / 1 год назад

Google передает протокол Agent2Agent в Linux Foundation для создания открытого стандарта ИИ-агентов habr.com / 1 год назад

Google представляет новую модель Gemini, которая может работать на локальных роботах habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

24.07 / 03:08

Samsung технологии Apple Amazon Samsung объявила о запуске своей первой кредитной карты на рынке США под названием Samsung Galaxy Card

Samsung представила свою первую кредитную карту Samsung Galaxy Card для пользователей в США. Новинка предлагает существенный кешбэк при покупке продукции южнокорейского производителя.

24.07 / 02:39

происшествия история ядерное оружие самит пилот Одна из самых странных ядерных катастроф – что произошло в 1968 году

Ошибка пилота превратила рутинный вылет в смертельную ловушку для экипажа. Пожар на борту заставил военных эвакуироваться посреди полярной ночи.

24.07 / 01:50

происшествия золото история самит археология Пропуск в загробный мир: в Египте нашли гробницы с золотыми языками

Ученые связывают обнаруженные гробницы с античным торговым городом Левкаспис. Этот крупный прибрежный центр процветал во времена Римской империи.

23.07 / 23:30

люди экономика общество человек Здоровье и красота Почему людям с ожирением так трудно похудеть - исследование

Ученые изучили данные 1754 человек и обнаружили необычную реакцию организма на увеличение физических нагрузок.

23.07 / 23:17

продукты Alibaba представила Qwen3.8 — 2,4-триллионную ИИ-модель и пообещала открыть ее веса

Alibaba анонсировала новую флагманскую модель Qwen3.8. Китацы заявляют, что модель содержит 2,4 трлн параметров. Обещают и выложить веса.

23.07 / 22:49

Огурцы по-корейски — хрустящая закуска с насыщенным вкусом - Журнал "ФОКУС ВНИМАНИЯ"

Огурцы по-корейски — одна из самых популярных корейских закусок, которая сочетает свежесть овощей, пикантные специи и насыщенный аромат кунжутного масла.

23.07 / 22:49

Как изменился путь клиента: сегодня вас «гуглят» раньше, чем покупают - Журнал "ФОКУС ВНИМАНИЯ"

Еще несколько лет назад путь клиента выглядел достаточно просто. Человек увидел рекламу, перешёл на сайт, посмотрел предложение, пообщался с менеджером и принял решение.

23.07 / 22:28

продукты связь технологии экспорт общество Документация Delta Design обновилась: варианты исполнений, веб-панель Identity, новые аппертуры DeltaCAM

Сегодня в пользовательской документации Eremex вышло несколько новых статей, а также провели техническое обслуживание самого сайта: поправили битые ссылки, ускорили загрузку и улучшили поиск.

23.07 / 22:28

технологии Центробанк деньги закон общество Центробанк предложил запретить подросткам регистрировать электронные кошельки без согласия родителей

Центробанк предложил перекрыть ещё один канал, через который мошенники вовлекают подростков в финансовые схемы, пишут «Известия». В рамках пакета «Антифрод 3.0» несовершеннолетним могут запретить регистрировать электронные средства платежа (ЭСП) без согласия родителей. Поправки затронут подростков в возрасте от 14 до 18 лет.

23.07 / 22:28

реклама СМИ общество самит Ozon В России зафиксировали рост доли ИИ-трафика на сайтах СМИ и электронной коммерции

Лидерами по количеству ИИ‑трафика в июне 2026 года стали сайты электронной коммерции и медиа, рассказали «Ъ» в Servicepipe. На нейросети и ботов, которые обращаются к ресурсам СМИ и e‑com, приходится по 1% от всего трафика, анализируемого компанией. За аналогичный период 2025 года у СМИ было 0,5%, у e‑com — 0,3%. При этом в период крупных распродаж доля ботов на ресурсах электронной коммерции вырастала в пике до 3%, а на новостных сайтах в дни острых информационных поводов — до 3,5%, говорят в компании.

Лента новостей

На главную страницу