Об этом же в других СМИ

habr.com / 1 год назад

Вышла StarGuard — утилита, которая определяет накрученные звёзды в GitHub-репозиториях

habr.com / 1 год назад

Утилита Raspberry Pi Connect вышла из беты

habr.com / 1 год назад

Вышла версия инструмента мониторинга HWiNFO 8.26

habr.com / 1 год назад

В Steam вышла демоверсия российской игры True Thief

habr.com / 1 год назад

Вышла AnduinOS 1.3.1 с возможностью апдейта по скрипту между минорными версиями

Больше по теме

01.05.2025 - 02:33 / habr.com

Вышла Qwen3. Весит мало, работает быстро. Обходит LLama4 402B Maverick и конкурирует с DeepSeek R1

Новое семейство Qwen3 представлено в виде Dense: 0.6B,1.7B, 4B, 8B, 14B, 32B, и в виде MoE: 30B-A3B, 235B-A22B. Каждая модель поддерживать гибридный режим работы: обычный и размышление. Поддерживает 119 языков и диалектов.

Маленькие модели 0.6B подойдут для speculative decoding в llama.cpp и производных, вроде LM Studio, позволяя ускорять выполнение больших моделей за счет предсказания уже очевидных токенов, где не требуется полноценная работа большой модели. Таким образом можно получить ускорение в среднем 20-50% без изменения качества ответа, но всё зависит от множества факторов, включая язык токенов.

MoE модели записываются в формате Qwen3-30B-A3B и Qwen3-235B-A22B, что означает, что модель имеет всего 30B или 235B параметров, из который активных 3B или 22B. Активные параметры в MoE означают, что на вычисление каждого следующего токена будет задействована не вся модель, а лишь её часть, что сильно снижает требование к вычислительным ресурсам.

Главное преимущество MoE моделей это кратное снижение требований к железу, запускать можно даже с ssd (ключ --ubatch-size 1, чтобы обрабатывать запросы pp партиями 1 за раз, вместо 512, иначе ssd станет узким местом), можно выгрузить общие слоя в vram, получая приличное ускорение на одной GPU (ключ -ot exps=CPU или --override-tensor ".ffn_.*_exps.=CPU"), или использовать форки ik_llama и KTransformers, позволяющие использовать новые оптимизации, такие как -mla и -fmoe.

По бенчмаркам можно увидеть, что модель 30B-A3B превосходит Gemma3-27B и DeepSeek V3 старого образца (версия DeepSeek V3-0324 сильно превосходит обычный V3).

Qwen3-30B-A3B занимает почти тот же размер, что и Gemma3-27B, но при этом, за счет всего 3B активных параметров, работает быстрее, что позволяет её запустить даже

общество крипто токен eps

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Вышла альфа-версия проекта ty — инструментария для чрезвычайно быстрой проверки типов для языка Python habr.com / 1 год назад

BYD официально вышла на рынок Румынии с несколькими моделями EV и PHEV gagadget.com / 1 год назад

Вышла Node.js 24 habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

05.07 / 06:45

люди деньги общество самит сон Как спать крепче всех — 9 железных финансовых правил

Эти простые привычки помогают справляться с денежными заботами, побеждать стресс из-за счетов и обретать уверенность в завтрашнем дне.

05.07 / 06:35

продукты люди здоровье продукты питания общество Сколько бананов можно есть в день — израильский доктор удивляет

Сколько плодов стоит съедать ежедневно, кому они могут навредить и как правильно включать их в рацион для максимальной пользы.

05.07 / 06:35

общество космос планеты человек звезда Человечество сможет переселиться на новую планету - исследование

Ученые обнаружили перспективную планету, которая сможет потенциально принять человечество в случае крайней необходимости.

05.07 / 06:35

продукты технологии самит доллар крипто GLM-5.2 получила свой аналог Claude Code. Кстати, модели Claude туда тоже подходят

Z.ai (бывшая Zhipu AI) выпустила ZCode — официальную десктопную среду разработки для своей флагманской модели GLM-5.2. Согласно анонсу на сайте продукта, подписчики GLM Coding Plan получают повышенную в полтора раза квоту при работе через ZCode, приложение поддерживает BYOK — можно подключить свои существующие подписки и API вместо аккаунта Z.ai, а сама программа доступна на macOS, Windows и Linux (последняя пока в бета-статусе).

05.07 / 05:50

люди животные банк самит кухня Мухи в доме — эксперты назвали лучшую ловушку против них

Эксперты проверили четыре популярных домашних способа борьбы с мошками в кухне, и один из них показал просто идеальный результат.

05.07 / 05:50

наука история экспедиция самит биологи В Тихом океане на глубине более 6 километров обнаружили неизвестные черные яйца: что это такое (фото)

В ходе экспедиции в глубинах Тихого океана международная группа ученых обнаружила загадочные черные коконы, прикрепленные к скале на глубине около 6200 метров. Исследование показало, что внутри них находился неизвестный ранее науке вид плоских червей.

05.07 / 05:30

технологии происшествия смартфон самит гаджет Названа ошибка, которая незаметно разрушает аккумулятор смартфона

Эксперты объяснили, какой уровень заряда батареи смартфона считается оптимальным для повседневного использования и почему стоит отказаться от привычных правил.

05.07 / 05:12

технологии здоровье общество семья доллар Rogbid представила фитнес-браслет без экрана с ЭКГ, GPS и автономностью до 30 дней

Rogbid Loop Air получил корпус из алюминиевого сплава и поликарбоната. Толщина устройства составляет всего 8,8 мм, а вес — 23 грамма, поэтому браслет практически не ощущается на руке.

05.07 / 03:25

общество вирус инфекция болезнь ВОЗ Существует ли сейчас опасность хантавируса - в ВОЗ ответили

Вспышка хантавируса, произошедшая на круизном лайнере, напугала многих, однако в ВОЗ дали заключение относительно ее продолжения.

05.07 / 02:59

люди экономика закон самит Здоровье и красота Факторы, которые не дают вам похудеть, назвали диетологи

Даже во время строгих диет часто бывает момент, когда вес просто "останавливается" на какой-то отметке. Так что же делать?

Лента новостей

На главную страницу