Об этом же в других СМИ

habr.com / 3 месяца назад

Опыт не нужен, нужен ИИ: FlightStory нанимает вайб-кодеров вместо разработчиков

habr.com / 3 месяца назад

GPT-5.2 не смогла сложить 5+7. Как эзотерические языки обнулили передовые модели

habr.com / 3 месяца назад

Qwen3.5 Max Preview вошла в топ-3 по математике. Модель доступна на Arena.Ai

habr.com / 3 месяца назад

DeepSeek V4, возможно, уже тестируется на OpenRouter — у стелс-модели 1 трлн параметров и 1M контекстное окно

habr.com / 3 месяца назад

Вышла альфа Midjourney V8 — в пять раз быстрее и нативные 2K

Больше по теме

04.03.2026 - 12:04 / habr.com

Вышли младшие модели Qwen-3.5 — и 9B-версия обходит ИИ в 13 раз крупнее

Команда Qwen (Alibaba Cloud) опубликовала пять компактных моделей серии Qwen3.5: на 9B, 4B, 2B и 0.8B параметров — все в dense-формате и с открытыми весами под Apache 2.0. Это финальная часть линейки, которую Alibaba выкатывала тремя волнами: флагман на 397B-A17B вышел 16 февраля, средние модели (122B-A10B, 35B-A3B, 27B) — 24 февраля, а теперь — компактные версии для локального запуска. Помимо Hugging Face, модели доступны на ModelScope и Ollama. Для запуска 9B-версии достаточно одной команды: ollama run qwen3.5:9b.

Главная интрига — в бенчмарках 9B-модели. По данным Qwen, она набирает 82.5 на MMLU-Pro — против 80.8 у GPT-OSS-120B и 80.9 у Qwen3-30B-A3B, модели с тройным количеством параметров. На GPQA Diamond разрыв еще заметнее: 81.7 против 73.4 у Qwen3-30B-A3B. В агентных задачах 9B-версия показывает 66.1 на BFCL-V4 (tool use) и 79.1 на TAU2-Bench — результаты, которые еще полгода назад были недоступны моделям даже втрое крупнее.

Все модели построены на гибридной архитектуре Gated DeltaNet + Gated Attention в соотношении 3:1: три слоя с линейным вниманием на каждый слой полного квадратичного. Это позволяет нативно поддерживать контекст в 262 тысячи токенов с расширением до миллиона — в модели размером 9 млрд параметров. Каждая модель мультимодальна из коробки: единый пайплайн текст + изображения + видео, без отдельных VL-версий. Поддержка языков расширена с 119 до 201.

Даже 4B-модель выдает числа, которые заставляют перечитать таблицу дважды: 79.1 на MMLU-Pro (на уровне GPT-OSS-120B), 76.2 на GPQA Diamond и 85.1 на MathVista — при этом для запуска должно хватить видеокарты уровня RTX 3060/4060. Самая маленькая, 0.8B, предназначена для встраиваемых устройств и edge-сценариев.

P.S. Поддержать меня можно подпиской на канал

самит Apache крипто runawayllm

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Meta* отложила ИИ-модель Avocado: она проиграла Google и OpenAI на внутренних тестах habr.com / 3 месяца назад

«Claude купил мне машину»: разработчик натравил ИИ на 20 дилеров — и получил скидку $2 000 habr.com / 3 месяца назад

Claude уже пишет до 90% кода своих будущих версий — и в Anthropic говорят, что это только начало habr.com / 4 месяца назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

15.07 / 23:46

технологии смартфон самит гаджет Почему смартфон заряжается медленно: дело может быть не в кабеле

При покупке кабеля для смартфона специалисты советуют учитывать не только его длину, но и качество изготовления.

15.07 / 22:13

экономика общество семья самит психология Простая вещь, которую мужчины не могут понять о зрелых женщинах

Писательница Ким Петерсен объяснила, почему кризис среднего возраста у женщин — это не капризы или менопауза, а глубокая перестройка всей жизни.

15.07 / 22:10

Samsung технологии здоровье история общество В сеть утекли официальные изображения всех новинок Samsung перед Galaxy Unpacked

Если информация подтвердится, уже 22 июля на мероприятии в Лондоне компания представит сразу несколько флагманских устройств нового поколения: Galaxy Z Fold8, Galaxy Z Fold8 Ultra, Galaxy Z Flip8, Galaxy Watch9 и Galaxy Watch Ultra 2. На данный момент речь идет об утечке, однако опубликованные изображения выглядят как официальные маркетинговые рендеры и совпадают с более ранними инсайдерскими данными.

15.07 / 20:21

Apple самит мода и стиль Parke MacRumors LEGO выпустит набор с легендарным iMac G3: проект прошел важный этап отбора

Платформа LEGO Ideas позволяет поклонникам бренда предлагать собственные концепции будущих наборов. Если проект набирает не менее 10 000 голосов, его рассматривает специальная комиссия LEGO, которая решает, стоит ли запускать модель в серийное производство.

15.07 / 19:47

продукты люди здоровье общество Здоровье и красота Две лучшие крупы для похудения назвали ученые

Эксперты рассказали, в каких случаях лучше выбрать гречку, а в каких рис.

15.07 / 19:47

технологии общество рубль электромобиль пресс-служба UMO объявила о старте предзаказов электрического кроссовера UMO 5 для частных покупателей в России

Компания UMO объявила о старте приёма предзаказов на электрический кроссовер UMO 5 для частных покупателей и раскрыла цены и комплектации модели. Автомобиль будет доступен в двух версиях. Комплектацию «Про» оценили в 2,59 млн рублей, а версию «Макс» — в 2,79 млн рублей. Цены действуют с учётом субсидии при покупке электромобиля, рассказали Хабру в пресс-службе компании.

15.07 / 19:23

технологии AOC представила необычный портативный монитор с цветным E Ink-дисплеем

Вместо привычной LCD- или OLED-матрицы новинка получила цветной экран на основе электронной бумаги E Ink. Продажи уже стартовали в Китае, где устройство оценили в 4599 юаней (около 679 долларов).

15.07 / 19:18

продукты здоровье общество женщина Здоровье и красота Три продукта, которые необходимы всем женщинам после 40 лет

Какие продукты позитивно влияют на женский организм, поддерживают гормональный баланс и продлевают молодость.

15.07 / 19:18

люди здоровье общество самит сон Шесть недель недосыпания могут изменить тело - ученые

Даже незначительное недосыпание может повлиять на тело быстрее, чем кажется.

15.07 / 19:12

продукты OpenAI OpenAI представила Codex Micro — компактный девайс для удобного программирования и управления AI-агентами

OpenAI представила Codex Micro — компактное настольное устройство, созданное совместно с производителем механических клавиатур Work Louder. Это первый аппаратный продукт компании, ориентированный на программистов, которые используют в своей работе AI-платформу Codex.

Лента новостей

На главную страницу