

Галлюцинации недели: Gemma 4 12B, Odysseus от PewDiePie и MiniMax M3, который научился видеть
NVIDIA закрывает Computex тремя релизами, Microsoft показывает сразу семь моделей MAI, а серия Opus развивается по-своему: 4.7 ленился, 4.8 врёт, 4.9 будет просить на додеп.
💡 Впервые написал это у себя в блоге «Контролируемые галлюцинации». Оригинал статьи здесь.
Залп NVIDIA открыл Cosmos 3, открытая омнимодальная world-модель, держит в одной архитектуре Mixture-of-Transformers язык, картинки, видео, звук и действия. Устроена она так: сначала reasoner-блок разбирается, что происходит в сцене, потом генеративный блок это дорисовывает, поэтому физика в роликах ведёт себя осмысленнее. По замерам Artificial Analysis post-training версии встали на первое место среди открытых моделей в text-to-image и image-to-video. Целятся в робототехнику: модель выдаёт и видео, и числовые траектории движения, то есть готовые данные для обучения роботов.
Следом Дженсен Хуанг показал Nemotron 3 Ultra, сильнейшую на сегодня открытую модель из США. 550 миллиардов параметров, из них активны 55 (это MoE, где на каждый токен работает только часть сети). Архитектура гибридная, Mamba плюс attention, претрейн целиком в NVFP4 на 20 триллионах токенов, контекст до миллиона. По индексу интеллекта Artificial Analysis она набрала 47.7, обойдя все американские открытые модели, но всё ещё уступая китайской Kimi K2.6 с её 53.9. Зато быстрая: NVIDIA заявляет до 5 раз выше пропускную способность, чем у конкурентов того же класса, что для долгих агентских задач важнее лишнего балла на бенчмарке.
Под занавес NVIDIA вышла на территорию ПК с RTX Spark, "персональным AI-компьютером" на связке Grace и Blackwell: до 128 ГБ общей памяти, 1 петафлопс в FP4, обещание гонять локально модели на 120B параметров. Но случился конфуз. Половина изданий написала про 600 ГБ/с
Читать на habr.com
