Muse Spark — первая LLM от Meta Superintelligence Lab
Пять агентов, которые спорят между собой
Главная фишка, которую сразу все обсуждают — мультиагентная архитектура. Внутри модели работает пять независимых агентов, и разработчики намеренно заставили их конфликтовать друг с другом. Не синхронизироваться, а именно спорить.
На практике это выглядит так: даёшь задачу, несколько агентов параллельно генерируют решения, а отдельный модуль-арбитр ищет противоречия между ними. Такой внутренний peer review в реальном времени.
В медицинских задачах это даёт 88% точности — против обычных ~70% у стандартных нейросеток на специфических диагнозах. Разница реально ощутимая.
При этом модель довольно компактная. Meta не раскрывает точные цифры, но по ощущениям — вряд ли больше 500 млрд параметров. Для сравнения, это вдвое меньше, чем у Mythos от Anthropic. Берёт не размером, а тем, как организован процесс рассуждения.
А не MoE эта хвалёная супер уникальная мультиагентная система? - нет, но похоже:
MoE (Mixture of Experts) — это архитектура на уровне весов модели. Грубо говоря, для каждого токена активируется только часть параметров (эксперты). Всё происходит внутри одного прогона, пользователь этого не видит.
Мультиагентность как в Muse Spark — это другой уровень. Несколько отдельных моделей (или инстансов) запускаются параллельно, каждая генерирует своё решение, потом отдельный модуль сравнивает и арбитрирует между ними. Это ближе к тому, что называют multi-agent debate или self-consistency — направление, которое активно исследуется, но в продакшн-моделях встречается редко.
Зрение — это реально круто
Muse Spark изначально делали под умные очки Ray-Ban, и в компьютерном зрении она прёт. 92% точности в тестах — Gemini 3.1 чуть выше (94%), но Meta быстрее справляется с живым видеопотоком.
На
Читать на habr.com
