



Mistral выпустила модель Large 3 675B и девять версий Ministral 3 (3B/8B/14B × Base/Instruct/Reasoning)
Французский стартап Mistral во вторник представил семейство моделей Mistral 3.
В релиз вошли десять моделей: одна крупная, оснащённая мультимодальными и многоязычными возможностями; а также девять компактных офлайн‑версий, которые можно кастомизировать под задачи заказчика.
Первые бенчмарки, где компактные модели Mistral заметно уступают закрытым конкурентам, могут ввести в заблуждение, отмечает он. Крупные закрытые модели и правда выглядят лучше «из коробки», но настоящие преимущества проявляются только при файнтюнинге.
Флагманская модель, получившая название Mistral Large 3, вплотную подбирается к возможностям крупных закрытых систем вроде ChatGPT 4o от OpenAI и Gemini 2 от Google, одновременно уверенно конкурируя с ведущими открытыми моделями. Large 3 — одна из первых открытых «передовых» моделей, в которой мультимодальность и многоязычие собраны под одной крышей, что ставит её в один ряд с Llama 3✶ от Meta✶ и Qwen3 Omni от Alibaba. Большинство компаний до сих пор комбинируют мощные LLM с отдельными мультимодальными модулями — так же, как делала и сама Mistral с Pixtral или Small 3.1.
Large 3 построена на архитектуре granular mixture of experts и использует 41 млрд активных параметров (из 675 млрд общих), что позволяет уверенно рассуждать в рамках контекста до 256 тысяч токенов. Эта структура сочетает скорость и интеллектуальную гибкость: модель может анализировать длинные документы, работать как агентный помощник и справляться со сложными корпоративными задачами. Mistral позиционирует Large 3 как универсальный инструмент для анализа документов, программирования, создания контента, работы ИИ‑ассистентов и автоматизации рабочих процессов.
Одновременно с этим компания представила новую линейку компактных моделей
Читать на habr.com
