Mistral AI выпустила Small 3 — мощную языковую модель с 24 миллиардами параметров
Mistral AI выпустила Small 3 — новую языковую модель с 24 миллиардами параметров, которая по производительности не уступает гораздо более крупным моделям от Meta* и OpenAI. Компания также переходит на более либеральную лицензию Apache 2.0.
Компания Mistral AI заявляет, что Small 3 обеспечивает такую же производительность, как модели в три раза больше по размеру, при этом используя всего 24 миллиарда параметров. Модель, оптимизированная для низкой задержки и локального развёртывания, является продолжением предыдущей версии Mistral, выпущенной в сентябре 2024 года.
В тестах Small 3 показал результаты наравне со значительно более крупными моделями, включая Meta Llama-3.3-70B, Qwen2.5-32B и GPT-4o-mini. Модель достигла 81% точности в тесте MMLU, обрабатывая 150 токенов в секунду, что делает её одной из самых эффективных моделей в своей категории, по мнению Mistral.
Новая модель создана для выполнения повседневных задач без использования дорогостоящего оборудования. Она может быстро отвечать на сообщения в чате, выполнять определённые функции, адаптироваться к специализированным областям и работать на одном графическом процессоре, что делает её практичной для использования в реальных условиях.
По словам Мистраля, несколько отраслей уже тестируют эту технологию. Банки используют её для выявления мошенничества, а поставщики медицинских услуг и производители тестируют её для обслуживания клиентов и анализа их отзывов. Компании, занимающиеся робототехникой, также изучают потенциальные варианты использования.
Модель теперь доступна на платформе Mistral и у партнёров, включая Hugging Face, Ollama, Kaggle, Together AI и Fireworks AI. Планируется запуск на других платформах.
В этом выпуске Mistral переходит от собственной лицензии MRL
Читать на habr.com
