



Meta выпускает две модели искусственного интеллекта Llama 4
Мета объявила выпуск Llama 4, последней коллекции моделей искусственного интеллекта, которые теперь работают как помощники Meta AI в Интернете, а также в WhatsApp, Messenger и Instagram. Две новые модели, которые также можно загрузить с веб-сайта Meta или Hugging Face, — это Llama 4 Scout, небольшая модель, которая может «поместиться в один графический процессор Nvidia H100», и Llama 4 Maverick, которая больше похожа на GPT-4o и Gemini 2.0 Flash. Мета сообщает, что все еще находится в процессе подготовки Llama 4 Behemoth, которую генеральный директор Meta Марк Цукерберг называет «самой производительной базовой моделью в мире».
По данным Meta, Llama 4 Scout имеет контекстное окно в 10 миллионов токенов — рабочую память модели ИИ — и превосходит модели Google Gemma 3 и Gemini 2.0 Flash-Lite, а также Mistral 3.1 с открытым исходным кодом «по широкому спектру известных тестов», при этом «соответствуя одному графическому процессору Nvidia H100». Meta делает аналогичные заявления о производительности своей более крупной модели Maverick по сравнению с GPT-4o OpenAI и Gemini 2.0 Flash от Google и говорит, что ее результаты сопоставимы с DeepSeek-V3 в задачах кодирования и рассуждений, использующих «менее половины активных параметров».
Между тем, Llama 4 Behemoth имеет 288 миллиардов активных параметров с 2 триллионами параметров в общей сложности. Хотя он еще не выпущен, Meta утверждает, что Behemoth может превзойти своих конкурентов (в данном случае GPT-4.5 и Claude Sonnet 3.7) «по нескольким STEM-тестам».
Для Llama 4, по словам Meta, они перешли на архитектуру «смешанных экспертов» (MoE), подход, который экономит ресурсы, используя только те части модели, которые необходимы для выполнения конкретной задачи. Компания планирует
Читать на hitechexpert.top
