Об этом же в других СМИ

gagadget.com / 1 год назад

Четвёртое судно BYD для перевозки автомобилей отправилось в первое плавание в Бразилию

habr.com / 1 год назад

Энтузиаст запустил Llama 2 на ПК с DOS

gagadget.com / 1 год назад

Doom Slayer украсит ваш экран: для Xbox Series вышла динамическая тема в тематике DOOM: The Dark Ages

habr.com / 1 год назад

Вышла СУБД MySQL 9.3.0

habr.com / 1 год назад

Вышла книга «История моей страны. Записки военного инженера программиста»

Больше по теме

09.04.2025 - 04:49 / habr.com

Вышла Llama 4 с контекстным окном в 10M токенов (в 50 раз больше конкурентов)

Meta представила новое поколение открытых моделей искусственного интеллекта — семейство Llama 4. Это первые нативно мультимодальные модели с открытыми весами, которые объединяют понимание изображений, видео и текста в единой архитектуре.

P.S кратко написал об этом в Телеграм канале, ссылка на пост

1. Llama 4 Scout - модель с 17 млрд активных параметров и 16 экспертами (109 млрд параметров в общей сложности). Является лучшей мультимодальной моделью в своём классе, превосходящей Gemma 3, Gemini 2.0 Flash-Lite и Mistral 3.1. Главная особенность - рекордное контекстное окно в 10 млн токенов и возможность работы на одной GPU H100 (с квантизацией Int4).

2. Llama 4 Maverick - мощная модель с 17 млрд активных параметров и 128 экспертами (400 млрд параметров в общей сложности). По заявлению Meta, превосходит GPT-4o и Gemini 2.0 Flash по широкому спектру бенчмарков, при этом показывая результаты, сравнимые с DeepSeek v3 в задачах рассуждения и кодирования, но при вдвое меньшем количестве активных параметров. Экспериментальная версия для чата достигла ELO 1417 на LMArena.

3. Llama 4 Behemoth - учительская модель с 288 млрд активных параметров, 16 экспертами и почти 2 триллионами общих параметров. По утверждению Meta, превосходит GPT-4.5, Claude Sonnet 3.7 и Gemini 2.0 Pro по нескольким STEM-бенчмаркам. Эта модель еще находится в процессе обучения и не выпущена публично.

Архитектура Mixture of Experts (MoE)

Впервые в линейке Llama используется архитектура MoE, где для обработки каждого токена активируется лишь часть параметров модели. Это значительно повышает эффективность как обучения, так и инференса.

Например, в Llama 4 Maverick каждый токен обрабатывается общим экспертом и одним из 128 маршрутизируемых экспертов, что позволяет

экономика золото общество предприятия крипто токен gemini

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Вышла новая сертифицированная ФСТЭК версия Deckhouse Kubernetes Platform с mTLS и приоритизацией нагрузки habr.com / 1 год назад

Слухи: ремастер The Elder Scrolls IV: Oblivion весит 120 ГБ, что в 22 раза больше, чем оригинальная игра gagadget.com / 1 год назад

Игра вышла, а разработчики этого не знали: из-за ошибки стратегия Tempest Rising стала доступной геймерам на неделю раньше запланированного срока gagadget.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

25.07 / 03:21

люди общество психология психика Психология и отношения 4 привычки, которые мешают вам стать эмоционально умнее

Эмоциональный интеллект часто проявляется не в действиях, а в том, от каких привычек человек отказывается в повседневной жизни.

25.07 / 02:35

происшествия ученые наука золото история Индийский океан в степи – редкие находки археологов в Казахстане

Ученые нашли кирпичи государственного стандарта ордынской эпохи. Из этого материала строили мечети и дворцы знати.

25.07 / 01:47

люди ученые наука история самит Подземная сеть неолита – археологи раскопали скрытые ходы в КНР

Обнаруженные подземные ходы имеют на удивление одинаковые и точные размеры. Их высота составляет около 1,8 метра, а ширина — чуть более метра.

25.07 / 01:00

люди здоровье общество самит психология Люди с высоким уровнем осознанности считают непривлекательными 6 черт

Почему поведение важнее внешности и какие привычки чаще всего отталкивают людей, которые умеют анализировать себя и других.

24.07 / 23:24

продукты здоровье самит человек мозг Память с возрастом ухудшается — какие продукты могут ее поддержать

С возрастом мозгу требуется особенно внимательное отношение к рациону, поскольку питание напрямую связано с состоянием когнитивных функций.

24.07 / 21:54

технологии происшествия общество самит кибератаки Исследование показало, насколько Windows 10 уступает Windows 11 по безопасности: разница оказалась почти трехкратной

Согласно результатам исследования, на одном ПК с Windows 10 в среднем обнаруживается 1903 активные уязвимости. Для компьютеров с Windows 11 этот показатель составляет 652 уязвимости. Таким образом, разница достигает почти трехкратного значения, что делает более новую операционную систему значительно безопаснее с точки зрения защиты от современных киберугроз.

24.07 / 20:48

технологии общество самит google Google разрешила входить в аккаунт с помощью селфи-видео: новая функция может заменить пароль в экстренных случаях

Новая система работает на основе предварительно записанного селфи-видео. Во время первоначальной настройки пользователю необходимо посмотреть в камеру смартфона и выполнить несколько простых движений головой по подсказкам на экране. Это позволяет системе зафиксировать лицо с разных ракурсов и создать защищенный биометрический шаблон для последующей проверки личности.

24.07 / 20:03

медицина здоровье история общество прогноз В какой стране женщины будут жить дольше всех в мире

Благодаря развитому здравоохранению и здоровому образу жизни южнокорейские женщины имеют все шансы установить мировой рекорд долголетия.

24.07 / 20:03

люди дети общество психология психика Как распознать нарцисса — 5 вещей, от которых он получает удовольствие

Психологи рассказали, от чего эгоистичные люди получают настоящее удовольствие и почему они так себя ведут.

24.07 / 19:15

технологии Apple общество курс планшеты WhatsApp получил сразу четыре полезных обновления: приложение стало удобнее на iPad, в автомобиле и при работе с PDF

Все нововведения уже начали поэтапно становиться доступными пользователям по всему миру. Как обычно, распространение происходит постепенно, поэтому некоторые функции могут появиться не сразу после установки последней версии приложения.

Лента новостей

На главную страницу