Об этом же в других СМИ

cursorinfo.co.il / 1 год назад

Врачи подчеркнули опасность популярного предмета для хранения еды на кухне

chudo.tech / 1 год назад

Создан уникальный «метабот», способный изменять форму и выполнять команды

habr.com / 1 год назад

Калифорнийский университет: GPT-4o создает красивые изображения, но проваливает тесты на логику

habr.com / 1 год назад

Western Digital запускает процесс добычи редкоземельных и драгоценных металлов из жёстких дисков

cursorinfo.co.il / 1 год назад

Пищевые привычки, замедляющие метаболизм, назвали диетологи

Больше по теме

09.04.2025 - 02:05 / hitechexpert.top

Мета попала в тесты игрового ИИ

За выходные дни, Мета представила две новые модели Llama 4: модель меньшего размера под названием Scout и модель среднего размера Maverick, которую компания требования может превзойти GPT-4o и Gemini 2.0 Flash «по широкому спектру известных тестов».

Maverick быстро занял второе место на LMArena, сайте тестирования искусственного интеллекта, где люди сравнивают производительность разных систем и голосуют за лучшую. В пресс-релизе Meta компания подчеркнула, что оценка ELO Maverick составила 1417 баллов, что ставит ее выше OpenAI (4o) и немного ниже Gemini 2.5 Pro. (Более высокая оценка ELO означает, что модель с большей вероятностью победит на арене, когда столкнется с конкурентами.)

Это достижение, казалось, позиционирует Llama 4 с открытым исходным кодом от Meta как серьезного конкурента самым передовым моделям с закрытым исходным кодом от OpenAI, Anthropic и Google. Однако исследователи ИИ, копающиеся в документации Meta, обнаружили нечто необычное.

В мелком шрифте Meta признает, что версия Maverick, протестированная на LMArena, отличается от общедоступной. Согласно собственным материалам Meta, она развернула «экспериментальную чат-версию» Maverick на LMArena, которая была специально «оптимизирована для разговорного языка», как впервые сообщил TechCrunch.

«Интерпретация Meta нашей политики не соответствовала тому, чего мы ожидаем от поставщиков моделей», — написала LMArena на X через два дня после выпуска модели. «Meta должна была ясно дать понять, что «Llama-4-Maverick-03-26-Experimental» — это настраиваемая модель, оптимизированная для человеческих предпочтений. В результате мы обновляем нашу политику в отношении таблиц лидеров, чтобы усилить нашу приверженность справедливым, воспроизводимым оценкам, чтобы подобная

люди политика Мета самит gemini

Читать на hitechexpert.top

Все новости от hitechexpert.top

Об этом же в других СМИ

Как повысить свой метаболизм – эксперты назвали эффективные способы cursorinfo.co.il / 1 год назад

«Яндекс Фабрика» выпустила линейку производительных ноутбуков в металлическом корпусе Lunnen Outer 16 habr.com / 1 год назад

Китай запретил публичные бета-тесты автомобилей с автономным вождением gagadget.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

05.07 / 19:05

самит курьез деревня Sun Кебабы спровоцировали "войну" в самой живописной деревне Англии

Британский ресторатор столкнулся с сопротивлением общины, защищающей культурное наследие поэта Уильяма Вордсворта от запаха жира и круглосуточных очередей.

05.07 / 19:05

продукты Путешествия продукты питания самит магазин Почему яйца в магазинах не выставляют в холодильниках

Зарубежные торговые сети сознательно отказываются от охлаждения этого продукта на прилавках. За таким решением кроется строгий физический расчет.

05.07 / 19:05

происшествия общество психология смерть психика "Мы не позволим": американка описала 10 минут клинической смерти

Пациентка детально описала момент своего выхода из физического тела в больнице. В эту секунду ее полностью покинули тревога, грусть и боль.

05.07 / 19:05

продукты общество вредные продукты ожирение мозг Как уменьшить тягу к сладкому - советы, которые "работают"

Регулярное злоупотребление сладким повышает риск ожирения, диабета второго типа и сердечно-сосудистых заболеваний.

05.07 / 18:12

самит токен Эксперты убедили ИИ, что 2+2 не равно 4

Компания кибербезопасности LayerX разработала схему атаки BioShocking в формате игры для обмана искусственного интеллекта. В итоге исследователям удалось убедить ИИ, что 2+2 не равно 4.

05.07 / 18:12

Telegram журналист В Telega заверили, что слив публикаций пользователей проекта технически невозможен

В администрации альтернативного клиента Telegram под названием Telega сообщили, что нет никаких подтверждений фактов продаж переписок пользователей проекта. В команде Telega заверили, что слив публикаций пользователей проекта технически невозможен.

05.07 / 17:14

музыка СМИ президент Sony playstation Хидэо Кодзима недоволен решением Sony: легендарный геймдизайнер осудил отказ от выпуска дисков

С 1 января 2028 года Sony прекратит выпуск физических изданий всех своих игр для PlayStation. Соответствующее сообщение прозвучало несколько дней назад и стало одной из главных тем в СМИ, выйдя за пределы игрового сообщества.

05.07 / 17:11

Представлен открытый проект RayTracer — система трассировки лучей, реализованная на языке SQL

Сооснователь СУБД ClickHouse Алексей Миловидов с помощью ИИ-ассистента Claude представил систему трассировки лучей RayTracer, реализованную целиком на языке SQL. Рендеринг с симуляцией освещения на базе трассировки путей в решении реализован в виде одного SQL-запроса без пользовательских функций (UDF) и без подключения внешнего кода.

05.07 / 17:11

технологии президент история google Nano Google показала функцию Gemini с ответами о происходящем за окном

Google продемонстрировала экспериментальную функцию Gemini, которая позволяет ИИ-помощнику отвечать на вопросы о том, что окружает автомобиль, временно используя фронтальную камеру.

05.07 / 17:07

технологии общество самит психология мужчина Конфликт поколений – 9 выражений, которые понятны только старшим

Разрыв в коммуникации между поколениями проявляется не только в образе жизни, но и в языке. Многие устоявшиеся фразы прошлого сегодня кажутся зумерам загадками.

Лента новостей

На главную страницу