Об этом же в других СМИ

habr.com / 1 год назад

Google запускает «скрытое кэширование», чтобы сделать доступ к своим новейшим моделям AI дешевле

habr.com / 1 год назад

Новая небольшая модель искусственного интеллекта Ai2 превосходит аналогичные по размеру модели от Google и Meta*

habr.com / 1 год назад

Microsoft бросает вызов OpenAI с новыми моделями AI Phi-4 с открытым исходным кодом

habr.com / 1 год назад

Amazon запускает Nova Premier — свою самую мощную на сегодняшний день AI-модель

habr.com / 1 год назад

Amazon обновляет Q Business, чтобы позволить компаниям создавать публичные чат-боты

Больше по теме

06.05.2025 - 06:03 / habr.com

LM Arena обвиняют в предоставлении «избранным» AI-компаниям несправедливых преимуществ при тестировании моделей

В новом документе лаборатории искусственного интеллекта Cohere, Стэнфорда, Массачусетского технологического института и Ai2 обвиняется LM Arena, организация, стоящая за популярным краудсорсинговым бенчмарком в области искусственного интеллекта Chatbot Arena, в помощи избранной группе компаний, занимающихся разработкой искусственного интеллекта, в достижении более высоких результатов в рейтингах за счет конкурентов.

По словам авторов, LM Arena позволила некоторым ведущим в отрасли компаниям AI, таким как Meta*, OpenAI, Google и Amazon, провести закрытое тестирование нескольких вариантов моделей AI, а затем не публиковать оценки худших исполнителей. Это облегчило этим компаниям задачу занять лидирующие позиции в рейтинге платформы, хотя такая возможность была предоставлена не каждой фирме, говорят авторы.

«Лишь нескольким компаниям сообщили, что это частное тестирование доступно, и объем частного тестирования, которое получили некоторые компании, просто намного больше, чем другие», — сказала вице-президент Cohere по исследованиям AI и соавтор исследования Сара Хукер в интервью TechCrunch. «Это геймификация».

Chatbot Arena, созданная в 2023 году как академический исследовательский проект Калифорнийского университета в Беркли, стала эталоном для компаний, занимающихся AI. Она работает, помещая ответы двух разных моделей AI рядом в «битве» и предлагая пользователям выбрать лучшую из них. Нередко можно увидеть невыпущенные модели, соревнующиеся на арене под псевдонимом.

Голоса с течением времени влияют на оценку модели — и, следовательно, на ее место в таблице лидеров Chatbot Arena. Хотя в Chatbot Arena участвуют многие коммерческие игроки, LM Arena давно утверждает, что ее бенчмарк является беспристрастным и справедливым.

Однако

Amazon общество капитал инвестор google dilnaz04

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Xiaomi представляет MiMo-7B — компактную модель для решения математических задач и задач по кодированию habr.com / 1 год назад

JetBrains выпускает Mellum, открытую модель кодирования AI habr.com / 1 год назад

DeepSeek обновляет свою математическую модель искусственного интеллекта Prover habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

20.07 / 14:08

интересное Прорыв в исследовании океанического дна: ученые обнаружили 73 подводных вулкана

Это новаторское открытие стало возможным благодаря использованию алгоритма, первоначально разработанного для обнаружения ударных кратеров на Марсе. Ученые адаптировали его для анализа батиметрических карт океанского дна, которые представляют собой подробные изображения подводного рельефа.

20.07 / 14:04

закон общество выплаты курс google FTX анонсировала пятый раунд выплат. Объем компенсаций превысил $10 млрд

Криптобиржа FTX анонсировала пятый раунд выплаты компенсаций, который стартует 31 июля 2026 года. В рамках оного компания распределит среди кредиторов, которые выполнили все требования до 16 июня, около $900 млн. Напомним, суд утвердил план выплаты компенсаций кредиторам FTX в октябре 2024 года. Согласно ему, общая сумма по претензиям к компании составляет около $16 млрд-$17 млрд. Отличительной особенностью плана является тот факт, что клиенты биржи получают возмещен

20.07 / 13:58

роботы дефицит honda Honda выпустила автономную электро-газонокосилку по цене кроссовера: ProZision Autonomous ZTR уже в продаже

Пока вы пытаетесь уговорить домашний робот-пылесос не жевать шнурки под кроватью, Honda выводит на рынок тяжелую артиллерию для ландшафтного дизайна. Полностью электрическая и автономная газонокосилка ProZision Autonomous ZTR наконец достигла конвейера в Северной Каролине и начала поступать к дилерам. Цена вопроса — 33 000$ (1 470 000 грн), что ставит её в один ряд с вполне приличными автомобилями.

20.07 / 13:43

связь ученые общество климат Земля Климат на Земле ждут катастрофические изменения - исследование

Океаны играют ключевую роль в формировании климата на Земле, в связи с чем одна загвоздка привет к катастрофе.

20.07 / 13:43

продукты люди здоровье продукты питания общество В чем опасность черного хлеба, рассказал опытный врач

Темный хлеб считается более полезным для здоровья, но это не всегда так, предупреждают врачи.

20.07 / 13:43

продукты люди здоровье Здоровье и красота полезные продукты Какое мясо стоит выбирать людям после 40 лет

После 40 лет заметно ухудшается метаболизм и обмен веществ. При этом потребность в микроэлементах и железе возрастает.

20.07 / 13:43

продукты люди здоровье общество Здоровье и красота Назван напиток, который препятствует развитию рака и диабета

Ученые доказали, что защитный эффект этого продукта связан с уникальным набором питательных веществ.

20.07 / 13:43

люди здоровье прогноз буря Солнце Магнитная буря уже мчится к Земле - названы опасные даты

Сильная магнитная буря вскоре обрушится на планету. Всем метеозависимым людям стоит поберечь здоровье и запастись медикаментами.

20.07 / 13:43

ученые общество семья самит человек Миф о передаче проблем со зрением по наследству развенчали эксперты

Специалисты рассказали, как на самом деле человек приобретает проблемы со зрением с рождения.

20.07 / 13:43

люди здоровье общество лечение болезнь Проверьте свои руки - назван неочевидный симптом опасной болезни

Врачи призывают обращать особое внимание на специфические изменения в подвижности пальцев рук, ведь они могут быть признаком опасной болезни.

Лента новостей

На главную страницу