Об этом же в других СМИ

habr.com / 1 год назад

Apple и Anthropic объединяются для создания платформы кодирования AI

habr.com / 1 год назад

Pinterest борется с AI-контентом: вводятся метки и элементы управления для пользователей

habr.com / 1 год назад

Gruve.ai привлек $20 млн для революции в IT-консалтинге с помощью искусственного интеллекта

habr.com / 1 год назад

Xiaomi представляет MiMo-7B — компактную модель для решения математических задач и задач по кодированию

habr.com / 1 год назад

Cast AI привлекает $108 млн для максимальной отдачи от AI

Больше по теме

23.04.2025 - 04:49 / habr.com

Исследователи внедряют COLORBENCH для проверки понимания цвета в моделях зрительного языка

Группа ученых из Мэрилендского университета разработала COLORBENCH — первый специализированный тест для систематической оценки того, как модели зрительного языка (VLM) воспринимают и обрабатывают цвет.По словам исследователей, результаты выявили фундаментальные недостатки в восприятии цвета — даже среди самых крупных моделей, доступных в настоящее время.

Цвет играет центральную роль в визуальном познании человека и имеет решающее значение в таких областях, как медицинская визуализация, дистанционное зондирование и распознавание продуктов. Однако остается неясным, интерпретируют ли и используют ли VLM цвет сопоставимыми способами.

COLORBENCH оценивает модели по трем основным параметрам: цветовосприятие, цветовая аргументация и устойчивость к изменениям цвета. Тест включает 11 задач с общим количеством 1448 экземпляров и 5814 запросов изображения-текста. Задачи требуют от моделей распознавать цвета, оценивать пропорции цвета, подсчитывать объекты определенных цветов или противостоять распространенным цветовым иллюзиям. Например, в одном тесте модели оцениваются на предмет согласованности, когда определенные сегменты изображения вращаются через разные цвета.

Тест использовался для тестирования 32 широко используемых VLM, таких как GPT-4o, Gemini 2 и ряда моделей с открытым исходным кодом с 78 миллиардами параметров. Результаты показывают, что более крупные модели, как правило, работают лучше, но эффект менее выражен, чем в других тестах. Разрыв в производительности между моделями с открытым исходным кодом и фирменными моделями также относительно невелик.

Все протестированные модели показали особенно слабую производительность в таких задачах, как подсчет цветов или тесты на дальтонизм, часто набирая менее 30% точности. Даже в

продукты общество самит gemini dilnaz04

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Википедия утверждает, что будет использовать AI, но не для замены людей habr.com / 1 год назад

Meta* представляет предварительный просмотр API для своих моделей искусственного интеллекта Llama habr.com / 1 год назад

Google запускает инструменты искусственного интеллекта для практики языков с помощью персонализированных уроков habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

18.07 / 04:05

технологии экономика промышленность Nvidia политика Экономисты опубликовали открытое письмо с призывом оценить влияние ИИ на экономику

200 экономистов и исследователей в области ИИ, включая 16 лауреатов Нобелевской премии, подписали открытое письмо с призывом к властям как можно скорее оценить влияние искусственного интеллекта на экономику.

18.07 / 04:04

общество климат профессор сад и огород интересное Райский сад на Марсе: ученые выяснили, как вырастить деревья на Красной планете

Исследователи нашли идеальное место для выращивания леса на Марсе.

18.07 / 03:45

промышленность история общество саммит климат Монолит «Чёрный ящик Земли» для записи истории климатического кризиса возведут на побережье Тасмании к концу 2026 года

К декабрю 2026 года на западе острова Тасмания (Австралия) завершится строительство стального монолита, который будет непрерывно собирать данные о состоянии планеты. Проект называется Earth's Black Box («Чёрный ящик Земли») и создан по аналогии с бортовым самописцем авиалайнера.

18.07 / 03:26

ученые здоровье общество жизнь самит Когда в организме закладываются курс на долгую жизнь - исследование

Ученые выяснили, какой фактор оказывает ключевое влияние на жизнь человека и ее длительность.

18.07 / 03:26

ученые наука природа Знаменитости интересное Новый вид огромного динозавра открыт благодаря одной кости

На северо-востоке Таиланда ученые обнаружили останки неизвестного ранее травоядного гиганта. Животное обитало в густых лесах около 143 миллионов лет назад.

18.07 / 01:01

медицина люди наука общество депрессия Не зрение и не слух: шестое чувство, о котором многие даже не слышали

Это чувство играет центральную роль в способности человека определять, находится ли его организм в состоянии баланса.

17.07 / 23:26

продукты люди здоровье общество человек Почему не стоит полностью отказываться от соли - ответ врачей

Соль считают вредной, однако ее полное исключение из рациона может привести к неприятным последствиям для здоровья и самочувствия.

17.07 / 22:52

самит Знаменитости курс nintendo мода и стиль Casio выпустила лимитированные G-Shock в стиле культовой Mother 3: часы получили необычный дизайн и эксклюзивный способ продажи

Компания Casio официально представила новую лимитированную версию часов G-Shock DW-5600, созданную совместно с культовой игровой франшизой Mother от Nintendo. Новинка посвящена 20-летию игры Mother 3 и получила яркое оформление, вдохновленное одной из самых запоминающихся сцен проекта.

17.07 / 20:44

Samsung технологии reddit Samsung объяснила странный дефект экрана Galaxy S26 Ultra: проблема оказалась не такой серьезной, как опасались владельцы

Некоторые владельцы Samsung Galaxy S26 Ultra обратили внимание на необычную особенность дисплея нового флагмана. При использовании смартфона на максимальной яркости под прямыми солнечными лучами в центральной части экрана может появляться легкий красноватый оттенок. Сначала пользователи предположили, что речь идет о серьезной аппаратной неисправности, однако Samsung уже выступила с официальным разъяснением и подтвердила, что готовит программное исправление.

17.07 / 20:12

продукты медицина общество самит жара Как охладить кровать за 10 минут - простой трюк, спасающий от жары

Жаркие летние ночи часто становятся настоящим испытанием, но есть способ с этим справиться.

Лента новостей

На главную страницу