Об этом же в других СМИ

gagadget.com / 1 год назад

Польша стремится получить "ядерный зонтик" и от США, и от Франции

cursorinfo.co.il / 1 год назад

tech.onliner.by / 1 год назад

Ученым впервые удалось сделать фото колоссального арктического кальмара

habr.com / 1 год назад

ChatGPT может снова сделать медицину более человечной

forbes.ua / 1 год назад

Европа стремится занять место России в космосе. Реализацию ее стратегии возглавил стартап Creotech из Польши. Чем европейцы будут покорять рынок SpaceTech?

Больше по теме

01.04.2025 - 00:04 / habr.com

Judge-Image от Patronus AI стремится сделать ИИ честным — и Etsy уже внедрила эту технологию

Patronus AI представила мультимодальную языковую модель-судью (MLLM-as-a-Judge) — инструмент, предназначенный для оценки ИИ-систем, интерпретирующих изображения и генерирующих текст.

Эта технология оценки призвана помочь разработчикам выявлять и устранять галлюцинации и проблемы с надёжностью в мультимодальных ИИ-приложениях. Крупнейшая e-commerce платформа Etsy уже внедрила эту разработку для проверки точности подписей к изображениям товаров на своей площадке, где представлены изделия ручной работы и винтажные предметы.

«Мы невероятно рады объявить, что Etsy стала одним из наших первых клиентов», — сказал Ананд Каннаппан, сооснователь Patronus AI, в эксклюзивном интервью изданию VentureBeat. «На их платформе представлены сотни миллионов товаров, созданных людьми со всего мира. Их команда ИИ стремилась использовать генеративный ИИ для автоматической генерации подписей к изображениям и хотела убедиться, что при масштабировании на глобальную аудиторию эти подписи остаются точными».

Почему в основе нового ИИ-судьи лежит Gemini от Google, а не GPT от OpenAI

Первая модель MLLM-as-a-Judge от Patronus — Judge-Image — была создана на базе модели Gemini от Google после всестороннего сравнения с альтернативами, включая GPT-4V от OpenAI.

«Мы заметили, что GPT-4V чаще демонстрировала склонность к эгоцентричному восприятию, тогда как Gemini оказалась менее предвзятой и показала более сбалансированный подход к оценке различных пар "ввод-вывод"», — пояснил Каннаппан. «Это проявилось в равномерном распределении оценок по разным источникам».

Исследование компании также дало неожиданные результаты: в отличие от текстовых задач, где многошаговое рассуждение улучшает результаты, в мультимодальной оценке изображений это, как правило, не повышает

продукты технологии самит предприятия google gemini

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Почему Bungie решила сделать из Marathon extraction-шутер? Все из-за множества различных вариантов действий, которые становятся значимыми в этом жанре gagadget.com / 1 год назад

Как сделать завтрак полезным - четыре простых правила от диетолога cursorinfo.co.il / 1 год назад

BBC стремится повысить узнаваемость Apple и Google News hitechexpert.top / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

23.07 / 04:28

связь экономика общество семья Дом и интерьер «Ростелеком»: оптическая сеть компании охватила более двух третей российских домохозяйств

«Ростелеком» впервые раскрыл подробности развития оптических сетей в регионах России. Общая протяжённость волоконно‑оптических линий связи (ВОЛС) компании превысила 1,1 млн километров, что обеспечивает возможность подключения к высокоскоростному интернету для более чем двух из трёх семей страны, отметили в «Ростелекоме».

23.07 / 04:28

технологии AMD LDLC выпустила Stim Machine — компактный ПК на базе RX 9060 XT по цене ниже, чем у Steam Machine

Французский ретейлер LDLC выпустил Stim Machine (LDLC PC Box) — компактный игровой ПК на базе видеокарты Radeon RX 9060 XT по цене ниже, чем у Steam Machine от Valve. В разобранном виде новинка обойдётся в €1 тыс., а в собранном — в €1,04 тыс. Стоимость в собранном виде практически совпадает с европейской ценой Steam Machine на 512 ГБ и без геймпада Steam Controller.

23.07 / 03:34

продукты технологии продукты питания самит еда Как правильно солить воду для пасты – секреты от шеф-повара

Тщательно соблюдая проверенные рекомендации повара, можно превратить обычный процесс приготовления привычного блюда в настоящее гастрономическое удовольствие.

23.07 / 02:44

технологии закон президент общество политика Совет Федерации одобрил закон о развитии ИИ с правилами для фундаментальных моделей и маркировки контента в интернете

Совет Федерации на пленарном заседании одобрил закон о развитии технологий искусственного интеллекта в России. Об этом сообщается на сайте верхней палаты парламента. Если президент России подпишет закон, документ вступит в силу 1 сентября 2026 года. Для части норм установят другие сроки.

23.07 / 02:37

продукты продукты питания иммунитет дефицит животный мир Энергия и бодрость – топ-22 продукта с высоким содержанием железа

Чтобы победить усталость и сохранить бодрость, регулярно включайте в рацион продукты, богатые железом.

23.07 / 02:37

происшествия наука история археология интересное Скрытый под болотом: в Швейцарии раскопали древнеримский город

Археологи обнаружили новые кварталы древнего поселения на Боденском озере. Находка позволяет детально изучить быт жителей на окраине империи.

23.07 / 01:20

здоровье закон семья лечение симптомы В США пастор подал иск против OpenAI из-за ответов ChatGPT по поводу состояния здоровья

Американский пастор Скотт Винтерс подал иск против OpenAI и генерального директора компании Сэма Альтмана. Он утверждает, что ответы ChatGPT задержали обращение за медицинской помощью, когда у него развилась тромбоэмболия легочной артерии.

23.07 / 01:03

люди общество семья журналист психология Семь редких привычек людей с несокрушимой уверенностью

Секрет стойкости: привычки людей, которых невозможно сломать.

23.07 / 00:10

технологии Apple Apple готовит масштабное обновление линейки Mac: новые чипы, OLED и редизайн

Apple работает над обновлением почти всей линейки компьютеров Mac. Как сообщает Bloomberg, компания планирует выпустить новые модели с обновленными процессорами, увеличенным объемом оперативной памяти, а также постепенно внедрять OLED-дисплеи. Часть новинок может дебютировать уже этой осенью, а другие в 2027–2028 годах.

22.07 / 23:55

люди общество семья политика самит Семь вещей, которых избегают социально умные люди

Разговорная речь отражает внутреннюю зрелость, а избыток информации и спешка часто вредят репутации.

Лента новостей

На главную страницу