Об этом же в других СМИ

gagadget.com / 1 год назад

Starfield изначально должен был содержать больше жестокости, но технические сложности и большая путаница отбросили эту идею

techno.nv.ua / 1 год назад

Большой успех. В 2024 году крупнейший производитель чипов в мире TSMC рекордно увеличил выручку

habr.com / 1 год назад

Релиз NWinfo 1.1.0 — открытого портативного инструмента для быстрого просмотра ключевых характеристик ПК на Windows

cursorinfo.co.il / 1 год назад

Развеян самый большой миф о квашеных продуктах и солениях, в который все верят

cursorinfo.co.il / 1 год назад

Впервые в истории: предсвадебный ритуал самой большой рыбы попал на видео

Больше по теме

25.12.2024 - 12:13 / habr.com

Маленькая модель, большой эффект: Glider от Patronus AI превосходит GPT-4 в ключевых задачах оценки AI

Стартап, созданный бывшими сотрудниками Meta AI, представил легковесную модель искусственного интеллекта, способную оценивать другие AI-системы так же эффективно, как и более крупные аналоги, при этом предоставляя подробные объяснения своих решений. Patronus AI выпустила Glider, языковую модель с открытым исходным кодом, содержащую 3,8 миллиарда параметров. Она превосходит GPT-4o-mini от OpenAI по нескольким ключевым критериям оценки AI-результатов, выступая в роли автоматизированного оценщика, который может анализировать реакции AI-систем по сотням различных параметров, объясняя свои выводы.

Эта разработка знаменует собой важный шаг вперед в области оценки AI. В отличие от крупных запатентованных моделей, таких как GPT-4, которые могут быть дорогостоящими и непрозрачными, Glider более экономична и предоставляет ясные обоснования своих решений с помощью маркеров и выделенных текстовых фрагментов.

"Сейчас у нас много юристов, выступающих в роли судей, но мы не знаем, кто из них лучше всего подходит для нашей задачи", – пояснил Даршан Дешпанде, ведущий инженер-исследователь Patronus AI. "Мы создали модель, которая работает на устройстве, использует только 3,8 миллиарда параметров и предоставляет высококачественные цепочки рассуждений."

Glider демонстрирует, что меньшие языковые модели могут быть столь же эффективными или даже превосходить большие модели для специализированных задач, работая с задержкой всего в одну секунду. Это делает ее подходящей для приложений реального времени, где важна быстрая оценка AI-результатов. Одной из ключевых особенностей Glider является способность одновременно оценивать множество аспектов AI-результатов, таких как точность, безопасность и тональность, без необходимости в отдельных этапах

закон общество стартап Meta Ai mefdayy

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

В секторе Ethereum-ETF зафиксировали самый большой с июля 2024 года отток капитала incrypted.com / 1 год назад

Анализ применения украинских беспилотников большой дальности hitechexpert.top / 1 год назад

Технології для ефективності. Наскільки продуктивні ноутбуки Lenovo ThinkPad у реальних задачах – досвід топменеджерів Ощадбанку forbes.ua / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

24.07 / 12:41

связь ученые общество прогноз человек Почему человек иногда не видит предметы перед ним - ответ удивит

Ученые выяснили, как мозг человека способен не замечать предметы, которые находятся в поле зрения.

24.07 / 12:28

технологии санкции СМИ Telegram общество Mediascope: в июне 2026 года Max впервые занял первое место среди мессенджеров в России по месячному охвату аудитории

Согласно аналитическим данным исследовательской компании Mediascope, мессенджер Max стал лидером по охвату месячной аудитории в России. В июне 2026 года мобильное приложение этого проекта и веб-версию запустили около 86,2 млн пользователей.

24.07 / 12:28

технологии Microsoft представила функцию Trusted Launch для ВМ в Windows Server Insider Preview

Microsoft анонсировала обновление для виртуальных машин в последней сборке Insider для Windows Server.

24.07 / 12:28

SpaceX самит Дом и интерьер Представлен улучшенный пользовательский терминал Starlink V5

SpaceX начала продавать новую версию домашней спутниковой антенны Starlink V5 в отдельных регионах. Устройство предлагает повышенную энергоэффективность, обладает более компактными размерами и весом по сравнению с моделью V4.

24.07 / 12:17

бизнес закон выплаты электроэнергия майнинг Бывший крупнейший майнинговый пул мира Poolin дошел до банкротства и продает активы

Сингапурская компания Poolin, которая в свое время была крупнейшим биткоин-майнинговым пулом в мире, вместе с дочерними структурами Lonestar Dream Inc и Lonestar Taproot LLC подала заявление о банкротстве по процедуре Chapter 11 в Суд США по делам о банкротстве округа Нью-Джерси. Компания планирует продать майнинговые активы в Западном Техасе. Совокупное предложение на $52 млн станет так называемой stalking horse bid — минимальной базовой ставкой для будущего аукциона, чтобы максимизировать выплаты креди

24.07 / 12:16

технологии экономика экспедиция интересное oppo Oppo K15: смартфон с встроенным вентилятором и аккумулятором, которого хватит на небольшую экспедицию

Oppo продолжает удивлять специфическими решениями в среднем ценовом сегменте. Пока большинство производителей стараются сделать свои смартфоны как можно тоньше, жертвуя автономностью, китайцы выпустили Oppo K15. Это базовая модель линейки, которая по характеристикам вполне может затмить старшие версии Pro и Pro+. Похоже, в компании решили, что современному пользователю нужен не очередной глянцевый аксессуар, а выносливый рабочий инструмент с «бонусами» в виде активного охлаждения.

24.07 / 12:16

Mercedes-Benz семья мода и стиль Mercedes-Benz VLE 300: Электрическая «маршрутка» в обёртке AMG за 4 миллиона гривен

Если вы считали, что концепция «Grand Limousine» — это исключительно о длинных седанах с баром и телевизором, в Штутгарте считают иначе. Mercedes-Benz решил, что электрический премиум-вэн VLE недостаточно пафосный, поэтому с 23 июля 2026 года модель получила серьёзное расширение серии. Теперь этот роскошный «автобус» можно заказать в спортивной обвеске AMG и с салоном на восемь мест. Возможно, чтобы большая семья или делегация бизнесменов чувствовали себя немного быстрее, даже стоя в пробке.

24.07 / 12:00

технологии смартфон Wi-Fi общество Как защитить смартфон от слежки в общественных местах: "секретная" настройка

Включенный в вашем смартфоне Wi-Fi передает другим пользователям ваш идентификатор устройства – MAC-адрес. Благодаря этому владельцы точек доступа в торговых центрах, аэропортах, ресторанах и других заведениях могут отслеживать ваши передвижения, продолжительность и частоту посещений.

24.07 / 12:00

Facebook технологии история общество самит Meta* тестирует ИИ-приложение для создания сказок на ночь

Компания Meta* работает над ИИ-приложением под названием StoryKit, которое генерирует детские истории, само создаёт персонажей и сюжеты.

24.07 / 12:00

связь технологии музыка Яндекс общество «Яндекс Музыка» разработала технологию совместных рекомендаций — «Мою волну» теперь можно слушать вдвоём

Команда сервиса «Яндекс Музыка» разработала технологию совместных рекомендаций и запустила «Мою волну на двоих». Решение совмещает вкусы сразу двух пользователей, а слушать «Мою волну на двоих» можно на своём устройстве и в любое удобное время.

Лента новостей

На главную страницу