Об этом же в других СМИ

habr.com / 1 год назад

Как масштабирование во время тестирования раскрывает скрытые способности к рассуждению в небольших языковых моделях

habr.com / 1 год назад

Microsoft и генеративный ИИ: как компания пытается сохранить интерес разработчиков и игроков

habr.com / 1 год назад

Логические модели OpenAI получили два полезных обновления

habr.com / 1 год назад

Искусственный интеллект учится понимать физику: как AI развивает интуитивные знания о мире

habr.com / 1 год назад

OpenAI меняет стратегию в области разработки с открытым исходным кодом: что ждать дальше?

Больше по теме

05.02.2025 - 09:52 / habr.com

Тест ChangeMyView: как OpenAI оценивает убедительность своих AI-моделей

OpenAI использовала сабреддит r/ChangeMyView для создания теста, предназначенного для оценки убедительности своих AI-моделей. Компания рассказала об этом в системной карточке — документе, в котором описывается, как работает система AI, — опубликованном вместе с новой моделью «рассуждения» o3-mini в пятницу.

Миллионы пользователей Reddit являются участниками сообщества r/ChangeMyView, где они публикуют свои мнения в надежде узнать о других точках зрения на тот или иной вопрос. В ответ на эти мнения другие пользователи приводят убедительные аргументы, объясняющие, почему автор мнения не прав.

Этот сабреддит — один из многих форумов Reddit, которые являются настоящей золотой жилой для технологических компаний, таких как OpenAI, которые хотят обучать модели AI на высококачественных данных, созданных людьми.

OpenAI заявляет, что собирает посты пользователей с r/ChangeMyView и просит свои модели AI написать в закрытой среде ответы, которые изменили бы мнение пользователя Reddit по какому-либо вопросу. Затем компания показывает ответы тестировщикам, которые оценивают убедительность аргументов, и, наконец, OpenAI сравнивает ответы моделей AI с ответами людей на тот же пост.

У разработчика ChatGPT есть сделка по лицензированию контента с Reddit, которая позволяет OpenAI обучаться на постах пользователей Reddit и отображать эти посты в своих продуктах. Мы не знаем, сколько OpenAI платит за этот контент, но, по сообщениям, Google платит Reddit 60 миллионов долларов в год по аналогичной сделке.

Тем не менее, OpenAI информирует TechCrunch о том, что оценка, полученная на основе ChangeMyView, не является результатом соглашения с Reddit. Неясно, каким образом OpenAI получила доступ к данным сабреддита, и компания утверждает, что не

продукты люди золото общество reddit google mefdayy

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Угроза безопасности: как злоумышленники могут манипулировать AI-агентами habr.com / 1 год назад

OpenAI пытается «не подвергать цензуре» ChatGPT habr.com / 1 год назад

Расшифровка мозговой активности: как Meta* и учёные из Испании восстанавливают предложения по сигналам мозга habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

17.07 / 16:19

Samsung технологии футбол Apple спорт Caviar представила эксклюзивные смартфоны в честь Месси и Роналду: выпустят всего по 19 экземпляров

Компания Caviar, известная созданием эксклюзивных версий популярных смартфонов с использованием драгоценных металлов и ювелирных технологий, официально анонсировала новую коллекцию Legends. Она посвящена двум величайшим футболистам современности — Лионелю Месси и Криштиану Роналду.

17.07 / 16:05

продукты люди здоровье общество питание Какие продукты важно исключить при болях в суставах

Врач рассказал о вредных для суставов продуктах и дал рекомендации, как избежать обострения проблемы.

17.07 / 16:05

продукты здоровье общество напитки мода и стиль Чем опасен чай в пакетиках, рассказали врачи

Вместе с пакетиками в ваш напиток попадает множество вредных элементов, говорят ученые.

17.07 / 16:03

бизнес технологии вооружение авиация деньги Kratos получила 400 миллионов на гиперзвук: когда скорость становится бизнесом

Пентагон продолжает выписывать чеки тем, кто обещает догнать и перегнать время. В этот раз повезло компании Kratos Defense Security Solutions, которой Министерство обороны США выделило около $400 млн (17.8 млрд грн). Деньги пойдут на развитие гиперзвуковых систем и других программ в области национальной безопасности. Компания уже заявила, что эти средства помогут ускорить разработку «инновационных» технологий и, наконец, масштабировать производство. Правда, конкретные детали проектов держат под замком из-за режима секретности — в мире больших скоростей лишние разговоры не приветствуются.

17.07 / 16:03

технологии Bethesda самит fallout RPG Bethesda о своих играх: анонс ремастеров Fallout 3 и New Vegas, Fallout от Obsidian, ускорение разработке TES VI и переход на Creation Engine 3

Bethesda Game Studios опубликовала масштабное открытое письмо к сообществу, в котором подвела итоги сорокалетней истории компании и поделилась амбициозными планами на ближайшие годы. Разработчики объявили о реструктуризации внутренних процессов, технологическом обновлении и масштабном расширении ключевых франшиз.

17.07 / 15:55

продукты самит Вышел веб-сервер Angie 1.12.0, созданный бывшей командой Nginx

В середине июля 2026 года разработчики из компании «Веб-Сервер» выпустили веб-сервер Angie 1.12.0. Это форк Nginx, который распространяется под разрешительной лицензией BSD. Проект получил сертификаты совместимости с российскими операционными системами «Ред ОС», Astra Linux Special Edition, «Роса Хром Сервер», «Альт» и «ФСТЭК‑версии Альт». Выпуск Angie 1.8.0 состоялся в декабре 2024 года. Релиз Angie 1.9.0 произошёл в апреле 2025 года. Выход Angie 1.10.0 случился в июле 2025 года. Сборка Angie 1.11.0 вышла в декабре 2025 года.

17.07 / 15:47

самит автомобиль Цвет авто, который труднее всего поддерживать в идеальном состоянии

Многие водители автомобилей этого цвета сожалеют о своем выборе, говорят специалисты.

17.07 / 15:47

люди животные общество жизнь самит Как видят мир собаки на самом деле - ответ ученых удивит

Зрение собак похоже на человеческое, однако есть необычная особенность этого органа.

17.07 / 15:47

связь люди здоровье общество мозг Как просмотр телевизора может увеличить риск деменции

Увлечение телевизором особенно может быть опасно для людей в возрасте. Опасным врачи считают время от 5 часов в день.

17.07 / 15:43

промышленность общество рубль курс работодатель Средняя зарплата выпускников первой магистратуры Центрального университета составила 315 тыс. рублей

Центральный университет подвёл итоги первого выпуска магистратуры. В 2026 году дипломы получили 147 студентов, завершивших обучение по направлениям «Математика и компьютерные науки» и «Бизнес‑информатика», рассказали Хабру в пресс‑службе вуза.

Лента новостей

На главную страницу