Об этом же в других СМИ

habr.com / 1 год назад

Hugging Face работает над копированием возможностей OpenAI Deep Research с помощью агента AI с открытым исходным кодом

habr.com / 1 год назад

Исследователи создали открытого конкурента модели рассуждений OpenAI o1 менее чем за $50

obozrevatel.com / 1 год назад

Компания OpenAI анонсировала новую версию ChatGPT для государственных учреждений: чего от нее ожидают

habr.com / 1 год назад

OpenAI провела ребрендинг, немного изменила логотип и представила новый шрифт OpenAI Sans

habr.com / 1 год назад

Робототехнический стартап Figure AI прекращает партнерство с OpenAI, чтобы создавать собственные модели AI

Больше по теме

22.01.2025 - 20:41 / habr.com

OpenAI тихо профинансировала независимый математический бенчмарк перед установлением рекорда с o3

Участие OpenAI в финансировании FrontierMath, ведущего AI-бенчмарка по математике, стало известно только тогда, когда компания объявила о рекордных показателях на этом тесте. Теперь разработчик бенчмарка, Epoch AI, признает, что следовало быть более прозрачными относительно их отношений.

FrontierMath, представленный в ноябре 2024 года, тестирует, насколько хорошо AI-системы могут справляться со сложными математическими задачами, требующими продвинутого рассуждения и навыков решения проблем — именно такие задачи обычно ставят в тупик даже самые продвинутые AI-системы. Проблемы для бенчмарка были созданы командой из более чем 60 ведущих математиков.

Связь между OpenAI и FrontierMath появилась 20 декабря, в тот же день, когда OpenAI представила свою новую модель o3. Система достигла беспрецедентного уровня успешности в 25,2 процента на сложных математических и логических задачах бенчмарка — это огромный скачок по сравнению с предыдущими моделями, которые не могли решить более двух процентов вопросов.

Epoch AI, разработавшая бенчмарк, подписала соглашение, запрещающее им раскрывать финансовую поддержку OpenAI до объявления о модели o3. Они признали связь в сноске после пятого обновления своей исследовательской работы, просто указав: "Мы с благодарностью признаем поддержку OpenAI в создании этого бенчмарка."

Согласно посту на LessWrong, более 60 математиков, участвовавших в создании задач для бенчмарка, не знали о вовлечении OpenAI — даже после объявления о модели o3. Хотя эти эксперты подписали соглашения о неразглашении, соглашения касались только сохранения конфиденциальности самих задач. Большинство считали, что их работа останется частной и будет использоваться исключительно Epoch AI, согласно посту.

Тамай Безироглу из Epoch

связь экономика самит финансирование dilnaz04

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

SoftBank инвестирует в автоматизацию работы с агентами OpenAI hitechexpert.top / 1 год назад

SoftBank планирует инвестировать до $25 млрд в OpenAI, сравнявшись с Microsoft habr.com / 1 год назад

Китайский конкурент OpenAI o1 Kimi k1.5 теперь доступен бесплатно в веб-версии habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

20.07 / 16:57

Samsung смарт-часы Galaxy Watch Ultra 2: яркость 5000 нит, защита IP69K, тонкий корпус и другие подробности новинки от авторитетного инсайдера

В сети появились важные подробности о следующем поколении премиальных смарт-часов Samsung — Galaxy Watch Ultra 2. Технические характеристики грядущей новинки раскрыл авторитетный инсайдер Эван Бласс (Evan Blass).

20.07 / 16:57

технологии интересное Bose готовит к выпуску наушники QuietComfort (2nd Gen) — инсайдер раскрыл главные улучшения, цену и цвета новинки

Французский инсайдер billbil-kun принес интересные новости для любителей качественной аудиоперифирии и тех, кому она нужна в профессиональных задачах. Он поделился эксклюзивной информацией о готовящихся к выходу беспроводных наушниках Bose QuietComfort 2nd Gen, которые станут обновлением базовой модели QuietComfort, выпущенной в 2023 году.

20.07 / 16:42

ученые общество климат самит прогнозы Климат изменится — Тихий океан готовит исторический погодный удар

Синоптики прогнозируют аномальное тепло в Европе и резкие температурные контрасты в США.

20.07 / 16:23

общество самит затмения звезда интересное «Уэбб» разглядел странную атмосферу на адской планете, покрытой лавой

С помощью космического телескопа НАСА имени Джеймса Уэбба учёные исследовали «суперземлю» 55 Cancri e (55 Cnc e) — обладающую экстремальными условиями каменную экзопланету, расположенную на расстоянии около 41 светового года от Земли. Эта планета, радиус которой составляет примерно 1,88 радиуса Земли, а масса — около 8 масс Земли, совершает оборот вокруг звёзды, похожей на Солнце, всего за 0,7 дня. Для сравнения: Меркурий обращается вокруг нашего Солнца за 88 дней.

20.07 / 16:12

доллар Sunlu представила сушильную камеру для Bambu Lab AMS Lite

Китайская компания Sunlu представила сушильную камеру для системы многоцветной печати Bambu Lab AMS Lite, которая предназначена для 3D-принтеров A1, A1 mini и A2L. Устройство представляет собой короб для AMS. Для установки не нужно модифицировать принтер.

20.07 / 16:06

продукты здоровье общество самит Здоровье и красота Можно ли есть яйца ежедневно на самом деле, рассказал врач

Яйца считаются одним из самых полезных продуктов в мире. Но можно ли их есть ежедневно?

20.07 / 16:06

связь общество самит вакцинация инфекция Действительно ли прививки опасны - медики развенчали популярные мифы

Во всем мире медики бьют тревогу из-за массового распространения опасных выдумок относительно вакцинации.

20.07 / 15:53

связь технологии SpaceX общество NASA Лазерный интернет Starlink Mini на службе NASA: SpaceX обеспечит 4K-стрим с окрестностей Луны

NASA, кажется, окончательно устало от низкой скорости передачи данных, которая заставляет мир ждать зернистые фотографии из космоса неделями. Для миссии Artemis III агентство решило обратиться к SpaceX, чтобы наконец-то получить нормальный «космический интернет». На внешнюю обшивку корабля Orion установят два терминала Starlink Mini, которые будут работать на основе лазерной связи вместо привычных радиочастот.

20.07 / 15:53

история звезда marvel капитал трейлеры Новая часть “Мстителей” получила эпичный дебютный трейлер — Роберт Дауни мл. сменил роль, а Капитан Америка вернулся к прежнему образу

Поклонники вселенной Marvel дождались — медиагигант представил дебютный трейлер нового полнометражного фильма “Мстители: Судный день”/'Мстители: Доктор Дум" (Avengers: Doomsday).

20.07 / 15:47

здоровье общество ожирение питание болезнь Почему поздние приемы пищи опасны - предупреждение врачей

Приемы пищи поздним вечером нарушают циркадные ритмы организма, а это чревато развитием болезней.

Лента новостей

На главную страницу