Об этом же в других СМИ

habr.com / 1 год назад

OpenAI обещает внести изменения, чтобы предотвратить дальнейшее подхалимство ChatGPT

habr.com / 1 год назад

LM Arena обвиняют в предоставлении «избранным» AI-компаниям несправедливых преимуществ при тестировании моделей

habr.com / 1 год назад

Википедия утверждает, что будет использовать AI, но не для замены людей

habr.com / 1 год назад

Meta* представляет предварительный просмотр API для своих моделей искусственного интеллекта Llama

habr.com / 1 год назад

OpenAI выпускает «облегченную» версию своего инструмента для глубоких исследований ChatGPT

Больше по теме

20.04.2025 - 13:14 / habr.com

Партнер OpenAI утверждает, что у него было относительно мало времени для тестирования модели AI o3

Организация Metr, с которой OpenAI часто сотрудничает для проверки возможностей своих моделей AI и оценки их безопасности, предполагает, что ей не дали достаточно времени на тестирование одной из самых эффективных новых версий компании, o3. В сообщении в блоге, опубликованном в среду, Metr пишет, что один из тестов Red Teaming o3 был «проведен за относительно короткое время» по сравнению с тестированием организацией предыдущей флагманской модели OpenAI, o1. Это важно, говорят они, поскольку дополнительное время тестирования может привести к более полным результатам.

«Эта оценка была проведена за относительно короткое время, и мы тестировали o3 только с простыми агентными скаффолдами», — написал Metr в своем сообщении в блоге. «Мы ожидаем, что более высокая производительность на бенчмарках возможна при большем усилии выявления».

Недавние отчеты показывают, что OpenAI, подстегиваемая конкурентным давлением, торопит независимые оценки. По данным Financial Times, OpenAI дала некоторым тестировщикам меньше недели на проверки безопасности для предстоящего крупного запуска.

В своих заявлениях OpenAI оспаривает утверждение о том, что это ставит под угрозу безопасность. Metr утверждает, что на основе информации, которую удалось собрать за отведенное время, o3 имеет высокую склонность «обманывать» или «взламывать» тесты изощренными способами, чтобы максимизировать свой счет — даже когда модель четко понимает, что ее поведение не соответствует намерениям пользователя (и OpenAI). Организация считает возможным, что o3 будет заниматься и другими типами враждебного или «злонамеренного» поведения — независимо от заявлений модели о том, что она согласована, «безопасна по замыслу» или не имеет собственных намерений.

«Хотя мы не думаем, что

происшествия общество самит dilnaz04

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Сообщается, что OpenAI планирует увеличить доход с $4 млрд до $174 млрд к 2030 году habr.com / 1 год назад

OpenAI добавляет модель изображения ChatGPT «GPT-Image-1» в API для разработчиков habr.com / 1 год назад

OpenAI планирует выпустить открытую модель AI этим летом, чтобы конкурировать с Meta* и DeepSeek habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

24.07 / 20:03

медицина здоровье история общество прогноз В какой стране женщины будут жить дольше всех в мире

Благодаря развитому здравоохранению и здоровому образу жизни южнокорейские женщины имеют все шансы установить мировой рекорд долголетия.

24.07 / 20:03

люди дети общество психология психика Как распознать нарцисса — 5 вещей, от которых он получает удовольствие

Психологи рассказали, от чего эгоистичные люди получают настоящее удовольствие и почему они так себя ведут.

24.07 / 19:15

технологии Apple общество курс планшеты WhatsApp получил сразу четыре полезных обновления: приложение стало удобнее на iPad, в автомобиле и при работе с PDF

Все нововведения уже начали поэтапно становиться доступными пользователям по всему миру. Как обычно, распространение происходит постепенно, поэтому некоторые функции могут появиться не сразу после установки последней версии приложения.

24.07 / 19:06

бизнес связь общество В России число подключений к публичному WiFi выросло в 3,5 раза за полгода

В России продолжает расти популярность WiFi в общественных местах на фоне проблем с мобильным интернетом. В первом полугодии 2026 года по сравнению с первым полугодием 2025-го количество подключений в публичных городских интернет-сетях увеличилось в 3,5 раза, до 4,1 млрд сессий. К такому выводу пришли аналитики оператора публичного WiFi Hot-WiFi, проанализировав динамику подключений пользователей в центральных районах Москвы. Тенденцию подтвердили крупные провайдеры: «Ростелеком», «Билайн» и «Транстелеком».

24.07 / 19:02

люди недвижимость здоровье семья tiktok «Отрыжка дома»: простая привычка для свежего воздуха в квартире

Эксперты рекомендуют открывать окна на 10–15 минут каждый день для борьбы с аллергенами и плесенью.

24.07 / 18:34

бизнес люди экономика общество самит Как строится первый в мире небоскреб высотой более километра

В Саудовской Аравии активно продолжается строительство первого в мире километрового небоскреба Jeddah Tower, который уже достиг 106 этажа.

24.07 / 18:10

продукты экономика недвижимость общество техника 11 привычек, которые избавят от генеральной уборки

Автор делится простыми ежедневными привычками, которые помогают держать дом в чистоте и откладывать генеральную уборку без лишнего стресса и затрат времени.

24.07 / 18:10

происшествия ученые археология захоронения болезнь Битва или болезнь – ученые нашли странные могилы римских солдат

В Словакии археологи раскопали редкий лагерь времен Марка Аврелия с множеством спешно захороненных легионеров и их снаряжения.

24.07 / 18:05

технологии Выпуск обновления Media Player Classic — Home Cinema 2.7.4

21 июля 2026 года состоялся релиз открытого медиаплеера Media Player Classic — Home Cinema 2.7.4 (MPC‑HC). Исходный код решения написан на С++ и С и опубликован на GitHub под лицензией GNU General Public License v3.0. Версия MPC‑HC 2.0 вышла в январе 2023 года.

24.07 / 17:38

происшествия рубль предприятия TS Solution — первый в России контракт на совместную техническую поддержку UserGate

Компания TS Solution, сертифицированный партнер российского разработчика решений в области кибербезопасности UserGate, объявляет о заключении первого в России контракта с клиентом из финансового сектора на оказание совместной технической поддержки межсетевых экранов UserGate NGFW в рамках проекта вендора «Совместная техническая поддержка».

Лента новостей

На главную страницу