Об этом же в других СМИ

habr.com / 1 год назад

OpenAI обещает внести изменения, чтобы предотвратить дальнейшее подхалимство ChatGPT

habr.com / 1 год назад

Microsoft бросает вызов OpenAI с новыми моделями AI Phi-4 с открытым исходным кодом

habr.com / 1 год назад

OpenAI объясняет, почему ChatGPT стал слишком льстивым

habr.com / 1 год назад

OpenAI обновляет поиск ChatGPT функциями покупок

habr.com / 1 год назад

OpenAI выпускает «облегченную» версию своего инструмента для глубоких исследований ChatGPT

Больше по теме

18.04.2025 - 06:22 / habr.com

OpenAI поставляет GPT-4.1 без отчета о безопасности

В понедельник OpenAI запустила новое семейство моделей AI, GPT-4.1, которое, по словам компании, превзошло некоторые из ее существующих моделей на определенных тестах, в частности, в тестах программирования. Однако GPT-4.1 не поставлялся с отчетом по безопасности, который обычно сопровождает выпуски моделей OpenAI, известные как модель или системная карта.

По состоянию на утро вторника OpenAI еще не опубликовала отчет по безопасности для GPT-4.1 — и, похоже, не планирует этого делать. В заявлении для TechCrunch представитель OpenAI Шаокьи Амдо сказал, что «GPT-4.1 не является пограничной моделью, поэтому для нее не будет выпущена отдельная системная карта».

Довольно стандартно, что лаборатории AI публикуют отчеты по безопасности, показывающие типы тестов, которые они провели внутри компании и с участием сторонних партнеров для оценки безопасности конкретных моделей. Иногда в этих отчетах раскрывается нелестная информация, например, что модель склонна обманывать людей или является опасно убедительной. В целом сообщество AI воспринимает эти отчеты как добросовестные усилия лабораторий AI по поддержке независимых исследований и Red Teaming.

Но за последние несколько месяцев ведущие лаборатории AI, похоже, снизили свои стандарты отчетности, что вызвало негативную реакцию со стороны исследователей безопасности. Некоторые, как Google, затянули с отчетами по безопасности, в то время как другие опубликовали отчеты, в которых не хватает обычных подробностей.

Недавние достижения OpenAI также не являются исключительными. В декабре компания подверглась критике за публикацию отчета по безопасности, содержащего результаты тестов для модели, отличающейся от версии, которую она развернула в производстве. В прошлом месяце OpenAI запустила

люди закон общество самит google правительство dilnaz04

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Реструктуризация OpenAI вызывает опасения у экспертов по поводу контроля и безопасности AGI habr.com / 1 год назад

OpenAI добавляет модель изображения ChatGPT «GPT-Image-1» в API для разработчиков habr.com / 1 год назад

GPT-4.1 от OpenAI может быть менее надежна, чем предыдущие AI модели компании habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

18.07 / 01:01

медицина люди наука общество депрессия Не зрение и не слух: шестое чувство, о котором многие даже не слышали

Это чувство играет центральную роль в способности человека определять, находится ли его организм в состоянии баланса.

17.07 / 23:26

продукты люди здоровье общество человек Почему не стоит полностью отказываться от соли - ответ врачей

Соль считают вредной, однако ее полное исключение из рациона может привести к неприятным последствиям для здоровья и самочувствия.

17.07 / 22:52

самит Знаменитости курс nintendo мода и стиль Casio выпустила лимитированные G-Shock в стиле культовой Mother 3: часы получили необычный дизайн и эксклюзивный способ продажи

Компания Casio официально представила новую лимитированную версию часов G-Shock DW-5600, созданную совместно с культовой игровой франшизой Mother от Nintendo. Новинка посвящена 20-летию игры Mother 3 и получила яркое оформление, вдохновленное одной из самых запоминающихся сцен проекта.

17.07 / 20:44

Samsung технологии reddit Samsung объяснила странный дефект экрана Galaxy S26 Ultra: проблема оказалась не такой серьезной, как опасались владельцы

Некоторые владельцы Samsung Galaxy S26 Ultra обратили внимание на необычную особенность дисплея нового флагмана. При использовании смартфона на максимальной яркости под прямыми солнечными лучами в центральной части экрана может появляться легкий красноватый оттенок. Сначала пользователи предположили, что речь идет о серьезной аппаратной неисправности, однако Samsung уже выступила с официальным разъяснением и подтвердила, что готовит программное исправление.

17.07 / 20:12

продукты медицина общество самит жара Как охладить кровать за 10 минут - простой трюк, спасающий от жары

Жаркие летние ночи часто становятся настоящим испытанием, но есть способ с этим справиться.

17.07 / 20:12

туризм общество евро курорт пляж Популярные курорты атакует рыба-монстр - может раздробить кости

На опасное существо начали жаловаться рыбаки, ее уже замечают туристы на популярных пляжах.

17.07 / 20:12

связь люди книги психология Психология и отношения Ученый раскрыл "секрет счастья" - все проще, чем кажется

Известный ученый рассказал, что его жизнь буквально разделилась на две части и после 50 лет он стал счастливым.

17.07 / 20:12

здоровье общество самит Здоровье и красота полезные продукты Какие грибы могут обеспечить надежную защиту от рака

Врачи и диетологи советуют чаще включать в свой рацион грибы - особые элементы в их составе могут надежно защитить от развития раковых клеток.

17.07 / 19:26

самит дети и родители MacRumors 1Password получил интеграцию с Claude: ИИ теперь может входить на сайты без доступа к вашим паролям

Компания 1Password официально объявила о запуске интеграции с ИИ-платформой Claude от Anthropic. Новая функция позволяет искусственному интеллекту использовать сохраненные в менеджере паролей учетные данные для выполнения действий в браузере, при этом сами пароли остаются недоступными как для Claude, так и для серверов Anthropic.

17.07 / 19:26

СМИ общество самит doom Software Аша Шарма не выпотрошила id Software: глава студии призвал не верить пессимистичным заголовкам

id Software стала одной из самых пострадавших студий в ходе “большой перезагрузки” XBOX, запущенной Ашей Шармой (Asha Sharma). Авторы культовых шутеров Doom, Wolfenstein и Quake потеряли 136 человек (из 185) и даже утверждалось, что в студии не осталось никого, кто умеет работать с движком id Tech и другим специфическим инструментарием.

Лента новостей

На главную страницу