Об этом же в других СМИ

habr.com / 1 год назад

OpenAI объясняет, почему ChatGPT стал слишком льстивым

habr.com / 1 год назад

Реструктуризация OpenAI вызывает опасения у экспертов по поводу контроля и безопасности AGI

habr.com / 1 год назад

a16z нанимает венчурного технологического подкастера Эрика Торенберга, который присоединяется в качестве нового партнера

habr.com / 1 год назад

Grok 3 Mini накаляет обстановку, поскольку ценовые войны AI еще больше снижают стоимость моделей

habr.com / 1 год назад

Оценки безопасности показывают, что o3 OpenAI, вероятно, самая рискованная модель компании на сегодняшний день

Больше по теме

16.04.2025 - 02:53 / habr.com

Тестирование безопасности под давлением, поскольку OpenAI ускоряет разработку AI

OpenAI значительно сократила период тестирования безопасности для своих новейших языковых моделей.В то время как GPT-4 прошел шесть месяцев тестирования, у тестировщиков теперь есть всего несколько дней, чтобы оценить новую модель "o3". Люди, вовлеченные в процесс, сообщают о менее тщательном тестировании и недостаточных ресурсах, согласно отчету Financial Times.

Сокращение сроков происходит по мере того, как модели становятся более мощными и потенциально опасными, особенно в отношении неправильного использования в биологических или связанных с безопасностью целях. Источники говорят, что OpenAI хочет ускорить выпуски, чтобы не отставать от конкурентов, таких как Meta, Google и xAI.

Ранее OpenAI обязалась проводить специализированные тесты для проверки потенциального нецелевого использования, например, разработки биологического оружия. Эти процедуры требуют значительных ресурсов: пользовательских наборов данных, тонкой настройки и внешних экспертов. Однако Financial Times сообщает, что такое тестирование проводилось только на старых, менее эффективных моделях. Остается неясным, как новые модели, такие как o1 или o3-mini, будут работать в аналогичных условиях.

В отчете о безопасности o3-mini компания OpenAI упоминает только, что GPT-4o может решать конкретную биологическую задачу после тонкой настройки, но не приводит никаких результатов для более новых моделей.

Другая проблема касается тестирования «контрольных точек» — промежуточных версий моделей, которые продолжают разрабатываться. Бывший технический сотрудник называет это плохой практикой, хотя OpenAI утверждает, что эти контрольные точки почти идентичны окончательным моделям.

OpenAI указывает на повышение эффективности за счет автоматизированных процедур тестирования.

люди самит google dilnaz04

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Новые модели рассуждений AI от OpenAI галлюцинируют больше habr.com / 1 год назад

Эксперты утверждают, что в последнем AI отчете Google отсутствуют ключевые сведения о безопасности habr.com / 1 год назад

Проект Stargate компании OpenAI нацелен на международную экспансию habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

27.07 / 11:19

связь технологии HMD представила кнопочный телефон Nokia 123 Shield с защитой от воды и пыли

Финская HMD Global презентовала кнопочный 2G-телефон под названием Nokia 123 Shield с защитой от воды и пыли. Производитель отмечает, что устройство выдерживает воздействие дождя, песка и пыли, соответствуя требованиям IP65 согласно стандарту IEC 60529.

27.07 / 11:19

продукты Selectel занял первое место в рейтинге провайдеров облачных баз данных по версии CNewsMarket

CNewsMarket обновил рейтинг российских провайдеров услуги «Базы данных как сервис» и сравнил условия оказания услуг по ряду ключевых параметров. Первое место — уже третий год подряд — занимает Selectel.

27.07 / 11:19

общество политика google токен Enterprise Gemini 3.6 Flash стала доступна в GitHub Copilot

GitHub начал постепенно подключать Gemini 3.6 Flash в Copilot. Новую модель Google можно будет выбирать при работе с кодом в редакторах, командной строке и облачных инструментах GitHub.

27.07 / 11:19

общество «Почта Mail» запустила персонализированные метки для писем

«Почта Mail» представила персонализированные метки для писем для работы в команде. Новый инструмент помогает организовать рабочую переписку, распределять письма по проектам и не терять задачи в общем потоке сообщений. Все сообщения с метками автоматически собираются в соответствующие папки, что упрощает навигацию и поиск информации, рассказали Хабру в пресс‑службе компании.

27.07 / 11:16

технологии промышленность BMW магия самит 919 километров на одном заряде: Китай сертифицировал новый BMW iX3

Пока европейские и американские водители продолжают бороться с «страхом запаса хода», китайские регуляторы подкинули дров в костёр зависти. Министерство промышленности и информационных технологий Китая (MIIT) официально сертифицировало удлинённую версию нового BMW iX3 (Neue Klasse), и цифры выглядят так, будто их писал очень оптимистичный маркетолог: 919 километров на одном заряде.

27.07 / 11:16

Путешествия закон золото климат курс Квадратные формы и искусственный интеллект: каким будет новый Hyundai Tucson 2027 года

Hyundai Tucson — это не просто очередная модель в линейке корейского бренда, а настоящая «курица, несущая золотые яйца». Поэтому любые новости о смене поколений воспринимаются рынком с смесью азарта и опасения. Судя по первым шпионским фото и утечкам информации, в 2027 году нас ожидает радикальная смена курса: Tucson решил окончательно попрощаться с плавными линиями прошлого и примерить на себя образ «младшего брата» брутального Santa Fe.

27.07 / 11:14

технологии экономика Apple общество политика Apple может сэкономить на дисплее iPhone 18 Pro Max, чтобы сдержать рост цены нового флагмана

Речь пока идет о данных инсайдеров, однако они совпадают с ранее появлявшимися сообщениями о том, что Apple готовится пересмотреть ценовую политику линейки iPhone 18 из-за роста стоимости компонентов.

27.07 / 10:54

продукты питания Здоровье и красота еда полезные продукты интересное Как сварить кукурузу, чтобы она была сочной – простой лайфхак

Секрет приготовления нежной, сочной и тающей во рту кукурузы заключается в добавлении двух ингредиентов.

27.07 / 10:54

ученые животные общество интересное животный мир Почему фламинго поджимают ногу – ученые нашли объяснение

Долгое время считалось, что фламинго поджимают ногу ради отдыха, но свежие исследования доказали совсем другое.

27.07 / 10:42

общество доллар google Ethereum DXY Ожидания ФРС и штурм максимумов: трейдер оценил сценарии движения биткоина и Ethereum

Дисклеймер: материал не является финансовой рекомендацией или призывом к действию. Представленная аналитика является частным мнением ее автора. Incrypted не несет ответственности за инвестиционные решения читателей. Биткоин и Ethereum — ожидания ФРС, дефицит ликвидности и штурм максимумов Прошлая торговая неделя обошлась без высокой волатильности и выраженного прайс-экшена. Геополитический фон к выходным заметно охладел — несмотря на громкие угрозы Трампа относительно тяжелых бомбардировок, градус эскалации с

Лента новостей

На главную страницу