Об этом же в других СМИ

habr.com / 7 месяцев назад

VK внедрила в свои продукты технологии рекомендаций на базе ИИ для более точной персонализации контента

habr.com / 7 месяцев назад

OpenAI готовит к выпуску ИИ олимпиадного уровня

ilenta.com / 7 месяцев назад

Casio выпускает линейку часов G-Shock GA-B2100DF с солнечной зарядкой

incrypted.com / 7 месяцев назад

Google запустила «самую современную модель для сложных задач» Gemini 3.0

habr.com / 7 месяцев назад

Релиз Tewi 1.0.0 — открытого консольного клиента для Transmission и qBittorrent

Больше по теме

31.10.2025 - 15:25 / habr.com

OpenAI выпускает открытые safeguard-модели для гибкой настройки классификации контента

OpenAI передаёт больше инструментов контроля безопасности непосредственно в руки разработчиков ИИ, запуская исследовательскую версию своих новых «защитных»(safeguard) моделей.Новое семейство моделей с открытыми весами gpt-oss-safeguard разработано специально для гибкой настройки и адаптации систем классификации контента под конкретные задачи и требования пользователей.

В линейку входят две модели — gpt-oss-safeguard-120b и более компактная gpt-oss-safeguard-20b. Обе модели представляют собой дообученные версии существующего семейства gpt-oss и будут доступны под разрешительной лицензией Apache 2.0. Это означает, что любые организации смогут свободно использовать, модифицировать и развёртывать их на своих условиях.

Главное отличие состоит не только в открытой лицензии, но и в самом подходе. Вместо опоры на жёстко прописанный набор правил, модель gpt-oss-safeguard использует свои способности рассуждения для интерпретации политики разработчика на этапе вывода. Это означает, что разработчики, использующие новую модель OpenAI, могут настраивать собственную систему безопасности для классификации как отдельных запросов пользователя, так и целых историй чата.

Разработчик, а не поставщик модели, принимает окончательное решение о наборе правил и может адаптировать его под конкретный сценарий использования.

У этого подхода есть несколько очевидных преимуществ:

Прозрачность. Модели используют механизм «цепочки рассуждений» (chain of thought), благодаря чему разработчик действительно может заглянуть «под капот» и увидеть логику, по которой модель принимает решение о классификации. Это значительный шаг вперёд по сравнению с типичными классификаторами-«чёрными ящиками».

Гибкость. Поскольку политика безопасности не жёстко зашита в новую

история общество политика самит Apache

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

OpenAI рассказала про особенности GPT-5.1 и будущее модели habr.com / 7 месяцев назад

Мечта фанатов Fallout исполнится: Bethesda выпускает рабочую реплику Pip-Boy 3000 gagadget.com / 7 месяцев назад

Топовая китайская модель для агентных задач Kimi K2–Thinking уже доступна бесплатно в Koda для VS Code и CLI habr.com / 7 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

07.07 / 17:01

Инсайд, которому можно верить: раскрыты цены, цвета и конфигурации памяти серии Google Pixel 11

Совсем немного времени осталось до презентации смартфонов серии Pixel 11 от Google. Инсайдеры уже делились некоторой технической информацией о четырех новинках, но то, что больше всего интересует покупателей — их цена — оставалась неизвестной. Наконец, французский журналист и инсайдер с безупречной репутацией billbil-kun сообщил, сколько придется заплатить за новейшие гаджеты, раскрыв попутно конфигурации и цвета Google Pixel 11.

07.07 / 17:01

Теперь на Steam Machine можно установить Windows, но для этого придется избавиться от SteamOS

Valve обещала, что пользователи Steam Machine смогут заменить предустановленную операционную систему SteamOS, оптимизированную под игры, на Windows и, наконец, эта опция стала доступна.

07.07 / 16:13

туризм деньги история самит кулинария Дешевле, чем в Риме – как бюджетно и атмосферно отдохнуть в Италии

Этот город является идеальным выбором для путешественников, которые ищут аутентичную атмосферу, богатую историю и вкусную кухню.

07.07 / 15:59

общество Xbox Game Pass С XBOX Game Pass июль не будет скучным: в ближайшее время каталог пополнят Gears of War: Reloaded, Tony Hawk’s Pro Skater 1+2 и релизная версия Palworld

“Большая перезагрузка” XBOX и приостановка переговоров с партнерами не стали причинами отмены регулярного обновления каталога Game Pass и компания опубликовала список тайтлов, которые будут предложены подписчикам в первой половине июля.

07.07 / 15:54

связь история самит Verizon 3 августа T‑Mobile в США отключит свою сеть 2G — последним из американских операторов

Оператор T‑Mobile отключит свою сеть 2G 3 августа 2026 года. С этого дня в США не останется ни одного коммерческого оператора, поддерживающего стандарт второго поколения.

07.07 / 15:50

медицина технологии люди здоровье общество Если вы много сидите – как за 10 секунд избавиться от боли в шее

Сидячая работа за экраном ноутбука провоцирует застойные явления в теле. К концу дня люди часто чувствуют сильную тяжесть в плечах.

07.07 / 15:50

люди работа общество самит психология 10 правил взрослой жизни, которые бесят зумеров

Новое поколение не хочет тратить время на скучные обязанности. Однако рутинная работа в офисе является частью реальности.

07.07 / 15:29

технологии происшествия Apple общество Opera первой среди крупных браузеров получила защиту от атак через буфер обмена

Одной из наиболее распространенных схем считается ClickFix. Во время такой атаки злоумышленники показывают пользователю поддельное сообщение об ошибке или фальшивую CAPTCHA, после чего незаметно подменяют содержимое буфера обмена. Затем человека убеждают вставить скопированную команду в окно «Выполнить» или командную строку.

07.07 / 15:18

продукты SpaceX Block фьючерсы google Binance захватила 80% рынка фьючерсов на традиционные акции: объем торгов превысил $53 млрд

В июне 2026 года криптобиржа Binance захватила 80% рынка торговли фьючерсами на традиционные акции. Об этом Incrypted сообщили в компании. По данным CryptoQuant, за месяц объем торгов TradFi-акциями на Binance составил $53,8 млрд. Это в шесть раз больше, чем показатель ближайшего конкурента, доля которого составила 13%, говорится в заявлении. По данным The Block Research, недельный объем торговли деривативами на акции на централизованных биржах (CEX) достиг рекордных $11,6 млрд в середине июня 2026 года — росту спо

07.07 / 15:02

люди общество самит лекарства болезнь Claude вылечит: Anthropic будет делать лекарства, которые невыгодны обычной фарме

Компания Anthropic объявила, что запускает собственную программу разработки лекарств. Как сообщает The Verge, целиться она будет в так называемые забытые болезни — те, за которые традиционная фарма берется неохотно, потому что на них трудно заработать. К этой группе ВОЗ относит, например, лепру, денге, речную слепоту и сонную болезнь, распространенные в основном среди беднейших слоев населения.

Лента новостей

На главную страницу