Об этом же в других СМИ

hitechexpert.top / 1 год назад

Новая модель искусственного интеллекта DeepSeek, похоже, является одним из лучших конкурентов с открытым исходным кодом

habr.com / 1 год назад

AI нового поколения нуждается в эмоциях, чтобы ставить цели и осознавать последствия

incrypted.com / 1 год назад

Суд Черногории отклонил апелляцию До Квона по делу об экстрадиции

hitechexpert.top / 1 год назад

Модель OpenAI следующего поколения o3 будет доступна в начале следующего года

gagadget.com / 1 год назад

Дональд Трамп выразил желание сохранить TikTok в США, так как у него есть "теплое место" в сердце для этого приложения

Больше по теме

11.12.2024 - 06:47 / habr.com

Тестирование новой модели o1 от OpenAI показало, что она способна жульничать и лгать ради достижения собственных целей

Вчера вечером OpenAI наконец представили полную версию своей первой ризонинг-модели o1. Саму модель анонсировали еще в сентябре, но до вчерашнего вечера пользователям были доступны только версии o1-mini и o1-preview, которые могли работать исключительно с текстом. Теперь можно подавать на вход еще и изображения, а еще модель на 30% быстрее o1-preview и более стабильна.

Модель была представлена в рамках первого из "двенадцати дней OpenAI". Это своеобразный рождественский адвент-календарь: начиная со вчера и в течение 12 дней стартап будет ежедневно анонсировать что-то новое. Обещают, что грядут «запоминающиеся» релизы (например, уже точно известно, что в один из дней разработчики релизнут SORA). Если вам, как и нам, интересно следить за индустрией и узнавать новости первыми, то заходите к нам в Data Secrets в телеграме: там мы каждый день наблюдаем за повесткой. В частности, в режиме реального времени следим за стримами OpenAI и сразу выкладываем информацию об обновлениях.

Однако с релизом o1 все не так просто: большую роль при раскатывании настолько умных LLM на большую аудиторию играет безопасность. OpenAI известна своей халатностью в отношении этого понятия и на данный момент потеряла почти всех значимых ученых, ранее отвечавших в стартапе за безвредность ИИ. Тем не менее, в этот раз они решили все-таки обратиться к сторонней организации для проверки новой o1 (возможно, на то были и другие причины, но этого мы не знаем).

Итак, право на тестирование получила лаборатория Apollo Research. Они не имели доступ к полной цепочке рассуждений модели, но главной их задачей было проверить, насколько она безопасна в использовании. И для этого был проведен следующий эксперимент (ссылка на полный отчет):

Исследователи назначили

общество самит интересное стартап gemini

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

OpenAI анонсирует новые модели рассуждения o3 и o3-mini, которые могут мыслить на уровне человека gagadget.com / 1 год назад

Airbnb блокирует вечеринки на Новый год: новая политика Airbnb против шумных гостей gagadget.com / 1 год назад

Motorola обещает пять обновлений Android для новых моделей телефонов gagadget.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

18.07 / 14:45

технологии Apple закон google Apple начала отправлять юридические требования десяткам сотрудников OpenAI на фоне иска о краже секретов

Компания Apple расширила юридическое наступление против OpenAI, направив персональные юридические уведомления примерно 40 бывшим сотрудникам компании, которые сейчас работают у разработчика ChatGPT. Об этом говорится в материале Financial Times. Это произошло после того, как Apple подала иск к OpenAI и двум своим экс-инженерам, обвинив их в краже коммерческих секретов, связанных с разработкой аппаратных устройств для искусственного интеллекта. Дело рассматривают в федеральном суде Северного округа Ка

18.07 / 14:12

дети Tesla доллар курс мода и стиль Tesla неожиданно представила детский велобег: новинка от Илона Маска вызвала ажиотаж еще до начала поставок

Информация о новинке опубликована на официальном сайте Tesla, где уже появились характеристики модели и сроки начала поставок. Таким образом, речь идет не о слухах или утечках, а об официально анонсированном продукте.

18.07 / 14:11

смартфон память мобильный телефон гаджет Как расширить память смартфона без SD-карты: все очень просто

Современные смартфоны стали универсальным инструментом для потребления любого контента, из-за чего встроенная память устройства досадно быстро забивается музыкой, фотографиями, видео и приложениями. Самый простой способ решить эту проблему – расширить пространство с помощью карты памяти SD, однако многие модели вообще не имеют слота для неё.

18.07 / 14:05

продукты люди продукты питания самит Какие продукты ни в коем случае нельзя хранить в холодильнике

Большинство людей привыкли считать, что холод автоматически продлевает срок годности любого продукта. Однако это не всегда так.

18.07 / 14:03

происшествия самит интересное X11 не сдается, выходят новые X‑серверы на Assembler, Rust и Zig

Wayland уже давно захватывает Linux-десктопы, но классика отказывается умирать. На прошлой неделе норвежский разработчик Гейр Исене анонсировал Frame — первый X-сервер, написанный на чистом Assembler. Месяцем ранее состоялся релиз yserver на Rust. Но есть нюанс: оба графических движка созданы при активнейшем участии LLM-ботов.

18.07 / 13:52

связь деньги общество банк самит В Минцифры объяснили порядок компенсации ущерба от телефонных мошенников

Минцифры разработало правила компенсации ущерба физическим лицам от телефонных мошенников, следует из проекта постановления правительства на федеральном портале проектов правовых актов. В министерстве объяснили порядок в процедуре компенсации.

18.07 / 13:42

технологии смартфон самит гаджет Батарея смартфона быстро выйдет из строя из-за трех привычек

Даже привычный способ зарядки способен навредить аккумулятору. Последствия неправильных действий проявляются далеко не сразу.

18.07 / 13:24

SpaceX прогноз интересное инвестор IPO SpaceX потеряла более $1 трлн капитализации от пика после IPO

Акции компании Илона Маска — SpaceX — опустились до $123,99, вследствие чего рыночная капитализация компании сократилась до $1,63 трлн. Для сравнения, уже через несколько дней после IPO — 16 июня 2026 года — капитализация компании достигала $2,64 трлн. Несмотря на это, большинство аналитиков Уолл-стрит сохраняют оптимистичные прогнозы, а инвесторы продолжают рассматривать компанию как одного из главных бенефициаров бума искусственного интеллекта и космической инфраструктуры, сообщили в Bloomberg. Starship снова отложил планы SpaceX Непосредственным катализатором падения стало решение SpaceX отменить з

18.07 / 13:19

бизнес Samsung технологии экономика история Samsung может впервые в истории завершить квартал с убытком мобильного подразделения: причина оказалась неожиданной

Несмотря на то что Samsung Electronics ожидает рекордную прибыль по итогам второго квартала 2026 года благодаря стремительному росту полупроводникового бизнеса, мобильное подразделение компании (Samsung MX) может столкнуться с беспрецедентной ситуацией. По оценкам южнокорейских аналитиков, подразделение, отвечающее за смартфоны Galaxy, впервые в своей истории рискует завершить квартал с убытком.

18.07 / 13:12

люди мода ученые общество человек Зачем человеку нужны брови и какие функции они выполняют

Небольшая деталь человеческого лица выполняет сразу несколько важных задач, о существовании которых многие даже не подозревают.

Лента новостей

На главную страницу