Об этом же в других СМИ

habr.com / 1 год назад

Google DeepMind озвучила стоимость генерации видео с помощью Veo 2

habr.com / 1 год назад

«Темпоральные головы» в языковых моделях: новые возможности для AI

habr.com / 1 год назад

Новый фреймворк S* помогает моделям AI писать более качественный и надежный код

habr.com / 1 год назад

«Career Dreamer» от Google использует AI, чтобы помочь изучить возможности трудоустройства

habr.com / 1 год назад

Новая модель AI от Microsoft «Muse» способна генерировать игровой процесс

Больше по теме

08.02.2025 - 06:36 / habr.com

Новые правила безопасности Deepmind направлены на то, чтобы не дать системам перехитрить людей

Последние рекомендации по безопасности от Google Deepmind направлены на решение сложного вопроса: как сохранить контроль над системами искусственного интеллекта, которые могут попытаться перехитрить людей?

В рамках вводятся "Critical Capability Levels"(CCLs) (Критические уровни возможностей) – конкретные пороговые значения, при которых системы AI могут стать опасными без надлежащих мер безопасности. Они сосредоточены на двух основных проблемах: предотвращение ненадлежащего использования, например, атак с применением химического, биологического, радиологического и ядерного (CBRN) оружия или кибератак, а также обеспечение того, чтобы системы AI не пытались обойти человеческий надзор.

Решение проблемы обманчивого поведения AI начинается с автоматизированных систем мониторинга, которые включаются, когда AI проявляет признаки стратегического мышления. Эти системы отслеживают цепочки мыслей, генерируемые моделями рассуждений, такими как Deepseek-R1 или OpenAI o3, во время выполнения критических задач. Для более продвинутого AI («Instrumental Reasoning Level 2»), который может найти способы обойти этот мониторинг, Google Deepmind заявляет, что все еще работает над решениями.

«Мы активно исследуем подходы к решению проблем моделей, которые достигают этого CCL», — отмечается в документе.

Наивысший уровень безопасности применяется к системам AI, которые могут полностью автоматизировать разработку AI и потенциально совершенствовать самих себя. Google DeepMind предупреждает, что неограниченный доступ к таким системам может иметь катастрофические последствия, если не будет способа защититься от быстро совершенствующихся и потенциально сверхчеловеческих систем AI используемых злоумышленниками.

По словам Google Deepmind, эти меры

люди общество самит кибератаки google gemini dilnaz04

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Новое обновление безопасности Galaxy A54: защита смартфона становится еще надежнее gagadget.com / 1 год назад

Samsung Galaxy Xcover 5 получает новое обновление безопасности по всему миру gagadget.com / 1 год назад

CAPA: новый инструмент для обнаружения сходства ошибок в LLM habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

16.07 / 01:17

происшествия люди ученые наука общество Сколько людей на самом деле может прокормить Земля – ученые

Эксперты заявили о начале опасной фазы для всего человечества. Ресурсы планеты больше не могут покрывать нужды растущего населения Земли.

16.07 / 00:45

Apple Nvidia самит google Broadcom Apple ведет переговоры о приобретении производителей чипов для искусственного интеллекта

Apple рассматривает возможность приобретения компаний, занимающихся разработкой полупроводников для искусственного интеллекта. По данным The Information, компания уже ведет переговоры с производителями чипов и финансовыми консультантами о возможных сделках.

16.07 / 00:45

Facebook Samsung технологии LinkedIn Amazon Amazon Music станет стандартным приложением на новых устройствах Samsung Galaxy: что изменится для пользователей

Компания Samsung объявила о расширении списка приложений, которые будут предварительно установлены на смартфонах и планшетах Galaxy. В скором времени к нему присоединится сервис Amazon Music, который автоматически появится на новых устройствах производителя.

16.07 / 00:42

связь медицина люди здоровье общество Все начинается со стула: одна распространенная привычка приближает рак

Новое масштабное исследование с участием почти 100 тысяч человек подтвердило связь между непрерывным сидячим образом жизни и риском развития рака.

15.07 / 23:46

технологии смартфон самит гаджет Почему смартфон заряжается медленно: дело может быть не в кабеле

При покупке кабеля для смартфона специалисты советуют учитывать не только его длину, но и качество изготовления.

15.07 / 22:13

экономика общество семья самит психология Простая вещь, которую мужчины не могут понять о зрелых женщинах

Писательница Ким Петерсен объяснила, почему кризис среднего возраста у женщин — это не капризы или менопауза, а глубокая перестройка всей жизни.

15.07 / 22:10

Samsung технологии здоровье история общество В сеть утекли официальные изображения всех новинок Samsung перед Galaxy Unpacked

Если информация подтвердится, уже 22 июля на мероприятии в Лондоне компания представит сразу несколько флагманских устройств нового поколения: Galaxy Z Fold8, Galaxy Z Fold8 Ultra, Galaxy Z Flip8, Galaxy Watch9 и Galaxy Watch Ultra 2. На данный момент речь идет об утечке, однако опубликованные изображения выглядят как официальные маркетинговые рендеры и совпадают с более ранними инсайдерскими данными.

15.07 / 20:21

Apple самит мода и стиль Parke MacRumors LEGO выпустит набор с легендарным iMac G3: проект прошел важный этап отбора

Платформа LEGO Ideas позволяет поклонникам бренда предлагать собственные концепции будущих наборов. Если проект набирает не менее 10 000 голосов, его рассматривает специальная комиссия LEGO, которая решает, стоит ли запускать модель в серийное производство.

15.07 / 19:47

продукты люди здоровье общество Здоровье и красота Две лучшие крупы для похудения назвали ученые

Эксперты рассказали, в каких случаях лучше выбрать гречку, а в каких рис.

15.07 / 19:47

технологии общество рубль электромобиль пресс-служба UMO объявила о старте предзаказов электрического кроссовера UMO 5 для частных покупателей в России

Компания UMO объявила о старте приёма предзаказов на электрический кроссовер UMO 5 для частных покупателей и раскрыла цены и комплектации модели. Автомобиль будет доступен в двух версиях. Комплектацию «Про» оценили в 2,59 млн рублей, а версию «Макс» — в 2,79 млн рублей. Цены действуют с учётом субсидии при покупке электромобиля, рассказали Хабру в пресс-службе компании.

Лента новостей

На главную страницу