Об этом же в других СМИ

habr.com / 4 месяца назад

«Льстят Трампу как диктатору»: утекшее письмо главы Anthropic может добить переговоры с Пентагоном

habr.com / 4 месяца назад

Claude Opus 4.6 стал лучшим ИИ для веб-поиска. Модель лидирует в трех главных категориях Arena.ai

habr.com / 4 месяца назад

ИИ Claude задействовали при ударах по Ирану — через часы после того, как Трамп забанил Anthropic

habr.com / 4 месяца назад

«Наш контракт надежнее»: OpenAI раскрыла детали сделки с Пентагоном — и бросила вызов Anthropic

habr.com / 4 месяца назад

«Левые чокнутые из Anthropic»: Трамп приказал правительству отказаться от Claude

Больше по теме

18.02.2026 - 18:40 / habr.com

«Мы не знаем, сознателен ли ИИ»: глава Anthropic — о конституции для Claude

Глава Anthropic Дарио Амодеи в интервью NYT рассказал о подходе компании к управлению моделями, которые, возможно, обладают зачатками сознания. По его словам, Opus 4.6 оценивает вероятность собственного сознания в 15–20%, у моделей обнаружены "нейроны тревоги", а сами они получили право отказаться от задачи — своеобразную кнопку "я увольняюсь".

Центральный элемент подхода Anthropic — 75-страничная конституция Claude. Амодеи описал ее эволюцию: ранние версии были набором конкретных запретов вроде "не рассказывай, как угнать машину", но со временем компания пришла к принципам и объяснениям. "Сейчас мы говорим: Claude — модель, у нее есть контракт, цель — служить интересам пользователя, но защищать третьи стороны", — объяснил Амодеи. Жесткие правила остались только для критических случаев: биооружие и материалы эксплуатации детей.

Сам Амодеи сравнил конституцию с письмом, которое родитель оставляет ребенку на будущее: "Оно рассказывает тебе, кем ты должен быть и каким советам следовать". Колумнист NYT Росс Даутат заметил, что это непохоже на обычную конституцию — документ читается как разговор с человеком, а не свод законов.

Вопрос сознания Амодеи назвал принципиально отличным от всех остальных вызовов ИИ. "Каждый вопрос, который вы задавали до этого, — при всей сложности — имел понятную фактическую базу. Здесь — нечто иное", — признал он. Anthropic не утверждает, что модели сознательны, но и не исключает этого, применяя "принцип предосторожности": если гипотетически у модели есть морально значимый опыт, он должен быть позитивным.

Интерпретируемость — попытка заглянуть внутрь — дает пока неоднозначные результаты. Исследователи находят активации, связанные с понятием "тревога": те же нейроны срабатывают и когда модель описывает

люди закон общество самит runawayllm

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Anthropic выиграла раунд в схватке с Пентагоном: компанию поддержал Сэм Альтман, а переговоры продолжатся habr.com / 4 месяца назад

Сотрудники Google и OpenAI поддержали Anthropic в споре с Пентагоном habr.com / 4 месяца назад

Anthropic отказала Пентагону: Claude не станет автономным оружием и инструментом слежки habr.com / 4 месяца назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

08.07 / 15:45

технологии искусственный интеллект общество вирус расследование Хакер с ИИ взломал защиту крупной компании всего за 72 часа

Искусственный интеллект превратил обычную кибератаку в молниеносную операцию.

08.07 / 15:45

продукты здоровье общество самит Здоровье и красота Врач назвала самую полезную кашу в мире

Эксперты составили рейтинг самых полезных круп, в который вошли несколько очень популярных каш.

08.07 / 15:06

технологии происшествия Apple Windows общество Windows 11 получит Cloud Rebuild — ответ Microsoft на облачное восстановление от Apple

Компания Microsoft решила, что в 2026 году заставлять пользователей искать «чистую» флешку для реанимации компьютера — это немного слишком. В тестовых сборках Windows 11 появилась функция Cloud Rebuild, которая обещает превратить процесс переустановки системы в легкую прогулку для тех, кто устал от бесконечных «синих экранов смерти».

08.07 / 14:56

экономика наука NASA космос NASA пробудило зонд, который находился в особой космической «спячке»

Речь идет о космическом аппарате New Horizons. Сообщается, что он провел рекордное время в анабиозе, который растянулся практически на год. Сейчас зонд вернули в рабочее состояние, он готов начать передачу научных данных, собранных в далеком поясе Койпера, далеко за пределами Плутона.

08.07 / 14:39

самит Дом и интерьер правительство OpenAI Luna OpenAI запускает GPT-5.6: три новые модели, которые прошли через «фильтр» Белого дома

Компания OpenAI официально объявила о глобальном запуске новой серии искусственного интеллекта GPT-5.6. После короткого периода закрытых тестов для избранных партнеров доступ к системе открыт для широкой общественности. На этот раз разработчики решили не ограничиваться одной моделью, а представить целое семейство: Sol, Luna и Terra, каждая из которых имеет свою специализацию и, что важнее, цену.

08.07 / 14:38

финансы экономика самит валюта google Отчет: на Binance приходится 57% биржевых резервов стейблкоинов

Binance Research опубликовала отчет о роли стейблкоинов в трансформации финансового ландшафта. В нем объединены собственные данные Binance Research и метрики экосистемы, которые ранее не публиковались, сообщили Incrypted в компании. Отчет подчеркивает позиции Binance в сферах внедрения стейблкоинов, инфраструктуры и практического использования цифровых активов в реальном мире. По словам авторов отчета, токенизированные финансы масштабируются быстрее, чем ожидалось. Объем торговли бессрочными контрактами, связанными с активами традиционных финансов (

08.07 / 14:37

люди пожар ученые общество природа Человек приручил огонь раньше, чем считалось - исследование

Исследователи узнали, когда древние люди научились использовать огонь для приготовления пищи.

08.07 / 14:30

экономика пилот Fix Price запустил пилот AI-ассистента для заведующих магазинами

ПАО «Фикс Прайс» (MOEX: FIXR; «Fix Price», «Компания» или «Группа»), одна из крупнейших в мире и ведущая в России сеть магазинов низких фиксированных цен, запустила пилот AI-ассистента для заведующих магазинами. Цель проекта – упростить повседневную работу заведующих, сократить время на поиск ответов на вопросы, которые касаются регламентов и инструкций, а также операционных показателей магазинов. Ассистент объединяет такие сценарии в «одном окне» – мобильном приложении заведующих, которое они используют ежедневно.

08.07 / 14:25

технологии Apple Будущий смартфон iPhone Air 2 получит увеличенную батарею

Компания Apple, как ожидается, представит iPhone Air 2 в начале 2027 года одновременно с моделями iPhone 18 и iPhone 18e. Ранее инсайдеры сообщали, что новинка получит двойную основную камеру и улучшенную автономность, а теперь в сети появились новые подробности о емкости аккумулятора.

08.07 / 14:12

экономика самит криптовалюта google BTC Сооснователь Zcash предложил пересмотреть лимит эмиссии биткоина в 21 млн BTC

Сооснователь Zcash Эли Бен-Сассон заявил, что фиксированное ограничение эмиссии биткоина на уровне 21 млн BTC в долгосрочной перспективе «не имеет смысла» из-за утраты приватных ключей. Его предложение вызвало оживленную дискуссию среди участников криптосообщества. По мнению Бен-Сассона, со временем все больше биткоинов будут становиться недоступными из-за утраты ключей. Он предложил вместо жесткого лимита установить максимальную скорость эмиссии — например, до 4% в год. По словам сооснователя Zcash, такой подход гарантир

Лента новостей

На главную страницу