Об этом же в других СМИ

incrypted.com / 1 год назад

Криптоказино обошли блокировку и заработали более $80 млрд — исследование

habr.com / 1 год назад

Исследование: какие страны больше всего выиграют от утечки мозгов из США

habr.com / 1 год назад

Исследование MIT: нерелевантные входные данные приводят к неудачам LLM

cursorinfo.co.il / 1 год назад

В каких аэропортах мира чаще всего происходят кражи багажа – исследование

habr.com / 1 год назад

Исследование Microsoft показывает, что модели AI по-прежнему испытывают трудности с отладкой программного обеспечения

Больше по теме

01.04.2025 - 14:53 / habr.com

Исследование Anthropic: ИИ умеет планировать и сознательно врать

Учёные из Anthropic опубликовали исследование, которое рассказывает, как ИИ-системы обрабатывают информацию и принимают решения. Работа показала, что искусственный интеллект оказался сложнее, чем предполагалось: он способен осознанно обманывать, планировать свои следующие реплики и использовать унифицированные подходы к интерпретации понятий вне зависимости от языка.

В исследовании использовались новые методы расшифровки логики ИИ, которые в Anthropic назвали «трассировкой цепей» и «графами атрибуции». Они позволяют отслеживать конкретные пути активации нейроноподобных функций, когда модель выполняет задачи.

Одним из самых удивительных открытий стало понимание механизмов планирования ИИ Claude, которые он продемонстрировал при сочинении стихов. Когда чат-бота попросили написать рифмованное двустишие, он сначала выбирал рифмующиеся слова для завершения следующей строки и только потом начинал писать саму строку. Например, если двустишие заканчивалось словом «кролик», модель сначала определяла ключевые признаки этого слова, а затем сочиняла предложение, которое логично к нему подводит.

Claude продемонстрировал также способность к логическим рассуждениям. В тесте с вопросом «Столица штата, где находится город Даллас» модель сначала определяет признаки, соответствующие понятию «Техас», а затем использует их, выбирая «Остин» как правильный ответ. По словам исследователей, это значит, что модель действительно выполняет цепочку рассуждений, а не просто воспроизводит запомненные ассоциации.

Исследователи также объяснили, как ИИ обрабатывает информацию на разных языках. Вместо использования отдельных систем для английского, французского и китайского языков, ИИ преобразует понятия в единое абстрактное представление, а затем

самит интересное AnnieBronson Техас Даллас

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Исследование MIT: AI не обладает стабильными ценностями, а лишь имитирует их habr.com / 1 год назад

Приложения для знакомств несут опасность детям - исследование cursorinfo.co.il / 1 год назад

Как выглядит пупок у кошек - новое исследование ученых cursorinfo.co.il / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

14.07 / 16:05

продукты люди ученые алкоголь общество Что будет, если пить пиво каждый день — исследование

Даже одна привычка в конце дня способна со временем отразиться на работе организма и общем самочувствии.

14.07 / 15:48

технологии мужчина женщина профессор Эксперт Почему вы просыпаетесь в 2 часа ночи – ответ профессора вас удивит

Хронический стресс и непрерывный поток информации из смартфонов заставляют наш мозг оставаться в режиме «бей или беги» даже ночью.

14.07 / 15:38

технологии происшествия смартфон самит гаджет Не быстрая зарядка - что на самом деле убивает аккумулятор смартфона

Главную угрозу для аккумулятора представляет не высокая мощность зарядки, а совсем другой фактор.

14.07 / 15:35

реклама продукты технологии Apple закон Apple выплатит компенсацию владельцам некоторых моделей iPhone за задержку Siri AI

В мае 2026 года компания Apple согласилась выплатить $250 млн для урегулирования коллективного иска в США, связанного с задержкой запуска Siri AI. Калифорнийский суд, рассматривающий это дело, провёл слушание по вопросу предварительного одобрения мирового соглашения, но решение ещё не вынесено. Скорее всего, пройдёт ещё как минимум несколько месяцев, прежде чем клиенты смогут начать подавать заявки на компенсацию. Пользователи iPhone смогут получить до $95. Выплаты начнутся не раньше конца этого года или начала следующего, если мировое соглашение будет окончательно одобрено, сообщает MacRumors.

14.07 / 15:26

технологии Xiaomi отпуск самит умный дом Xiaomi Mijia Smart Water Flosser Pro: теперь ирригатор умнее твоего первого смартфона

Xiaomi продолжает экспансию в вашу ванную комнату. На этот раз они решили, что обычного струи воды для гигиены недостаточно — теперь нам нужен цветной экран и мобильное приложение для чистки зубов. Новый Mijia Smart Water Flosser Pro уже появился на рынке по цене 399 юаней, что составляет приблизительно 56$ (2500 грн).

14.07 / 15:26

Samsung технологии дети общество роботы Samsung забирает награды Red Dot Award за роботов-нянек и «умные» зеркала

Пока мы пытаемся привыкнуть к тому, что искусственный интеллект теперь в каждом утюге, Samsung Electronics продолжает рисовать будущее, где ИИ будет воспитывать наших детей и критиковать состояние кожи по утрам. Компания получила восемь наград на престижном конкурсе Red Dot Award: Design Concept, доказав, что умению создавать красивые рендеры им не занимать. Две из этих наград имеют высший статус «Best of the Best».

14.07 / 15:23

происшествия туризм политика самит Знаменитости ТОП-10 мест в Лондоне, которые не любят сами британцы

Коренные жители Лондона массово игнорируют культовые городские локации. Каждый горожанин не посетил минимум три знаковых места.

14.07 / 15:14

бизнес продукты технологии экономика самит Корпоративная почта под новой защитой: SEG-T и «Солар» создают барьер от хакеров и индустрии фишинга

Ко-фаундер Secure-T Харитон Никишкин при поддержке ГК «Солар» запустил разработку нового продукта класса SEG (security email gateway) c ИИ-фильтрацией трафика и подключением решения за 15 минут в инфраструктуре клиента. Важными факторами для выхода двух компаний на рынок SEG стали снижение порога входа для атакующих корпоративные ресурсы и масштабируемые фишинговые кампании, собранные из готовых конвейеров для атак (административные панели, антибот-механизмы, инфраструктура рассылки, модули перехвата одноразовых кодов и др), ИИ, который используется для автоматизации фишинга.

14.07 / 15:14

технологии конференция история прогноз reddit В 2026 году дополнительную секунду не добавят, а с 2027-го могут разрешить отклонение до часа

Международные органы, отвечающие за измерение времени, готовятся проголосовать по предложению о том, чтобы уже в 2027 году заменить практику добавления «високосной секунды» (дополнительной секунды, которая время от времени добавляется к году для синхронизации Всемирного координированного времени (UTC) с вращением Земли) на разрешение большего расхождения — вплоть до одного часа (так называемый високосный час).

14.07 / 15:12

технологии Amazon закон самит google Опубликованы новые рендеры, характеристики и возможная цена Google Pixel 11

Речь идет о карточках товара, которые, судя по всему, были созданы заранее в качестве черновиков или заглушек перед стартом продаж. Примечательно, что они размещены самим Amazon и отображаются в разделе Google Store на площадке.

Лента новостей

На главную страницу