Об этом же в других СМИ

habr.com / 1 месяц назад

Спрос превысил предложение в 20 раз: производитель ИИ-чипов Cerebras провел IPO

habr.com / 2 месяца назад

Anthropic чуть не поглотила OpenAI в ноябре 2023-го — Суцкевер подтвердил это в суде

habr.com / 2 месяца назад

Из настроек Chrome пропало сообщение о приватности локального ИИ Gemini Nano. Это может стоить Google миллиарды

habr.com / 2 месяца назад

Из экспоненты в полином за два часа: что GPT-5.5 Pro сделала с задачей по теории чисел

habr.com / 2 месяца назад

Google собрал ИИ-математика — и тот закрыл открытую задачу из Коуровской тетради

Больше по теме

29.04.2026 - 12:57 / habr.com

И это ваш AGI? DeepSeek V4 допустил мрачную ошибку в задаче про апельсины и нож

В соцсетях разошелся скрин с ответом DeepSeek V4 на простую головоломку: как поровну разделить четыре одинаковых апельсина между четырьмя детьми, если есть только один нож. На скрине модель выбирает самый недопустимый "обход" условия — предлагает использовать нож против одного ребенка, а затем все равно считать его четвертым получателем апельсина. Пользователи встретили скрин с шутками "AGI подтвержден!".

Скриншот действительно повторяет интерфейс мобильного приложения DeepSeek V4 и из него видно, что вопрос задали более слабой Fast-версии модели на 284 млрд параметров против 1,6 трлн параметров у версии Expert. При этом у модели был включен режим рассуждений, а над задачей она "думала" 56 секунд. Также важно понимать, что любой ИИ — недетерминированная система, поэтому может по-разному отвечать на один и тот же вопрос.

Я задал аналогичный вопрос четырем разным режимам DeepSeek V4: Fast с рассуждениями и без, Expert с рассуждениями и без. Ни одна из версий не воспроизвела ответ, аналогичный скриншоту — вместо этого модель либо предлагала просто дать каждому ребенку по апельсину, либо разрезать один апельсин и отдать части одному из детей, либо уходила в переусложненные, но безопасные схемы с разрезами. Claude Opus 4.7 и GPT-5.5 верно предложили не использовать нож, а просто раздать апельсины детям.

При анализе цепочки рассуждений "думающих" версий было видно, что обе модели рассматривали вариант с убийством ребенка, но признали его "черным юмором". Проблема не обязательно в том, что DeepSeek V4 стабильно "советует" опасное решение, а в том, что пользователь может увидеть промежуточную гипотезу, которая никогда не должна была становиться частью публичного ответа.

Задача поделить апельсины перекликается с другой шутливой

дети криминал самит Дом и интерьер runawayllm eps

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

DeepSeek V4 силен только в «своих» бенчмарках. На независимых — отстает на 8 месяцев habr.com / 2 месяца назад

Конец независимости DeepSeek: лаборатория Ляна Вэньфэна идет за деньгами habr.com / 2 месяца назад

Claude Code штрафовал пользователей за упоминание OpenClaw и Hermes. В Anthropic заявили, что это баг habr.com / 2 месяца назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

18.07 / 20:44

технологии происшествия люди общество профессор Почему многие люди просыпаются в 2 часа ночи - ответ профессора

Стресс, смартфоны и постоянный поток информации могут заставлять мозг оставаться активным даже ночью.

18.07 / 20:34

Samsung технологии экономика общество самит Samsung Galaxy Z Fold 8 Ultra показали на официальных рендерах до анонса: раскрыты дизайн, камеры и увеличенная батарея

До официальной презентации Samsung Galaxy Z Fold 8 Ultra остается всего неделя, однако в сети уже появились пресс-рендеры нового складного флагмана. Изображения опубликовал известный инсайдер Эван Бласс (@evleaks) в своей рассылке Substack, благодаря чему стало возможным детально рассмотреть дизайн устройства и подтвердить ряд ранее появившихся утечек.

18.07 / 19:52

Samsung технологии смартфон семья гаджет Выбираем Samsung в 2026 году – смартфоны с рекордной поддержкой ПО

При выборе нового Samsung в 2026 году стоит обратить внимание на модели с длительной программной поддержкой.

18.07 / 19:52

погода продукты общество самит жара В какой позе лучше засыпать для лучшего отдыха в сильную жару

П словам врача, правильная поза и несколько хитрых вечерних трюков, которые заставят организм мгновенно остыть и гарантируют крепкий сон даже в душной комнате.

18.07 / 19:52

люди здоровье общество лечение болезнь Симптомы опасно высокого давления, которые можно заметить на лице

Игнорировать высокое давление нельзя ни в коем случае, предупреждают врачи.

18.07 / 19:12

технологии СМИ самит фейки мода и стиль HMD готовит сразу несколько новых смартфонов: подтверждены Fusion 2 и XR22, а часть громких утечек оказалась фейком

Компания HMD Global, выпускающая смартфоны под собственным брендом HMD и ранее занимавшаяся производством устройств Nokia, продолжает развивать сразу несколько новых проектов. Согласно свежей информации от авторитетного инсайдера @smashx_60, который ссылается на источники внутри компании, разработка модульного смартфона HMD Fusion 2 не только не отменена, но и активно продолжается. Одновременно подтверждается работа над защищенным HMD XR22, тогда как часть недавно появившихся концептов серии Skyline названа недостоверной.

18.07 / 18:52

погода медицина общество отдых жара Почему нельзя принимать холодный душ перед сном в жару

Холодный душ перед сном в жаркую погоду может не освежить, а наоборот усложнить засыпание, предупредила врач.

18.07 / 18:35

технологии спорт Nvidia семья AMD Семь голов лучше одной: как Bosgame превращает мини-ПК в ИИ-монстра

Запуск больших языковых моделей (LLM) обычно требует либо бездонного кошелька для оплаты облачных сервисов, либо серверной комнаты, которая потребляет энергию как небольшой городок. Однако компания Bosgame решила пойти другим путём, продемонстрировав, что для локальной работы с DeepSeek-V3.1 — монстром на 671 миллиард параметров — совсем не обязательно покупать стойку с Nvidia H100.

18.07 / 18:11

продукты связь технологии Путешествия общество Новая утечка раскрыла Nokia 300 4G Power Bank: кнопочный телефон сможет работать до 44 дней и заряжать другие устройства

Информация появилась благодаря известному инсайдеру Smashx_60. На данный момент HMD Global официально не представила устройство, поэтому все опубликованные характеристики следует рассматривать как утечку. Тем не менее источник неоднократно публиковал достоверные сведения о будущих продуктах компании.

18.07 / 18:03

продукты здоровье алкоголь общество самит Как долго алкоголь остается в организме, рассказали врачи

Алкоголь быстро всасывается в кровь после употребления, но значительно дольше выводится из организма, предупреждают врачи.

Лента новостей

На главную страницу