

Китайская лаборатория представила «рассуждающую» ИИ-модель, которая может стать конкурентом o1 от OpenAI
Китайская лаборатория представила одну из первых моделей искусственного интеллекта (ИИ), способных к «рассуждению», которая, по их словам, может составить конкуренцию o1 от OpenAI.
В среду компания DeepSeek, занимающаяся исследованиями в области ИИ, анонсировала предварительную версию DeepSeek-R1. По заявлению компании, эта модель способна наравне с OpenAI o1-preview выполнять задачи, требующие логического мышления.
В отличие от большинства существующих ИИ, такие модели могут эффективно «проверять свои выводы», затрачивая больше времени на анализ вопроса или задачи. Это помогает им избегать типичных ошибок, часто возникающих у других моделей.
Как и OpenAI o1, DeepSeek-R1 способен «обдумывать» задачи, строить планы и выполнять последовательность действий для достижения ответа. Этот процесс может занимать десятки секунд в зависимости от сложности запроса.
DeepSeek утверждает, что DeepSeek-R1 (точнее, его версия DeepSeek-R1-Lite-Preview) демонстрирует сопоставимые результаты с o1-preview на двух популярных бенчмарках для ИИ: AIME и MATH. AIME оценивает производительность модели с помощью других ИИ, а MATH представляет собой сборник текстовых задач.
Тем не менее, модель пока не совершенна. Некоторые пользователи в X отметили, что DeepSeek-R1 испытывает трудности с играми на проверку логического мышления, такими как крестики-нолики, — аналогичная проблема наблюдается и у o1.
DeepSeek-R1 легко поддается джейлбрейку, то есть может быть «обманута» запросами, которые заставляют игнорировать встроенные ограничения. Один из пользователей X сумел получить от модели подробный рецепт изготовления запрещенных веществ.
Кроме того, DeepSeek-R1 блокирует запросы, связанные с политически чувствительными темами. Например, модель отказалась
Читать на habr.com
