




Дистилляция по-китайски: как DeepSeek R1 оказался под прицелом из-за Google Gemini
Свежий технодетектив на горизонте, и в центре внимания снова наш старый знакомый — китайская AI‑лаборатория DeepSeek. На прошлой неделе они выпустили обновлённую версию своей reasoning‑модели R1 (R1-0528), которая впечатляет в математике и кодинге. Но вот вопрос: что именно её так хорошо натренировало? Ответа от DeepSeek пока нет, зато появились подозрительные совпадения, указывающие на Google Gemini.
Сэм Пейч, разработчик из Мельбурна, известный своими тестами «эмоционального интеллекта» для ИИ, опубликовал в X анализ, показывающий, что R1-0528 использует слова и выражения, очень похожие на те, что предпочитает Gemini 2.5 Pro от Google. По его мнению, DeepSeek мог переключиться с синтетических данных от OpenAI на синтетику от Gemini.
Это, конечно, не «дымящийся пистолет». Но к аналогичным выводам пришёл и другой исследователь — анонимный создатель бенчмарка свободы речи для ИИ SpeechMap. Он заметил, что «следы» (trace) новой модели DeepSeek — те самые промежуточные рассуждения, которые генерирует ИИ на пути к ответу, — «читаются как следы Gemini».
Это не первая подобная история с DeepSeek: ещё в декабре разработчики заметили, что их модель V3 часто идентифицировала себя как ChatGPT, что намекало на возможное обучение на логах чатов OpenAI. Позже OpenAI заявила FT, что нашла свидетельства использования DeepSeek дистилляции — техники обучения модели на выходах более крупных и мощных конкурентов. Bloomberg же сообщал, что Microsoft (партнёр OpenAI) зафиксировала масштабную утечку данных через аккаунты разработчиков OpenAI в конце 2024 года — аккаунты, которые, по мнению OpenAI, связаны с DeepSeek.
Сама по себе дистилляция — практика нередкая, но условия использования OpenAI явно запрещают применять выходы их моделей
Читать на habr.com