OpenAI отвечает на вызовы конкурентов: что нового в последней модели рассуждений o3-mini?
OpenAI теперь предоставляет более подробную информацию о процессе рассуждений в своей последней модели o3-mini. Об этом изменении было объявлено в аккаунте OpenAI X. Лаборатория AI находится под усиленным давлением со стороны DeepSeek-R1, конкурирующей открытой модели, которая полностью раскрывает свои логические цепочки.
Такие модели, как o3 и R1, проходят длительный процесс «цепочки размышлений» (CoT), в ходе которого они генерируют дополнительные токены для разбиения проблемы, рассуждений и проверки различных ответов и достижения окончательного решения. Ранее модели рассуждений OpenAI скрывали свою цепочку рассуждений и выдавали только высокоуровневый обзор этапов рассуждения. Это затрудняло пользователям и разработчикам понимание логики рассуждений модели и изменение своих инструкций и подсказок, чтобы направить ее в нужное русло.
OpenAI сочла цепочку рассуждений конкурентным преимуществом и скрыла это, чтобы конкуренты не копировали для обучения своих моделей. Но с R1 и другими открытыми моделями, показывающими полную трассировку рассуждений, отсутствие прозрачности становится недостатком OpenAI.
В новой версии o3-mini представлена более подробная версия CoT. Хотя по-прежнему нет токенов raw, это обеспечивает гораздо большую ясность в процессе аргументации.
В предыдущих экспериментах с o1 и R1 было обнаружено, что o1 немного лучше справляется с анализом данных и логическими задачами. Однако одним из ключевых ограничений было то, что не было способа понять, почему модель совершала ошибки, а она часто совершала ошибки при работе с беспорядочными реальными данными, полученными из интернета. С другой стороны, цепочка рассуждений R1 позволила устранять неполадки и менять подсказки для улучшения логического мышления.
Например
Читать на habr.com