Исследователи создали открытого конкурента модели рассуждений OpenAI o1 менее чем за $50
Согласно новой статье, опубликованной в прошлую пятницу, исследователи искусственного интеллекта из Стэнфорда и Вашингтонского университета смогли обучить модель «рассуждений» искусственного интеллекта менее чем за $50 в виде облачных вычислений.
Модель, известная как s1, работает аналогично передовым моделям рассуждений, таким как o1 от OpenAI и R1 от DeepSeek, в тестах, измеряющих математические и кодирующие способности. Модель s1 доступна на GitHub вместе с данными и кодом, используемыми для ее обучения.
Команда, стоящая за s1, заявила, что они начали с готовой базовой модели, а затем доработали ее с помощью дистилляции — процесса извлечения «логических» возможностей из другой модели AI путем обучения на ее ответах.
Исследователи заявили, что s1 является дистилляцией одной из моделей рассуждений Google, Gemini 2.0 Flash Thinking Experimental. Дистилляция — это тот же подход, который исследователи из Беркли использовали для создания модели рассуждений ИИ примерно за 450 долларов в прошлом месяце . Неудивительно, что крупные лаборатории AI недовольны. OpenAI обвинила DeepSeek в ненадлежащем сборе данных из своего API для целей дистилляции моделей .
Исследователи, стоящие за s1, пытались найти самый простой подход для достижения высокой производительности рассуждений и масштабирования времени тестирования, или позволить модели AI думать больше, прежде чем она ответит на вопрос. Это были некоторые из прорывов в o1 от OpenAI, которые DeepSeek и другие лаборатории AI пытались воспроизвести с помощью различных методов.
В статье s1 предполагается, что модели рассуждений можно выделить из относительно небольшого набора данных с помощью процесса, называемого контролируемой тонкой настройкой (SFT), в котором модели AI явно
Читать на habr.com

