Исследователи создали конкурента ChatGPT и DeepSeek-R1 всего за $50
- Ученые из Стэнфорда и Университета Вашингтона обучили ИИ-модель s1 за менее чем $50.
- s1 демонстрирует результаты, сопоставимые с передовыми продуктами от OpenAI и DeepSeek.
- Проект вызывает вопросы о коммерциализации ИИ и защите интеллектуальной собственности.
Группа исследователей из Стэнфорда и Университета Вашингтона разработала ИИ-модель s1, потратив на ее обучение менее $50 на облачные вычисления. Модель показала результаты, сравнимые с ведущими проектами отрасли, такими как OpenAI o1 и DeepSeek-R1. Данные и код для обучения s1 доступны на GitHub.
Модель создали с помощью метода дистилляции, при котором ИИ обучается на ответах другого решения. В качестве основы использовалась экспериментальная модель Google Gemini 2.0 Flash Thinking. Исследователи подчеркнули, что обучение заняло менее 30 минут с использованием 16 GPU Nvidia H100, а стоимость аренды вычислительных мощностей составила около $20.
Что такое машинное обучение? Все, что вам нужно знать 07.10.2023 37 мин 6280 читатьУспех проекта вызывает вопросы о защите коммерческих ИИ-моделей, считают ученые. Ранее OpenAI начала расследование в отношении DeepSeek из-за вероятного неправомерного использовании данных из своего API.
Условия использования Google также запрещают реинжиниринг их продуктов для создания конкурирующих сервисов. Однако комментарии от компании касательно проекта исследователи пока не поступили.
По мнению ученых, эксперимент показал, что для создания эффективных моделей рассуждений не требуется масштабных ресурсов. Используя всего 1000 тщательно подобранных вопросов и ответов, команда достигла значимых результатов.
При этом один из методов повышения точности заключался в том, чтобы просить модель «подождать» перед выдачей ответа, что увеличивало
Читать на incrypted.com


