Джек Моррис снял рассуждающий режим с gpt-oss-20b, вернув её к исходному виду
Меньше двух недель назад OpenAI выпустила новое поколение своих мощных моделей с открытыми весами — семейство gpt‑oss. Она распространяется под свободной лицензией Apache 2.0 и стала первой подобной публикацией компании со времён GPT-2 в 2019 году. Не прошло и пары недель, как внешние разработчики уже начали радикально ее переосмыслять.
Один из самых ярких примеров принадлежит Джеку Моррису — аспиранту Cornell Tech, бывшему исследователю в Google Brain и нынешнему сотруднику Meta✶. На этой неделе он представил gpt‑oss-20b‑base — собственную переработку младшей модели gpt‑oss-20B. В его версии убрано поведение, связанное с рассуждением, и модель возвращена к состоянию предобученной базовой версии, где ответы звучат быстрее, свободнее и менее отфильтрованно.
Сейчас модель доступна на Hugging Face под свободной лицензией MIT, что открывает путь как для дальнейших исследований, так и для коммерческого использования.
«Мы, по сути, отменили этап выравнивания в обучении LLM, — написал он в своём треде на X. — Теперь она снова генерирует естественный текст. Больше никаких цепочек рассуждений — просто предсказание следующего токена в обычном тексте».
Вместо того чтобы пытаться «взломать» модель с помощью хитроумных промптов — что, по словам Морриса, показало себя бесполезным на ранних экспериментах, — он пошёл другим путём. Подтолкнуло его к этому общение с бывшим сооснователем OpenAI, а ныне главным научным сотрудником стартапа Thinking Machines Джоном Шульманом.
Ключ был в том, чтобы рассматривать «откат выравнивания» как небольшую оптимизационную задачу: если большая часть предобученных знаний всё ещё хранится в весах модели, то достаточно лишь малой корректировки, чтобы подтолкнуть её обратно к базовому поведению.
Моррис реализовал
Читать на habr.com

