Об этом же в других СМИ

cursorinfo.co.il / 10 месяцев назад

Как ритм и режим сна влияет на здоровье: от диабета до депрессии

habr.com / 10 месяцев назад

Сняли типичную рекламу работы в IT-корпорации, зацените

incrypted.com / 10 месяцев назад

Компания Джека Ма создала Ethereum-казначейство и инвестировала в актив около $44 млн

habr.com / 10 месяцев назад

Линус Торвальдс перевёл Bcachefs в режим «внешнего сопровождения» (Externally maintained)

gagadget.com / 10 месяцев назад

Настоящий подарок фанатам хардкора: в сентябре в Elden Ring: Nightreign появится режим Deep of Night с повышенной сложностью

Больше по теме

19.08.2025 - 18:41 / habr.com

Джек Моррис снял рассуждающий режим с gpt-oss-20b, вернув её к исходному виду

Меньше двух недель назад OpenAI выпустила новое поколение своих мощных моделей с открытыми весами — семейство gpt‑oss. Она распространяется под свободной лицензией Apache 2.0 и стала первой подобной публикацией компании со времён GPT-2 в 2019 году. Не прошло и пары недель, как внешние разработчики уже начали радикально ее переосмыслять.

Один из самых ярких примеров принадлежит Джеку Моррису — аспиранту Cornell Tech, бывшему исследователю в Google Brain и нынешнему сотруднику Meta✶. На этой неделе он представил gpt‑oss-20b‑base — собственную переработку младшей модели gpt‑oss-20B. В его версии убрано поведение, связанное с рассуждением, и модель возвращена к состоянию предобученной базовой версии, где ответы звучат быстрее, свободнее и менее отфильтрованно.

Сейчас модель доступна на Hugging Face под свободной лицензией MIT, что открывает путь как для дальнейших исследований, так и для коммерческого использования.

«Мы, по сути, отменили этап выравнивания в обучении LLM, — написал он в своём треде на X. — Теперь она снова генерирует естественный текст. Больше никаких цепочек рассуждений — просто предсказание следующего токена в обычном тексте».

Вместо того чтобы пытаться «взломать» модель с помощью хитроумных промптов — что, по словам Морриса, показало себя бесполезным на ранних экспериментах, — он пошёл другим путём. Подтолкнуло его к этому общение с бывшим сооснователем OpenAI, а ныне главным научным сотрудником стартапа Thinking Machines Джоном Шульманом.

Ключ был в том, чтобы рассматривать «откат выравнивания» как небольшую оптимизационную задачу: если большая часть предобученных знаний всё ещё хранится в весах модели, то достаточно лишь малой корректировки, чтобы подтолкнуть её обратно к базовому поведению.

Моррис реализовал

общество самит стартап Apache google токен dmitrifriend

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

У Tesla появится «Режим пониженного энергопотребления» как у смартфонов gagadget.com / 10 месяцев назад

В Notion появился офлайн-режим habr.com / 10 месяцев назад

Релиз открытой модели ByteDance: Seed-OSS-36B с контекстом в 512 000 токенов habr.com / 10 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

15.07 / 23:46

технологии смартфон самит гаджет Почему смартфон заряжается медленно: дело может быть не в кабеле

При покупке кабеля для смартфона специалисты советуют учитывать не только его длину, но и качество изготовления.

15.07 / 22:13

экономика общество семья самит психология Простая вещь, которую мужчины не могут понять о зрелых женщинах

Писательница Ким Петерсен объяснила, почему кризис среднего возраста у женщин — это не капризы или менопауза, а глубокая перестройка всей жизни.

15.07 / 22:10

Samsung технологии здоровье история общество В сеть утекли официальные изображения всех новинок Samsung перед Galaxy Unpacked

Если информация подтвердится, уже 22 июля на мероприятии в Лондоне компания представит сразу несколько флагманских устройств нового поколения: Galaxy Z Fold8, Galaxy Z Fold8 Ultra, Galaxy Z Flip8, Galaxy Watch9 и Galaxy Watch Ultra 2. На данный момент речь идет об утечке, однако опубликованные изображения выглядят как официальные маркетинговые рендеры и совпадают с более ранними инсайдерскими данными.

15.07 / 20:21

Apple самит мода и стиль Parke MacRumors LEGO выпустит набор с легендарным iMac G3: проект прошел важный этап отбора

Платформа LEGO Ideas позволяет поклонникам бренда предлагать собственные концепции будущих наборов. Если проект набирает не менее 10 000 голосов, его рассматривает специальная комиссия LEGO, которая решает, стоит ли запускать модель в серийное производство.

15.07 / 19:47

продукты люди здоровье общество Здоровье и красота Две лучшие крупы для похудения назвали ученые

Эксперты рассказали, в каких случаях лучше выбрать гречку, а в каких рис.

15.07 / 19:47

технологии общество рубль электромобиль пресс-служба UMO объявила о старте предзаказов электрического кроссовера UMO 5 для частных покупателей в России

Компания UMO объявила о старте приёма предзаказов на электрический кроссовер UMO 5 для частных покупателей и раскрыла цены и комплектации модели. Автомобиль будет доступен в двух версиях. Комплектацию «Про» оценили в 2,59 млн рублей, а версию «Макс» — в 2,79 млн рублей. Цены действуют с учётом субсидии при покупке электромобиля, рассказали Хабру в пресс-службе компании.

15.07 / 19:23

технологии AOC представила необычный портативный монитор с цветным E Ink-дисплеем

Вместо привычной LCD- или OLED-матрицы новинка получила цветной экран на основе электронной бумаги E Ink. Продажи уже стартовали в Китае, где устройство оценили в 4599 юаней (около 679 долларов).

15.07 / 19:18

продукты здоровье общество женщина Здоровье и красота Три продукта, которые необходимы всем женщинам после 40 лет

Какие продукты позитивно влияют на женский организм, поддерживают гормональный баланс и продлевают молодость.

15.07 / 19:18

люди здоровье общество самит сон Шесть недель недосыпания могут изменить тело - ученые

Даже незначительное недосыпание может повлиять на тело быстрее, чем кажется.

15.07 / 19:12

продукты OpenAI OpenAI представила Codex Micro — компактный девайс для удобного программирования и управления AI-агентами

OpenAI представила Codex Micro — компактное настольное устройство, созданное совместно с производителем механических клавиатур Work Louder. Это первый аппаратный продукт компании, ориентированный на программистов, которые используют в своей работе AI-платформу Codex.

Лента новостей

На главную страницу