Об этом же в других СМИ

incrypted.com / 1 год назад

Гонконг одобрил биткоин и Ethereum как доказательство состояния для получения инвестиционной визы

habr.com / 1 год назад

Новая технология машинного обучения улучшает анализ человеческих эмоций

incrypted.com / 1 год назад

Гонконг одобрил биткоин и Ethereum как доказательство состояния для получения инвестиционной визы

chudo.tech / 1 год назад

Китайские инженеры создали робота-гуманоида, способного бегать как человек

news.uaportal.com / 1 год назад

Как классическая музыка влияет на плод во время беременности женщины: ученые совершили невероятное открытие

Больше по теме

24.01.2025 - 09:58 / habr.com

Разбираемся, как устроена R1 – новая бесплатная ризонинг модель ИИ из Китая, работающая на уровне o1 от OpenAI

Вчера, 20 января, китайская лаборатория DeepSeek сделала нам всем настоящий подарок, открыв доступ к новой reasoning-модели R1, которая уже штурмует вершины ML-бенчмарков.

R1 – не просто еще одна рассуждающая модель: это первая бесплатная моделька с открытыми весами, которая добивается таких результатов. На математическом бенчмарке AIME 2024она достигает 79.8%, обогнав даже обновленную версию o1 с ее 79.2%, не говоря уже об o1-mini (63.6%). В кодинге R1 тоже хороша. Например, на Codeforces ее результат – 96.3%, что практически недостижимо для большинства людей.

Моделью уже можно воспользоваться в чате chat.deepseek.com/. Доступно 50 сообщений в день, VPN не требуется. И самое прекрасное: кроме весов и кода DeepSeek выложили замечательный тех.отчет, в котором подробно описали, как им удалось обучить такую мощную модель. Сейчас мы разберем его по полочкам.

Итак, надо сказать, что на самом деле DeepSeek представили не одну модель, а целых 8: саму R1, ее младшую сестренку R1-Zero и 6 дистиллированных, то есть уменьшенных, моделей. К ним еще вернемся, о пока начнем с R1 Zero.

Несмотря на то, что R1 – умнейшая из них, самая интересная с точки зрения техники исполнения, пожалуй, именно R1-Zero. Ноль в названии фигурирует не просто так. Дело в том, что R1-Zero была обучена вообще без использование каких-либо размеченных людьми данных. Учитывая ее результаты, это просто поражает. Большинство LLM обучаются в три этапа:

Претрейн на большом количестве текста. На этом этапе модель выучивается понимать текст и связно его генерировать, а также запоминает факты и набирается общих знаний о мире и языке.

Файнтюнинг. Обучение на размеченных данных вида <вопрос-идеальный ответ>. Нужно для того, чтобы модель научилась лучше следовать

технологии люди общество семья самит интересное Китай

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Инсайдер рассказал, когда ждать Xiaomi Mix Flip 2 и какие улучшения он получит gagadget.com / 1 год назад

Исследователь определил, как ИИ-модели представляют среднестатистического человека: женщина 30 лет, работает в IT и живет… в России/Японии itc.ua / 1 год назад

США опередили Китай в разработке лучшего AI: новая модель из Сиэтла превосходит DeepSeek V3 habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

05.07 / 20:39

технологии деньги евро Bang & Olufsen выпустила свой первый повербанк: премиальный дизайн, Qi2 и цена 145 евро

В отличие от большинства внешних аккумуляторов, ориентированных исключительно на практичность, Bang & Olufsen решила сделать акцент на внешнем виде. Корпус устройства выполнен из двух стеклянных панелей, объединенных алюминиевой рамкой с алмазной обработкой. Под стеклом размещена декоративная перламутровая текстура, благодаря которой аксессуар выглядит особенно эффектно. Покупателям доступны расцветки Infinite Black и Gold Sand.

05.07 / 20:29

закон общество законодательство выплаты самит Суд в Швеции обязал Google выплатить $1,5 млрд сервису сравнения цен PriceRunner

Шведский суд обязал Google выплатить около $1,5 млрд компенсации сервису сравнения цен PriceRunner, принадлежащему платёжной платформе Klarna. Инстанция постановила, что американская корпорация отдаёт предпочтение собственному сервису покупок в поисковой выдаче.

05.07 / 20:09

происшествия животные взрывы курьез животный мир Взрыв и паника: маленькая белка напугала американских военных (ВИДЕО)

Громкий церемониальный выстрел в честь юбилея США до смерти напугал грызуна. Соцсети штурмует видео экстремального падения животного прямо на спину военного.

05.07 / 20:09

общество самит смерть мозг сон Британка, у которой трижды остановилось сердце, раскрыла, что увидела

Бывшая курсантка ВВС, выжившая в автокатастрофе, утверждает, что побывала на "том свете" и встретила ангела, который указал на главную ошибку в ее жизни.

05.07 / 19:36

животные дети общество пляж Школьник откопал у воды зуб, которому 1,8 млн лет

Семейная прогулка возле поселка Баудси обернулась важным палеонтологическим открытием. Школьник поднял из воды редчайшую окаменелость.

05.07 / 19:36

происшествия история курьез жертва кошка Кошка вернулась с прогулки ярко-синим и удивила хозяев своим видом

Британка Софи Дженкин не могла сдержать смех, когда ее кошка вернулась с прогулки ярко-синего цвета. Подписчики выяснили причину инцидента.

05.07 / 19:14

технологии WhatsApp начал тестировать индикатор онлайн-статуса с зеленой точкой на iPhone

Пользователи, участвующие в программе бета-тестирования и установившие последнюю версию приложения, могут увидеть небольшую зеленую точку в правом нижнем углу фотографии контакта. Она появляется на экране «Информация о контакте», если собеседник находится онлайн.

05.07 / 19:05

самит курьез деревня Sun Кебабы спровоцировали "войну" в самой живописной деревне Англии

Британский ресторатор столкнулся с сопротивлением общины, защищающей культурное наследие поэта Уильяма Вордсворта от запаха жира и круглосуточных очередей.

05.07 / 19:05

продукты Путешествия продукты питания самит магазин Почему яйца в магазинах не выставляют в холодильниках

Зарубежные торговые сети сознательно отказываются от охлаждения этого продукта на прилавках. За таким решением кроется строгий физический расчет.

05.07 / 19:05

происшествия общество психология смерть психика "Мы не позволим": американка описала 10 минут клинической смерти

Пациентка детально описала момент своего выхода из физического тела в больнице. В эту секунду ее полностью покинули тревога, грусть и боль.

Лента новостей

На главную страницу