Об этом же в других СМИ

habr.com / 6 месяцев назад

«Крестный отец ИИ» Янн ЛеКун запускает стартап ценой €3 млрд для создания моделей мира

habr.com / 6 месяцев назад

Вышла Gemini 3 Flash: модель уровня Gemini 3 Pro доступна бесплатно

habr.com / 6 месяцев назад

Глава Google DeepMind рассказал, как собирается строить AGI

habr.com / 6 месяцев назад

Как устроена память в ChatGPT и Claude? Инженер вскрыл интересные особенности

habr.com / 6 месяцев назад

«ИИ написал 85% кода»: как четыре инженера OpenAI собрали Android-версию Sora 2 за 28 дней

Больше по теме

04.12.2025 - 07:31 / habr.com

DeepSeek-V3.2: как открытая модель догоняет GPT-5 и берет «золото» олимпиад

DeepSeek выпустила новые открытые модели V3.2 и V3.2-Speciale: "обычная" показывает уровень GPT-5 Thinking, при этом доступна бесплатно в веб-версии и приложениях (в API цена на выход в 24 раза ниже), а Speciale стала первой широкодоступной моделью (да еще и с открытыми весами!), которая показала уровень золотой медали в олимпиадах по математике (международной и китайской), информатике, а также финала чемпионата мира по программированию. В техотчете DeepSeek дан рецепт, как этого удалось достичь — основных составляющих успеха три.

Первая — DeepSeek Sparse Attention. Вместо того чтобы на каждом шаге смотреть на все 128 тысяч токенов контекста, модель выбирает только 2048 самых релевантных. Для этого используется отдельный легкий блок — "молниеносный индексатор", который быстро оценивает важность каждого токена. Сложность падает с квадратичной до почти линейной, стоимость инференса на длинных контекстах — тоже. Вот графики реальной цены токена на кластере H800:

Вторая — агрессивное пост-обучение. DeepSeek прямо пишут, что бюджет на RL уже превысил 10% от стоимости предобучения. При этом использована хитрая схема: сначала обучают отдельных "специалистов" для математики, кода, логики и агентных задач, каждый проходит через интенсивный RL. Потом ответы специалистов дистиллируются в одну модель, и ее снова прогоняют через финальный этап RL. В техотчете подробно разбирают, как не "взорвать" модель при таком масштабировании: исправление смещения в KL-штрафе, маскирование off-policy примеров, фиксация путей маршрутизации экспертов между инференсом и обучением. Приятно, что в DeepSeek не скрывают свои приемы — любой, кто занимается пост-обучением ИИ, может попробовать использовать аналогичные подходы.

Третья — данные для агентов. За

Олимпиада золото кулинария крипто токен gemini runawayllm eps

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Qwen3-Omni-Flash: китайская модель догнала Gemini 2.5 Pro по аудио — и стоит в 3 раза дешевле habr.com / 6 месяцев назад

OpenAI: каждая новая ИИ-модель может стать кибероружием habr.com / 6 месяцев назад

DeepSeek V4 хотят выпустить к концу января. Модель тренируют на контрабандных Nvidia Blackwell habr.com / 6 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

06.07 / 05:28

Путешествия самит интересное Lego выпустила набор с пинбольным автоматом

Lego представила набор Icons Arcade Pinball Machine, который позволяет собрать функциональный настольный пинбол-автомат и поиграть в аркадную игру.

06.07 / 05:28

Apple музыка выплаты доллар Tidal увеличит стоимость подписки до $13 долларов с 3 августа, ссылаясь на более высокую поддержку артистов

Музыкальный стриминговый сервис Tidal предупредил о повышении стоимости индивидуальной подписки с $11 до $13 в месяц. Новая цена начнёт действовать с 3 августа 2026 года.

06.07 / 05:14

экономика доллар intel Beelink представила мини-ПК EQi 304 с памятью UFS 3.1 вместо SSD

Главной особенностью новинки стало необычное решение с хранилищем: вместо привычного SSD в базовой конфигурации используется встроенная флеш-память стандарта UFS 3.1, хорошо знакомая по современным смартфонам.

06.07 / 05:06

люди ученые здоровье общество человек Почему с возрастом люди становятся ниже - ответ ученых

Специалисты объяснили, какие возрастные изменения считаются нормой, а в каких случаях уменьшение роста требует внимания врачей.

06.07 / 04:34

люди здоровье семья психология дефицит 7 вещей, которые уверенные в браке женщины никогда не требуют от мужей

Секрет крепких отношений кроется в доверии. Узнайте, какие повседневные вещи счастливые жены получают без лишних споров и контроля.

06.07 / 04:07

мода отпуск самит предприятия Геймер подписал с супругой контракт, который запрещает ей мешать ему играть в GTA VI

В соцсетях завирусился пост с шуточным контрактом, который подписали супруги из Великобритании. Согласно документу, один из супругов (интернет ставит на мужа) получает право играть в GTA VI с 19 по 29 ноября 2026 года без каких-либо ограничений.

06.07 / 04:07

бизнес промышленность общество рубль предприятия Группе компаний ICL – 35 лет: от завода ЭВМ до лидера отечественной ИТ-индустрии в производстве, ПО и сервисах

2 июля 1991 года началась история ГК ICL – одного из лидеров современной российской ИТ-отрасли. Юбилей группа компаний встречает с расширенной линейкой собственных программных продуктов, заводом мощностью до 1 млн изделий в год и стратегией, позволяющей конкурировать с крупнейшими мировыми брендами.

06.07 / 03:08

технологии смартфон общество самит гаджет На смартфонах Android нашли скрытого «пожирателя» памяти

Специалисты выяснили, какой системный компонент может незаметно занимать несколько гигабайт памяти и влиять на работу устройства.

06.07 / 01:42

люди ученые история Знаменитости Шоу бизнес Новая загадка Стоунхенджа – на что приходили смотреть тысячи людей

Строительный процесс пятитысячелетней давности требовал от людей слаженных действий и смекалки. Строители умели обходить сложные участки рельефа.

06.07 / 01:30

продукты медицина люди здоровье продукты питания Как употребление одного авокадо в день связано с диабетом

Ученые доказали пользу ежедневного употребления авокадо для контроля за обменом веществ. Продукт помогает сдерживать резкие скачки глюкозы.

Лента новостей

На главную страницу