Об этом же в других СМИ

ilenta.com / 1 день назад

Утечка раскрыла дизайн и почти все характеристики Samsung Galaxy Watch Ultra 2 до официалього анонса

gagadget.com / 2 дня назад

Секонд-хенд для богатых: кожаная куртка Дженсена Хуанга продана на аукционе почти за $1 миллион

habr.com / 3 дня назад

DeepSeek готовится к IPO: оценка компании выросла до $71 млрд

habr.com / 3 дня назад

OpenTDU фанатский open-source ремейк в разработке

habr.com / 5 дней назад

Сбер выложил в опенсорс GigaAM Multilingual и GigaChat Audio

Больше по теме

30.06.2026 - 07:43 / habr.com

DeepSeek выложил в open source DSpark — модуль, ускоряющий ответы ИИ почти вдвое

Компания DeepSeek совместно с Пекинским университетом выпустила DSpark — модуль, который ускоряет выдачу ответов нейросети, не меняя саму модель. На боевых серверах превью-версий DeepSeek-V4-Flash и V4-Pro скорость генерации для каждого пользователя выросла до +85%. Код и технический отчет компания опубликовала на GitHub.

Технология относится к классу спекулятивного декодирования и ускоряет ответы без потери качества — итоговый текст остается математически идентичным обычной генерации. Прирост измеряли относительно прежнего рабочего варианта под названием MTP-1.

Под капотом — две идеи. Сама схема спекулятивного декодирования устроена так: легкая модель-черновик забегает вперед и быстро набрасывает сразу несколько токенов (слов или их частей), а большая модель проверяет весь блок за один проход — это дешевле, чем генерировать те же токены по одному. Совпавший отрезок с начала блока принимается целиком, и пользователь получает несколько слов за время одного шага. Загвоздка — в качестве черновика: если набрасывать токены блока разом и независимо друг от друга, они плохо стыкуются, и модель легко склеит начало одной фразы с концом другой. Чем дальше от начала блока, тем больше такого брака и тем больше токенов в итоге отвергается. DeepSeek оставил быстрый параллельный черновик, но добавил к нему крошечный последовательный модуль, который перед каждым следующим токеном оглядывается на уже выбранные. Склейка перестает разваливаться, а скорость черновика почти не страдает.

Вторая идея — не проверять лишнего. Проверка блока не бесплатна: под высокой нагрузкой каждый лишний токен занимает в очереди место, которое могло бы достаться другому пользователю, а токены в хвосте блока все равно чаще отвергаются. Поэтому DSpark заранее

продукты самит google крипто токен runawayllm Пекин

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Bloomberg: глава DeepSeek стал самым богатым разработчиком ИИ-модели в мире habr.com / 5 дней назад

Хакеры похитили почти $24 млн из DeFi-протокола Ostium через манипуляцию ценовым оракулом incrypted.com / 5 дней назад

Новый конкурент OpenAI и DeepSeek: Thinking Machines представила свою первую ИИ-модель Inkling incrypted.com / 5 дней назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

22.07 / 05:45

технологии наука история экспедиция доллар Без шансов на спасение: почему предстоящая экспедиция NASA в месяц может оказаться смертельной для космонавтов

Независимые аудиторы NASA обратили внимание на серьезную проблему программы Artemis. По их выводам, в случае чрезвычайной ситуации во время предстоящих пилотируемых миссий на Луну космическое агентство не будет иметь эффективного способа эвакуировать астронавтов.

22.07 / 05:36

общество выплаты Anthropic оставляет Claude Fable 5 в подписках Max и Team Premium, а пользователям Pro выплатит по $100 кредитов

Anthropic определилась с дальнейшей судьбой Claude Fable 5 после нескольких недель продлений доступа. Компания объявила, что с 20 июля модель станет постоянной частью подписок Max и Team Premium, однако использовать ее можно будет только в пределах 50% от доступного лимита.

22.07 / 05:36

технологии СМИ Nvidia рубль пресс-служба В «Яндексе» ответили на заявления Грефа о зависимости компании от китайского ИИ

В «Яндексе» опровергли слова председателя совета директоров «Сбербанка» Германа Грефа о том, что компания перестала разрабатывать собственные модели искусственного интеллекта и стала зависима от китайских решений типа Qwen от Alibaba.

22.07 / 05:36

связь люди Apple закон google Apple и Google придётся удалить в Калифорнии приложения, создающие людей без одежды

Власти города Сан-Франциско обязали Apple и Google удалить из своих магазинов приложений десятки сервисов с функцией создания людей без одежды. Законодательство штата Калифорния криминализует любую деятельность, которая «сознательно способствует» или «безрассудно помогает» создавать порнографию с использованием технологии дипфейк без согласия жертвы.

22.07 / 05:28

Apple история общество семья самит Apple показала, как Apple Watch спасли жизнь после тяжелого падения: часы сами вызвали экстренные службы

Видео опубликовано на официальном YouTube-канале Apple и демонстрирует реальный случай использования функции SOS и обнаружения падения. Компания регулярно рассказывает подобные истории, подчеркивая практическую пользу носимых устройств в критических ситуациях.

22.07 / 04:53

люди авиакатастрофа история общество эвакуация На глубине 600 метров нашли затонувший самолет с пассажирами (ВИДЕО)

Авиакатастрофа произошла вскоре после вылета из-за отказа моторов. Самолет быстро затонул из-за отсутствия слаженной эвакуации людей.

22.07 / 03:49

люди ученые общество самит человек Почему волосы бывают прямыми или кудрявыми - ответ ученых

Исследователи объяснили, с какими факторами связано появление прямых или кудрявых волос от рождения.

22.07 / 03:31

Nvidia общество политика самит изоляция Проект HAMi для виртуализации ускорителей перешел в инкубатор CNCF

Зачастую дорогие графические процессоры фрагментируются и простаивают. Классическая проблема — задача забирает видеокарту целиком, хотя в действительности использует лишь малую часть ее ресурсов. Как в таком случае эффективно распоряжаться кластером? Не забываем, что оборудование поставляется разными вендорами, каждый из которых предлагает свою модель управления.

22.07 / 03:12

мода и стиль Pulsar объявила дату запуска продаж игровой мыши Feinmann F01 Noctua Edition с кулером

Южнокорейская Pulsar представила итоговую версию игровой мыши Feinmann F01 Noctua Edition со встроенным в корпус вентилятором от бренда Noctua. Кулер направляет воздушный поток к ладони геймера во время длительных игровых сессий. Продажи периферийного устройства стартуют 21 июля 2026 года.

22.07 / 03:12

люди ученые здоровье человек кофе Кофе может помочь в борьбе со старением - исследование

Исследователи объяснили, какие свойства кофе являются наиболее эффективными в "войне" против старости.

Лента новостей

На главную страницу