Об этом же в других СМИ

habr.com / 3 месяца назад

Режим “Советник”: связка Sonnet+Opus делает модели умнее, не поднимая цену

habr.com / 3 месяца назад

DeepSeek готовит три новые модели: V4 Lite, V4 Expert и V4 Vision. Релиз возможен уже в апреле

habr.com / 3 месяца назад

Alibaba выпустила VimRAG – не просто RAG, а агент с графом памяти

habr.com / 3 месяца назад

Google выпустила Gemma 4 2B/4B/26B/31B: открытые веса и 3-е место на Arena AI

habr.com / 3 месяца назад

Alibaba выпустила Wan2.7-Image – ИИ для генерации и изменения картинок

Больше по теме

26.03.2026 - 13:04 / habr.com

“Сбер” выпустил GigaChat 3.1 (702B и 10B): две мощные MoE-модели с лицензией MIT

“Сбер” выпустил крупное обновление семейства больших языковых моделей GigaChat, выложив новые версии GigaChat-3.1-Ultra (702B) и GigaChat-3.1-Lightning (10B) в открытый доступ. Модели доступны на Hugging Face и GitVerse под лицензией MIT – разработчики могут разворачивать их, адаптировать под корпоративные данные и использовать как основу для чат-ботов, ассистентов или отраслевых ИИ-сервисов.

Обновление стало самым масштабным с момента ноябрьского preview. В новых версиях полностью переработан этап постобучения, архитектура переведена с dense на MoE (mixture of experts), а ключевым качественным улучшением стала устойчивость генерации – модели значительно реже уходят в циклы, особенно в длинных диалогах.

Релиз планировался ещё на январь, но на этапе валидации выяснилось, что все три модели склонны к повторениям – от простых повторов одного слова до сложных циклов вроде:

“…Тропики. Обжигающее солнце. Пальмы. Пальмы. Пальмы. И жара, жара, жара. И океан, океан, океан…”

Чтобы измерить проблему, инженеры придумали собственную метрику на основе BPE-подобного сжатия хвоста генерации. Идея проста: если конец ответа состоит из повторяющихся фрагментов, он хорошо сжимается; если разнообразен – почти не сжимается. Метрика получила название BPE_CYCLES и позволила поднять порог обнаружения циклов с 75% до 90%.

Вместо посттренировочной квантизации (PTQ), которая сохраняла качество на бенчмарках, но приводила к проседанию на аренах, этап DPO полностью переведён в нативный FP8. Такой подход не только восстановил, но местами и превзошёл качество BF16, сократив потребление памяти вдвое. В связке с MTP (multi-token prediction) это даёт прирост скорости инференса до 38% по сравнению с моделью в BF16 – на H100 с concurrency=32 удалось достичь

технологии общество самит интересное крипто dmitrifriend

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

TurboQuant: Google сжал KV-кеш LLM до 3 бит без потери точности – ускорение на H100 до 8 раз habr.com / 3 месяца назад

136 ядер, 3,7 ГГц: Arm показала свой первый за 35 лет чип Arm AGI, предназначенный для ИИ habr.com / 3 месяца назад

Reddit ужесточает проверку аккаунтов с подозрительным поведением habr.com / 3 месяца назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

26.07 / 14:44

происшествия люди здоровье искусственный интеллект скандал Обвинения в смертях – OpenAI оказалась в центре крупного скандала

Компания OpenAI столкнулась с волной судебных исков из-за того, что ChatGPT усугублял психический кризис пользователей.

26.07 / 14:44

животные закон криминал история суд Свинья на скамье подсудимых: абсурдные законы в Средневековье

Зимой 1457 года во Франции прошел один из самых известных судебных процессов. Свинью и ее поросят обвинили в гибели пятилетнего ребенка.

26.07 / 14:44

продукты здоровье полезные продукты Эксперт мозг Как грецкие орехи влияют на мозг, сердце и настроение

Благодаря высокому содержанию полезных жиров и полифенолов грецкие орехи способны снижать стресс.

26.07 / 14:33

продукты технологии люди Apple общество Созданные с помощью вайбкодинга приложения заполонили App Store, но пользователи этому не рады

Развитие генеративного искусственного интеллекта и инструментов для вайбкодинга привело к резкому росту числа новых приложений в App Store. Однако пользователи всё чаще жалуются на засилье однотипных программ, созданных с помощью ИИ, а разработчики — на то, что привлечь внимание к своему продукту становится всё сложнее, сообщает The New York Times.

26.07 / 13:45

закон прогноз самит google Трейдерам Kalshi обвинила Netflix в клевете из-за трейлера документального фильма о рынках прогнозов

Платформа рынков прогнозов Kalshi направила Netflix официальное письмо с требованием прекратить распространение трейлера документального фильма Instadocs: The Prediction Games, пишет CNN. Компания заявила, что ролик содержит «клеветнические», «сфабрикованные» и вводящие в заблуждение материалы, которые могут создать впечатление, будто пользователи торговали спортивными контрактами в штате Невада вопреки судебному запрету. Kalshi требует убрать трейлер Netflix опубликовал трейлер документального фильма Instadocs: The Prediction Games, премьера которого запланирована на 27 июля. В нем показаны трейдеры на вечеринке в Лас-Вегасе во время финала чемпионата мира по футболу, которые демонс

26.07 / 13:14

бизнес технологии спорт конференция общество Специалисты «Сбер» и ЦСКА научили ИИ следить за футболистами по видео с одной камеры

Исследователи из Sber AI и ПФК ЦСКА создали технологию, позволяющую отслеживать действия каждого футболиста на протяжении всего матча с помощью видео только с одной камеры. Разработка делает профессиональную спортивную аналитику дешевле и доступнее для футбольных академий и любительских клубов. Научная статья была представлена на международной конференции CVPR 2026 в американском Денвере и вошла в число лучших работ в номинации Best Paper Award.

26.07 / 13:14

Реестр доменов .RU/.РФ перестал показывать инфу об администраторах-юрлицах

22 июля пользователь Хабра @ifap (то есть я) обнаружил, что в Реестре доменных имен .RU/.РФ перестали отображаться сведения об администраторах доменов – юридических лицах. Вместо наименования и ИНН юрлица отображается только «Организация» (хотя в случае с КДПЫ мы-то знаем, что это ФСО России).

26.07 / 13:13

Samsung технологии общество самит доллар Samsung заключила крупнейший контракт на выпуск ИИ-чипов: сделка с Broadcom оценивается в миллиарды долларов

По официальной информации Samsung, общая стоимость соглашения составляет около 200 млрд долларов. По актуальному курсу это эквивалентно примерно 8,3 трлн гривен. Контракт рассчитан до конца десятилетия и охватывает сразу несколько ключевых направлений полупроводниковой индустрии.

26.07 / 12:45

происшествия ЧП история общество космос ЧП на космодроме в Китае: молния поразила летящую ракету (ВИДЕО)

Специалисты подтвердили отсутствие повреждений на борту космического корабля. Электроника ракеты имеет надежную защиту от подобных природных явлений.

26.07 / 12:32

Huawei дети предприятия Freelander 8: Британский дух на китайских стероидах

Пока классические Land Rover пытаются найти свое место в электрическом будущем, совместное предприятие Chery-JLR решили не ждать милости от природы и представили Freelander 8. Это уже не тот «Фрил», которого мы помним по поездкам на дачу — теперь это огромный кроссовер с «гостиной аристократа» внутри и железом, которому позавидуют современные игровые ПК. Официальный релиз запланирован на август, но основные карты уже раскрыты.

Лента новостей

На главную страницу