Об этом же в других СМИ

habr.com / 1 месяц назад

NVIDIA ускорила языковую модель в 4 раза: вышла Nemotron-Labs Diffusion

habr.com / 1 месяц назад

ИИ собрал рабочую ОС за 12 часов: представлена Gemini 3.5 Flash

gagadget.com / 2 месяца назад

Новый флагман Razer: представлена обновленная серия ноутбуков Blade 18 — топовая модель получила RTX 5090, 2 Тб SSD и Core Ultra 9

habr.com / 2 месяца назад

Вебинар «GPU из облака, или Как развернуть ИИ-модель за 30 минут»

incrypted.com / 2 месяца назад

ИИ-модель Claude от Anthropic научат предсказывать потребности людей

Больше по теме

09.05.2026 - 03:49 / habr.com

Представлена языковая модель с линейной сложностью вычислений и контекстом до 12 млн токенов

Кратко: стартап Subquadratic представил SubQ 1M-Preview — первую языковую модель с линейной сложностью вычислений относительно длины контекста. Заявлены контекст до 12 млн токенов, скорость в 52 раза выше FlashAttention и радикальное снижение стоимости. Независимых тестов пока нет (хотя стартап заявляет о сторонней верификации своих бенчмарков), доступ закрыт. Техническое сообщество реагирует сдержанно: пока это амбициозный пресс-релиз, а не готовый инструмент.

Архитектура SubQ обеспечивает линейный рост затрат, что снижает нагрузку на GPU почти в 1000 раз на длинных контекстах по сравнению с классическими трансформерами. Источник: subq.ai

Главная архитектурная боль современных языковых моделей — квадратичная сложность механизма внимания. С ростом длины контекста вычислительные затраты и потребление памяти увеличиваются непропорционально быстро. Индустрия годами обходила ограничение «костылями»: поиск с дополненной генерацией (RAG), разбиение текста на фрагменты, векторные хранилища. Инженеры тратят много времени на обход ограничений современных LLM: ограниченный контекст, галлюцинации и дороговизна обработки длинных запросов.

Стартап Subquadratic утверждает, что сломал этот барьер. Их архитектура обеспечивает линейный рост вычислений относительно длины контекста. Звучит как мечта, но техническое сообщество пока держит паузу.

Линейное масштабирование: Сложность вместо . Обработка миллионов токенов без взрывного роста затрат.

Контекст до 12 млн токенов: Флагманские модели обычно деградируют задолго до заявленных 1–2 млн. SubQ обещает стабильную точность на всём объёме.

Скорость и эффективность: Механизм SubQ Sparse Attention работает в 52 раза быстрее FlashAttention и требует на 63% меньше вычислительных ресурсов.

Точность:

продукты экономика стартап крипто ARad

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Поддельная модель OpenAI воровала пароли, крипту и сессии Discord habr.com / 2 месяца назад

Представлена игровая мышка Mionix из карбона habr.com / 2 месяца назад

OpenAI представила первую голосовую модель с интеллектом GPT-5 habr.com / 2 месяца назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

16.07 / 03:26

происшествия ученые автомобиль мода и стиль Как быстро выехать из пробки на авто - ответ ученых удивит

Исследователи назвали эффективный способ, благодаря которому можно быстро покинуть пробку без агрессивного вождения автомобиля.

16.07 / 03:26

люди здоровье общество банк болезнь Какое количество кофе может повысить риск сердечного приступа

В больших количествах кофеин создает нагрузку на сердце и может навредить сосудам.

16.07 / 03:20

Facebook технологии Apple общество reddit Владельцы iPhone пожаловались на проблемы с автономностью и перегревом устройств после установки обновления iOS 26.5.2

Владельцы iPhone столкнулись с быстрой разрядкой аккумулятора и перегревом устройств после установки обновления iOS 26.5.2. Apple выпустила 29 июня 2026 года апдейт, который исправил более 25 уязвимостей, в том числе в ядре и других важных областях операционной системы, связанных с открытым браузерным движком WebKit.

16.07 / 01:17

происшествия люди ученые наука общество Сколько людей на самом деле может прокормить Земля – ученые

Эксперты заявили о начале опасной фазы для всего человечества. Ресурсы планеты больше не могут покрывать нужды растущего населения Земли.

16.07 / 00:45

Apple Nvidia самит google Broadcom Apple ведет переговоры о приобретении производителей чипов для искусственного интеллекта

Apple рассматривает возможность приобретения компаний, занимающихся разработкой полупроводников для искусственного интеллекта. По данным The Information, компания уже ведет переговоры с производителями чипов и финансовыми консультантами о возможных сделках.

16.07 / 00:45

Facebook Samsung технологии LinkedIn Amazon Amazon Music станет стандартным приложением на новых устройствах Samsung Galaxy: что изменится для пользователей

Компания Samsung объявила о расширении списка приложений, которые будут предварительно установлены на смартфонах и планшетах Galaxy. В скором времени к нему присоединится сервис Amazon Music, который автоматически появится на новых устройствах производителя.

16.07 / 00:42

связь медицина люди здоровье общество Все начинается со стула: одна распространенная привычка приближает рак

Новое масштабное исследование с участием почти 100 тысяч человек подтвердило связь между непрерывным сидячим образом жизни и риском развития рака.

15.07 / 23:46

технологии смартфон самит гаджет Почему смартфон заряжается медленно: дело может быть не в кабеле

При покупке кабеля для смартфона специалисты советуют учитывать не только его длину, но и качество изготовления.

15.07 / 22:13

экономика общество семья самит психология Простая вещь, которую мужчины не могут понять о зрелых женщинах

Писательница Ким Петерсен объяснила, почему кризис среднего возраста у женщин — это не капризы или менопауза, а глубокая перестройка всей жизни.

15.07 / 22:10

Samsung технологии здоровье история общество В сеть утекли официальные изображения всех новинок Samsung перед Galaxy Unpacked

Если информация подтвердится, уже 22 июля на мероприятии в Лондоне компания представит сразу несколько флагманских устройств нового поколения: Galaxy Z Fold8, Galaxy Z Fold8 Ultra, Galaxy Z Flip8, Galaxy Watch9 и Galaxy Watch Ultra 2. На данный момент речь идет об утечке, однако опубликованные изображения выглядят как официальные маркетинговые рендеры и совпадают с более ранними инсайдерскими данными.

Лента новостей

На главную страницу