Об этом же в других СМИ

habr.com / 9 месяцев назад

Google DeepMind представила ИИ, который помогает математикам открывать новые теоремы

habr.com / 9 месяцев назад

Сбербанк выложил новые модели для RAG и генерации видео

habr.com / 9 месяцев назад

InternLM представила модели CapRL-3B и CapRL-Eval-3B для генерации текста к изображениям

habr.com / 9 месяцев назад

Не всё золото, что AI: ожидания VC растут быстрее, чем возможности рынка

habr.com / 9 месяцев назад

Google запустил подписку на AI за 5 долларов в 40 странах

Больше по теме

16.09.2025 - 14:15 / habr.com

Google нашла способ сделать большие языковые модели быстрее и дешевле без потери качества

Google Research анонсировала технологию Speculative Cascades — гибридный подход, который объединяет сразу два проверенных метода ускорения генерации текста и меняет правила игры на рынке LLM. Этот способ позволяет делать работу нейросетей быстрее и дешевле, не жертвуя качеством ответа, а в некоторых случаях даже улучшая его.

Большие языковые модели сегодня лежат в основе чат-ботов, поисковых систем и интеллектуальных ассистентов. Но их главный минус — это огромные затраты вычислительных ресурсов, что напрямую влияет на стоимость и скорость. Для массового внедрения таких систем нужно найти баланс. С одной стороны — быстрые ответы и низкие затраты, а с другой — точность и надёжность.

До сих пор применялись два подхода. Первый — каскады. Маленькая модель пытается ответить сама, а если задача оказывается слишком сложной, её подхватывает большая. Экономия есть, но качество сильно колеблется от запроса к запросу. Второй способ — спекулятивная декодировка. Здесь маленькая модель предсказывает сразу несколько слов, а большая быстро проверяет и подтверждает результат. Это ускоряет генерацию, но нагрузка на крупную модель остаётся высокой.

В Speculative Cascades оба подхода объединены. Иногда маленькая модель полностью справляется с запросом сама. Иногда она используется как ускоритель, выдавая черновой вариант, который большая модель быстро проверяет. В итоге ресурсы расходуются эффективнее, скорость повышается, а итоговое качество остаётся на уровне крупных LLM.

Тесты на моделях Gemma и T5 показали впечатляющие результаты. Новый метод оказался быстрее спекулятивной декодировки, дешевле и надёжнее каскадов. Особенно сильный прирост наблюдается в задачах математического рассуждения: там Speculative Cascades не только ускорил

бизнес продукты технологии экономика самит google gemini cognitronn

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Google Research предлагает новый подход к временным рядам habr.com / 9 месяцев назад

DeepSeek анонсировал новую версию своей модели — V3.1-Terminus habr.com / 9 месяцев назад

DeepSeek обошёл OpenAI и Google: компания влила в R1 294 тысячи долларов habr.com / 9 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

09.07 / 07:38

продукты продукты питания еда овощи химикаты Замачивание овощей в соде – ученые объяснили пользу и вред метода

Добавление соды в воду помогает эффективнее очищать кожуру от поверхностных загрязнений. Специалисты объяснили, как правильно проводить эту процедуру дома.

09.07 / 07:33

экономика ликвидация курс Блокчейн криптовалюта BNB Chain анонсировала L1-блокчейн нового поколения для агентной торговли с запуском в 2027 году

Сеть BNB Chain представила техническую дорожную карту на вторую половину 2026 года, в которой раскрыла детали нового блокчейна первого уровня, ориентированного на агентную торговлю и инфраструктуру для автономных ИИ-агентов. Тестовую сеть планируют запустить в конце 2026 года, а мейннет — в начале 2027-го. Проект должен стать отдельной сетью рядом с действующим стеком BNB Chain и призван обеспечить скорость выполнения операций, близкую к централизованным биржам, сохраняя при этом преимущества ончейн-расчетов и самостоятельного хранения активов. Новый L1-блокчейн для агентной торговли По слов

09.07 / 07:33

технологии экономика прогноз криптовалюта стартап Paradigm привлекла $1,2 млрд в новый фонд для инвестиций в криптовалюты, ИИ и робототехнику

Венчурная компания Paradigm объявила о запуске своего четвертого фонда объемом $1,2 млрд. Средства планируют направить на поддержку стартапов, работающих в сферах криптовалют, искусственного интеллекта, робототехники и других передовых технологий. В компании напомнили, что Paradigm была основана в 2018 году с идеей объединить инвестирование с практическим участием в развитии технологий. По словам представителей фонда, команда не только инвестирует, но и занимается исследованиями и разработкой вместе с основателями проектов. Фонд продолжит инвестировать в криптоиндустрию В Paradigm заявили, что и дальше будут по

09.07 / 07:33

продукты технологии семья самит google DeFi-проект Zapper прекратит работу с августа

DeFi-платформа Zapper объявила о полном прекращении работы после почти семи лет развития. Все продукты Zapper, включая веб-платформу, мобильные приложения и API, прекратят работу 3 августа 2026 года. Zapper основали как личный инструмент для отслеживания DeFi-портфеля, который со временем превратился в один из самых известных ончейн-агрегаторов. По словам Оде, на пике развития платформа: обслуживала более 2

09.07 / 07:20

погода смартфоны самит аксессуары Транспорт Активное охлаждение AIRA One для мотошлемов

AIRA One — это система активного охлаждения для шлемов, созданная для решения проблемы перегрева во время поездок в жаркую погоду или при низкой скорости движения.

09.07 / 07:17

технологии Apple самит iPhone Ultra выйдет без задержек: инсайдеры раскрыли новые подробности о первом складном смартфоне Apple

По данным источников, знакомых с цепочкой поставок Apple, компания не меняла график выпуска своего первого складного смартфона. Собеседники утверждают, что не слышали ни о каких задержках разработки или производства.

09.07 / 06:54

происшествия Путешествия наука золото самит Обломки затонувшего корабля с золотыми монетами наконец опознали. На это ушло 30 лет

В 1995 году в водах залива у южного побережья Англии было обнаружено затонувшее судно с грузом, в который входило более 400 золотых монет. «Невероятная находка» положила начало 30-летней миссии по идентификации корабля — недавно она наконец завершилась. Об этом пишут в Science Alert.

09.07 / 06:52

Amazon профессор лечение биологи лекарства Anthropic решила заняться разработкой собственных лекарств

Anthropic провела мероприятие «The Briefing: AI for Science», где анонсировала Claude Science — «AI-рабочую среду для учёных», которая собирает разрозненные инструменты и наборы данных в одном интерфейсе и умеет генерировать графики и визуализации. Но главная новость не в этом. Компания заявила, что пойдёт дальше продажи инструментов другим биотехам и фармгигантам, и начнёт разрабатывать собственные лекарства.

09.07 / 06:52

технологии общество политика Минцифры представило приложение «Госкан» для быстрой проверки данных по QR-коду

Минцифры РФ сообщило о выпуске мобильного приложения «Госкан» для быстрой проверки данных по QR-коду. Решение помогает сотрудникам организаций и ИП проверять данные по QR‑коду из приложений «Госуслуги» и «Госуслуги Авто», а также в Цифровом ID в МAX. В ведомстве заверили, что данные граждан не сохраняются на устройстве сотрудников компаний при задействовании «Госкан» и иметь к ним доступ никто после проверки не будет.

09.07 / 06:35

общество евро фильм кинотеатр Дом и интерьер Один из известнейших кинотеатров устроил распродажу мебели

Необычный аукцион для любителей кинематографа начинается уже в этот четверг. Купить историческую мебель можно будет по очень доступным ценам.

Лента новостей

На главную страницу