Об этом же в других СМИ

habr.com / 1 год назад

Новый тест HLE выявил слабые места AI: 90% задач остаются нерешенными

habr.com / 1 год назад

Исследователи MIT и Google повышают качество AI-генерируемых изображений без переобучения

habr.com / 1 год назад

Perplexity запускает помощника для Android

habr.com / 1 год назад

JetBrains запускает Junie — новый агент кодирования AI для своих IDE

habr.com / 1 год назад

Gemini 2.0 Flash Thinking: самая маленькая модель Google лидирует на Chatbot Arena

Больше по теме

10.01.2025 - 09:11 / habr.com

Google запускает SALT: Новый способ ускоренного обучения больших моделей AI с помощью малых

Исследователи из Google разработали метод, позволяющий создавать языковые модели AI, которые одновременно быстрее и лучше, используя необычный подход: предоставляя меньшим моделям обучение для больших.

Совместная команда из Google Research и DeepMind разработала метод обучения под названием SALT (Small model aided large model training), который сокращает время обучения до 28 процентов и одновременно улучшает производительность. Так в чем ключевая инновация? Использование меньших языковых моделей в качестве помощников-преподавателей.

Процесс происходит в два этапа. Сначала большая модель обучается у меньшей модели через процесс, называемый дистилляцией знаний, при котором одна AI-модель обучает другую, предоставляя как свои ответы, так и уверенность в этих ответах. Обычно дистилляция знаний предполагает, что большие модели обучают меньшие, но команда Google обнаружила, что этот процесс может работать и наоборот — по крайней мере, на определённых этапах обучения. На втором этапе большая модель переходит к обычным методам обучения.

Меньшая модель особенно полезна в тех областях, где она уже делает надёжные прогнозы. Для этих более простых задач большая модель обучается быстрее и надёжнее, прежде чем перейти к традиционному обучению для более сложных задач.

SALT может сделать обучение моделей AI более доступным Команда протестировала SALT, используя модель с 1,5 миллиардами параметров для обучения модели с 2,8 миллиардами параметров. Результаты были впечатляющими: большая модель достигла своих целевых показателей производительности всего за 70 процентов обычного времени обучения, а затем продемонстрировала лучшие результаты на различных тестах.

Улучшения особенно проявились после дообучения для конкретных задач. Для

общество прогноз самит google dilnaz04

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Новая модель искусственного интеллекта «Тitans» от Google обеспечивает долговременную память языковых моделей habr.com / 1 год назад

Синтез программ глубокого обучения от Ndea направлен на создание AI, который учится как человек habr.com / 1 год назад

Google заключает сделку с Associated Press, чтобы предоставить Gemini больше информации в режиме реального времени habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

24.07 / 11:17

бизнес Samsung технологии евро самит Samsung может вложить миллиарды в одного из лидеров европейского ИИ: Mistral готовится к новому этапу роста

Если сделка состоится, оценка Mistral AI достигнет около 20 млрд евро, что эквивалентно примерно 980 млрд грн. Это позволит компании войти в число самых дорогих разработчиков ИИ за пределами США и укрепит ее позиции в качестве одного из главных европейских конкурентов OpenAI, Anthropic и других лидеров отрасли.

24.07 / 11:11

золото животный мир Представлен почти невидимый микродрон Phantom Twist

Инженеры Северо-Западного университета создали дрон Phantom Twist, который почти незаметен человеческому глазу за счёт быстрого вращения.

24.07 / 11:11

технологии происшествия общество самит расследование За атакой на Hugging Face стояла GPT-5.6 Sol и предрелизная LLM от OpenAI

Да, теми самыми злостными хакерами оказались OpenAI. Ну почти. Компания раскрыла подробности инцидента, о котором ранее сообщила Hugging Face. Они подтвердили, что за атакой на инфраструктуру платформы стояли две модели OpenAI — публичная GPT-5.6 Sol и более мощная предрелизная модель, проходившие внутреннее тестирование на кибербезопасность.

24.07 / 11:11

технологии общество прогноз Хакеры применили исправленные ошибки WordPress для взлома веб-сайтов

По данным нескольких компаний, занимающихся кибербезопасностью, хакеры взламывают веб-сайты, работающие на уязвимых версиях WordPress. Число таких ресурсов достигло десятков миллионов.

24.07 / 11:11

СМИ закон общество Booking книги ИИ-компании начали скупать старые книги из-за нейрослопа в сети

Компания ISBNdb объявила о создании «крупнейшей в мире базы данных книг» и предлагает услуги по закупке больших объёмов печатной продукции для компаний, занимающихся ИИ. Это позволит разработчикам избежать обучения искусственного интеллекта на нейрослопе, объясняют авторы проекта.

24.07 / 11:11

технологии общество Enterprise Canonical запустила корпоративный магазин для Ubuntu Pro

Canonical представила новый способ управления программным обеспечением за брандмауэрами и в изолированных от сети средах — Enterprise Store. Доступный по подписке Ubuntu Pro, он соблюдает протоколы безопасности строгих сред, обеспечивая контролируемость, возможность аудита и предсказуемость.

24.07 / 11:06

ученые наука NASA космос климат Хокинг был прав: NASA предупреждает о скором конце света

Глобальное потепление и парниковый эффект разрушают экологию Земли. Хокинг видел в этих процессах главную причину возможного конца света.

24.07 / 10:41

технологии книги Вышел открытый проект NeeView 46.0 — просмотрщик изображений и видео для Windows

Во второй половине июля 2026 года состоялся релиз открытого проекта NeeView 46.0. Это бесплатный просмотрщик изображений и видео для Windows 10/11, предлагающий интерфейс просмотра в стиле книги. Решение разработано для пользователей, которые часто просматривают изображения, комиксы, электронные книги или видео. Исходный код проекта написан на C# и опубликован на GitHub под лицензией MIT. Это решение находится в разработке с 2016 года. Выпуск NeeView 44 с поддержкой русского языка случился в середине августа 2025 года. Сборка NeeView 45 вышла в феврале 2026 года.

24.07 / 10:41

технологии дети криминал общество политика Минцифры представило доктрину по борьбе с ИТ-преступлениями

Минцифры РФ представило «Доктрину развития системы противодействия правонарушениям, совершаемым с использованием информационно‑коммуникационных технологий». Документ опубликован для общественного обсуждения.

24.07 / 10:37

технологии самит доллар tiktok мода и стиль HMD Touch AI: Ностальгия по Lumia и китайский ИИ в корпусе за 70 долларов

Компания HMD (Human Mobile Devices) продолжает свои странные, но по-своему захватывающие эксперименты в области некромантии мобильного дизайна. На этот раз под нож (или под кисть) попал легендарный стиль Nokia Lumia. Новое устройство под названием HMD Touch AI выглядит так, словно оно только что выпало из кармана хипстера из 2012 года, но внутри у него «мозги» от создателей TikTok. Это попытка скрестить минимализм прошлого десятилетия с агрессивным маркетингом нейросетей.

Лента новостей

На главную страницу