Об этом же в других СМИ

habr.com / 1 год назад

Исследователи обнаружили, что больше не нужна тонна данных, чтобы обучить LLM выполнению логических задач

habr.com / 1 год назад

Исследователи обучают искусственный интеллект интерпретировать эмоции животных

forbes.ua / 1 год назад

«На уровне с OpenAI и лучше DeepSeek и Gemini». Исследователь искусственного интеллекта Андрей Карпаты протестировал обновленную языковую модель Grok Маска. Что она умеет

hitechexpert.top / 1 год назад

Исследователи обучают ИИ интерпретировать эмоции животных

cursorinfo.co.il / 1 год назад

История рифов в Эйлате переписана: израильские исследователи сделали неожиданное открытие

Больше по теме

31.01.2025 - 08:07 / habr.com

Исследователи из Unsloth сжали DeepSeek R1 на 80% от оригинального размера

Исследователи из компании Unsloth, которая специализируется на обучении и файнтюнинге языковых моделей, сжали нейросеть DeepSeek R1 на 80% от оригинального размера. В итоге языковая модель занимает 131 ГБ вместо 720 ГБ, а запускать её можно на более слабом железе. При этом производительность модели всё ещё остаётся на достаточно высоком уровне.

В своём проекте исследователи использовали китайскую большую языковую модель DeepSeek R1 с 671 млрд параметров. Её исходный размер составляет 720 ГБ, но её получилось сжать до 131 ГБ без значительной потери качества ответов.

Для этого инженеры использовали метод динамической квантизации (Dynamic Quantization). Веса высокопроизводительных слоёв нейросети оставили практически нетронутыми, а менее значимые веса, например экспертные блоки, сжали до 1,58 бита по методу от исследователей Microsoft. В итоге получилось, что примерно 12% весов работают так же, как и в исходной версии DeepSeek R1, а оставшиеся 88% весов значительно сжались.

Сжатую модель исследователи протестировали в сценарии разработки клона игры Flappy Bird. Нейросеть попросили создать проект по следующему техническому заданию:

Игра должна быть на основе библиотеки Pygame.

Фон может быть любого светлого цвета.

Нажатие на клавишу Пробел должно поднимать птицу выше.

Форма птицы может быть в виде любой фигуры, а цвет — тёмным.

Земля на экране должна быть тёмно-коричневого или жёлтого цвета.

В правом верхнем углу экрана следует добавить счёт игрока, который увеличивается на одно значение, если пользователь успешно преодолевает препятствие.

В случае проигрыша на экране должен появляться рекордный счёт. Нажатие на клавишу Q или Esc будет закрывать игру, а Пробел — перезапускать.

Для генерации использовали сиды 3407, 3408, 3409 и значение

Nvidia животный мир крипто daniilshat eps Microsoft

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

«Вспомнить всё»: исследователи предложили архитектуру языковых моделей с большой памятью habr.com / 1 год назад

Исследователи выпустили MedRAX — медицинского ИИ-агента для анализа рентгенограмм грудной клетки habr.com / 1 год назад

Исследователи Apple показали умную танцующую лампу в стиле Pixar habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

05.07 / 15:03

финансы общество творчество прогноз энергетика Нумерология на июль 2026 года — месяц решительных действий и роста

Нумерологический прогноз на июль 2026 года: энергия амбиций, финансовых рисков и успеха.

05.07 / 15:03

продукты здоровье общество еда организм Авокадо против миндаля – какой суперфуд полезнее для вашего сердца

Выбор между авокадо и миндалем зависит от ваших индивидуальных целей. Авокадо лучше подходит для контроля давления и общего качества питания.

05.07 / 15:03

деньги общество самолет доллар пилот Реальная зарплата пилота самолета удивила пользователей соцсетей

Случайная публикация финансового документа сорвала покровы с реальных заработков в авиационной сфере. Обнародованные суммы поразили пользователей.

05.07 / 14:32

промышленность общество Блокчейн инвестор google В NYLIM рассказали о следующем этапе развития токенизации

Компания New York Life Investment Management (NYLIM) заявила, что главный потенциал токенизации заключается не в круглосуточной торговле или более быстрых расчетах, а в создании персонализированных инвестиционных портфелей в промышленных масштабах. Об этом в интервью CoinDesk рассказал руководитель подразделения мультиактивных решений Томас Сай. По его мнению, именно блокчейн способен кардинально изменить подход к управлению активами и сделать индивидуальные инвестиционные стратегии доступными для широкого круга клиентов. Токенизация должна изменить принцип формирования портфелей Сай, команда которого управляет около $11 м

05.07 / 14:00

общество курьез возраст Дом и интерьер Жительнице дома престарелых грозит выселение по курьезной причине

Звезда соцсетей с 15-миллионной аудиторией порвала официальное предупреждение, заявив, что имеет право на алкоголь и сплетни. За нее вступилась Пэрис Хилтон.

05.07 / 13:41

происшествия здоровье общество рак врачи Безопасный дом – от чего стоит избавиться, чтобы снизить риск онкологи

Онколог предупреждает, что даже привычные предметы и повседневные бытовые привычки могут повышать риск развития онкологических заболеваний.

05.07 / 13:41

туризм продукты питания общество самит еда Шеф-повар раскрыл главный обман об итальянской пицце

По мнению эксперта, за эталонным тестом и начинкой следует отправляться исключительно в один город. Там даже самые дешевые кафе держат марку.

05.07 / 13:26

технологии происшествия экономика общество самит Сооснователь Perplexity объяснил угрозу концентрации власти в ИИ и предложил решение остановить монополию

Сооснователь Perplexity Энди Конвински опубликовал эссе, в котором призвал не допустить концентрации власти в сфере искусственного интеллекта в руках нескольких частных компаний. По его мнению, это представляет не меньшую угрозу, чем возможное злоупотребление самими ИИ-моделями. В качестве альтернативы он предложил создать открытый исследовательский центр, который объединит университеты, бизнес и государство для развития передовых ИИ-технологий. «Концентрация власти — это риск, а не решение» Конвински признал, что развитие мощных моделей ИИ сопровождае

05.07 / 13:16

Boeing «Роскосмос» и НАСА определили стратегию безопасного сведения МКС с орбиты

«Роскосмос» и НАСА определили стратегию управляемого и безопасного сведения Международной космической станции (МКС) с орбиты. Об этом говорится в отчёте РКК «Энергия» (входит в структуру «Роскосмоса») за 2025 год.

05.07 / 13:14

технологии здоровье Casio представила спортивные часы G-LIDE GBX-H5600KI-5: пульсометр, функции для серферов и солнечная зарядка

Несмотря на классический дизайн G-Shock, GBX-H5600KI-5 представляет собой полноценный фитнес-трекер с расширенными возможностями мониторинга здоровья.

Лента новостей

На главную страницу