Об этом же в других СМИ

habr.com / 1 год назад

Alibaba представила открытую ИИ-модель QwQ-32B-Preview

habr.com / 1 год назад

Вышла OminiControl — нейросеть для перемещения объектов с одного изображения на другое

habr.com / 1 год назад

Вышла превью-версия Xogot — редактора Godot для iPadOS

gagadget.com / 1 год назад

В Gray Zone Warfare появились ночные операции и новое оружие: для реалистичного шутера вышло первое крупное обновление

habr.com / 1 год назад

Apple разрабатывает большую языковую модель для Siri

Больше по теме

14.11.2024 - 20:44 / habr.com

Вышла Qwen2.5-Coder 32B. Открытая локальная модель для кода небольшого размера конкурирующая с GPT-4o

После выхода Qwen2.5, которая подняла LLM небольших размеров на новый уровень, так как при размере всего 72B и, особенно, 32B - она показывала очень хорошие качество размышления и следования инструкциям, все начали с нетерпением ждать выхода Coder 32B модели, так как ожидали от неё уровня близкого к GPT-4o.

И вот, наконец-то, Qwen представила эту коллекцию моделей для кода размерами: 0.5B, 1.5B, 3B, 7B, 14B и 32B. Размер контекста 128k, лицензия Apache 2.0 (кроме модели 3B).

До текущего момента самой популярной локальной моделью для программирования была Codestral 22b, новая же модель в бенчмарке McEval на 40 языках программирования показывает результаты лучше чем она, и по некоторым языкам обгоняет GPT-4o.

Падение качества от модели к модели с уменьшением размера B можно оценить из этой таблицы. B - показатель в млрд количества параметров у модели.

В бенчмарке Aider 32B показывает себя хорошо, также на уровне GPT-4o, набирая 73.7%. Более легковесная 14B выдает результат 69.2%, в то время как Codestal 22B всего 51.1%.

Главное отличие Code моделей об обычных в том, что такие модели обучались с FIM (Fill in the Middle) - специальное обучение сосредоточенное на дополнение кода, поэтому такие модели лучше справляются с autocomplete.

Для моделей 14B и 32B доступен размер контекста в 128k при использовании не gguf моделей, для gguf размер будет 32k.

Для запуска 32B модели в формате gguf с квантованием Q4_K_M потребуется около 18гб vram для модели и еще 8гб для контекста в 32k. Снизить это требование можно включив квантование кэша контекста: cache_8bit, тогда потребуется 4гб, или cache_4bit, тогда 2гб, но немного снизится качество, для сложного кода это может быть заметно. Модель на 14B работает с приемлемой скоростью на CPU only, на

закон общество самит Apache

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Для Arma 3 вышло дополнение Expeditionary Forces, которое посвящено морской пехоте и сражениям на воде gagadget.com / 1 год назад

Вышло обновление для редактора маинд карт MIND IN MAP от 18.11.2024 habr.com / 1 год назад

В США машины для голосования вышли из строя zakon.kz / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

18.07 / 19:12

технологии СМИ самит фейки мода и стиль HMD готовит сразу несколько новых смартфонов: подтверждены Fusion 2 и XR22, а часть громких утечек оказалась фейком

Компания HMD Global, выпускающая смартфоны под собственным брендом HMD и ранее занимавшаяся производством устройств Nokia, продолжает развивать сразу несколько новых проектов. Согласно свежей информации от авторитетного инсайдера @smashx_60, который ссылается на источники внутри компании, разработка модульного смартфона HMD Fusion 2 не только не отменена, но и активно продолжается. Одновременно подтверждается работа над защищенным HMD XR22, тогда как часть недавно появившихся концептов серии Skyline названа недостоверной.

18.07 / 18:52

погода медицина общество отдых жара Почему нельзя принимать холодный душ перед сном в жару

Холодный душ перед сном в жаркую погоду может не освежить, а наоборот усложнить засыпание, предупредила врач.

18.07 / 18:35

технологии спорт Nvidia семья AMD Семь голов лучше одной: как Bosgame превращает мини-ПК в ИИ-монстра

Запуск больших языковых моделей (LLM) обычно требует либо бездонного кошелька для оплаты облачных сервисов, либо серверной комнаты, которая потребляет энергию как небольшой городок. Однако компания Bosgame решила пойти другим путём, продемонстрировав, что для локальной работы с DeepSeek-V3.1 — монстром на 671 миллиард параметров — совсем не обязательно покупать стойку с Nvidia H100.

18.07 / 18:11

продукты связь технологии Путешествия общество Новая утечка раскрыла Nokia 300 4G Power Bank: кнопочный телефон сможет работать до 44 дней и заряжать другие устройства

Информация появилась благодаря известному инсайдеру Smashx_60. На данный момент HMD Global официально не представила устройство, поэтому все опубликованные характеристики следует рассматривать как утечку. Тем не менее источник неоднократно публиковал достоверные сведения о будущих продуктах компании.

18.07 / 18:03

продукты здоровье алкоголь общество самит Как долго алкоголь остается в организме, рассказали врачи

Алкоголь быстро всасывается в кровь после употребления, но значительно дольше выводится из организма, предупреждают врачи.

18.07 / 18:03

связь общество самит отношения знаки зодиака Мужчины каких знаков Зодиака реже всего разводятся

Представители некоторых знаков отдают избранницам свое сердце раз и навсегда, говорят астрологи.

18.07 / 17:54

люди экономика банк самит инвестор DeepSeek готовится к IPO: оценка компании выросла до $71 млрд

По данным Bloomberg, DeepSeek начал подготовку к первичному размещению акций и может подать заявку уже в конце этого года.

18.07 / 17:10

технологии Huawei деньги общество дети и родители Haval H10: гигантский гибрид с лидаром, который пытается спасти продажи GWM

Бренд Haval сейчас находится в ситуации, когда старые заслуги уже не помогают, а конкуренты давят со всех сторон. В июне 2026 года продажи марки в Китае рухнули на 41.3%, что заставило материнскую компанию Great Wall Motor (GWM) действовать решительно. Результатом стал выход на предпродажу нового флагмана — Haval H10. Это большой, квадратный и неожиданно технологичный кроссовер, который пытается доказать, что Haval еще может удивлять чем-то, кроме бюджетных ценников.

18.07 / 17:10

YouTube самит Знаменитости tiktok TikTok против дипфейков: платформа тестирует новую функцию добровольной проверки неправомерного использования внешности контентмейкеров

Платформа TikTok начала тестирование новой функции, которая призвана помочь создателям контента бороться с несанкционированным использованием их внешности в AI-генерациях. Тестирование опционального инструмента защиты цифрового облика среди ограниченного круга американских авторов первым заметил консультант по социальным медиа Мэтт Наварра (Matt Navarra), после чего информацию подтвердил представитель TikTok Закари Кизер (Zachary Kizer).

18.07 / 17:10

Tencent Мобильные игры Final Fantasy XIV Mobile закрывается: некогда амбициозная игра так и не доберется до глобального релиза

Square Enix объявила о неожиданном изменении своих планов.

Лента новостей

На главную страницу