Об этом же в других СМИ

habr.com / 1 год назад

Разработчик выпустил Mystical — инструмент, который визуализирует код на PostScript в виде магических манускриптов

habr.com / 1 год назад

Нейросетевой ассистент от JetBrains стал доступен в виде плагина для VS Code

habr.com / 1 год назад

«Яндекс» анонсировал Young Con 2025 — фестиваль для тех, кто хочет развивать карьеру в IT

habr.com / 1 год назад

Notion представила набор нейросетевых функций для работы с документами, текстом и поиском

habr.com / 1 год назад

Обновление Raspberry Pi OS: экран блокировки, приложение для принтеров и управление параметрами сенсорных дисплеев

Больше по теме

06.05.2025 - 04:00 / habr.com

JetBrains открыла код Mellum — компактной языковой модели для завершения кода

В блоге JetBrains рассказали о релизе Mellum — компактной языковой модели для завершения кода. Нейросеть не может генерировать код с нуля, но отлично подходит для инструментов, которые помогают его дописывать. У модели всего 4 млрд параметров, поэтому её без проблем можно запустить локально или развернуть на личном сервере.

Mellum поддерживает завершение кода для языков программирования Java, Kotlin, Python, Go, PHP, C, C++, C#, JavaScript, TypeScript, CSS, HTML, Rust и Ruby. У модели относительно небольшое контекстное окно в 8 тыс. токенов. В компании отмечают, что этого достаточно для дополнения кода.

На Hugging Face инженеры опубликовали базовую модель и дообученную на Python-коде. В компании предлагают использовать нейросети так:

Запускать в облаке с помощью vLLM, и использовать инференс модели в любых приложениях.

Запускать локально с помощью llama.cpp или Ollama, что полезно для проектов с конфиденциальной кодовой базой.

Интегрировать в редакторы кода и среды разработки.

При этом в компании понимают, что мало кто из разработчиков будет использовать Mellum в рабочих задачах. Для этих целей есть более сообразительные модели, которые доступны во всех современных IDE. Нейросеть будет больше полезна исследователям и преподавателям. Например, Mellum может стать практическим пособием по файн-тюнингу базовых языковых моделей.

Модель обучили приблизительно на 4,2 трлн токенов. В качестве датасета использовали данные:

The Stack;

The Stack v2;

StarCoder Training Dataset;

CommitPack;

Англоязычной «Википедии».

В качестве аппаратной платформы использовали кластер из 256 графических ускорителей Nvidia H200, соединённых с помощью коммутаторов InfiniBand. На обучение ушло 20 дней.

Mellum сравнили с более крупными языковыми моделями в бенчмарках

Nvidia крипто daniilshat

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Среда разработки CLion стала бесплатной для некоммерческого использования habr.com / 1 год назад

Apple представила Matrix3D — нейросеть для фотограмметрии habr.com / 1 год назад

Microsoft выпустила Phi-4 — семейство компактных рассуждающих языковых моделей с открытым исходным кодом habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

26.07 / 05:30

происшествия наука история захоронения В Словакии обнаружили римский лагерь с останками солдат (фото)

На юго-западе Словакии археологи обнаружили обширный римский военный лагерь, который, вероятно, использовался легионами императора Марка Аврелия во время Маркоманских войн в конце II века нашей эры. Особое внимание исследователей привлекли многочисленные поспешные захоронения военных, найденные во рвах, колодцах и неглубоких могилах.

26.07 / 05:00

продукты технологии курс «Яндекс» запустил бесплатный онлайн-курс по работе с ИИ для волонтёров и сотрудников НКО

«Яндекс» при поддержке образовательного проекта To Dual запустил бесплатный онлайн‑курс по работе с ИИ для волонтёров и сотрудников НКО. В нём рассказывают, какие задачи фонды могут поручить нейросетям и как эффективно применять инструменты на базе ИИ — от чата с «Алисой AI» до ИИ‑агентов, отвечающих на типовые вопросы пользователей. Эти знания помогут НКО автоматизировать рутинные процессы и уделять больше времени благополучателям, считают в компании. Курс доступен на «Яндекс Практикуме», его можно пройти в любое время и в любом темпе.

26.07 / 05:00

люди экономика общество google Глава Google DeepMind: ИИ не отменяет необходимость технического образования — наоборот, оно становится ещё ценнее

Генеральный директор Google DeepMind Демис Хассабис считает, что стремительное развитие ИИ меняет правила в IT‑индустрии, но не делает фундаментальное техническое образование менее важным. Напротив, специалисты с глубокими знаниями в области информатики и инженерии смогут использовать ИИ‑инструменты значительно эффективнее остальных, считает управленец, слова которого приводит Business Insider.

26.07 / 04:47

продукты здоровье продукты питания Здоровье и красота полезные продукты Виноград для здоровья – причины добавить ягоду в рацион

Чтобы получить максимум пользы без резких скачков сахара в крови, сочетайте виноград с источниками белков или жиров.

26.07 / 04:11

связь технологии токен Nano Arduino представила модули Modulino для расширения I²C-сетей и управления моторами

Arduino расширила линейку компактных модулей Modulino тремя платами: Hub, Extender и Motors. Они предназначены для прототипирования роботов, систем автоматизации и распределённых сетей датчиков.

26.07 / 03:29

ученые космос звезда Земля Континенты на Земле появились благодаря Млечному Пути - исследование

Ученые выяснили, как структура Млечного Пути помогла сформировать континенты на Земле в их сегодняшнем виде.

26.07 / 03:04

закон искусственный интеллект история общество евро Как ChatGPT спас мужчину от штрафа: история успеха в суде Лейпцига

Оставшись без бесплатного государственного адвоката, житель Лейпцига успешно защитил себя в суде с помощью ChatGPT.

26.07 / 02:32

ученые животные история самит Знаменитости Ни одной кости – раскрыт секрет скелета акул

Скелет акулы полностью состоит из прочного хряща, помогающего им плавать без плавательного пузыря.

25.07 / 23:27

технологии происшествия смартфон самит гаджет Батарея смартфона быстро умирает из-за опасной ошибки пользователей

Одна распространенная ошибка сокращает срок службы батареи значительно быстрее, чем использование телефона во время зарядки.

25.07 / 22:55

продукты общество Здоровье и красота питание болезнь Как защититься от камней в почках - советы врачей

Профилактика является лучшим методом борьбы с камнями в почках, говорят специалисты.

Лента новостей

На главную страницу