Об этом же в других СМИ

habr.com / 11 месяцев назад

ByteDance разогнала языковую модель в 5.4 раза с помощью дискретной диффузии

habr.com / 11 месяцев назад

Skild Brain: единая модель для управления любыми роботами

habr.com / 11 месяцев назад

Mistral AI публикует первую комплексную оценку жизненного цикла большой языковой модели

habr.com / 11 месяцев назад

Компания Tencent выпустила открытую 3D-модель HunyuanWorld-1.0

habr.com / 11 месяцев назад

Yandex B2B Tech открыла доступ к крупнейшей языковой модели Qwen3

Больше по теме

23.07.2025 - 10:44 / habr.com

FlexOlmo позволяет организациям совместно обучать языковые модели без обмена данными

FlexOlmo, разработанный в Институте искусственного интеллекта Аллена, демонстрирует возможность совместной работы организаций над языковыми моделями на основе локальных наборов данных без передачи конфиденциальных данных.

FlexOlmo основан на архитектуре Mixture-of-Experts (MoE), где каждый эксперт соответствует модулю прямой передачи (FFN), обученному независимо. Фиксированная общедоступная модель (обозначается как Mpub) служит общим якорем. Каждый владелец данных обучает эксперта Mi на своём частном наборе данных D_i, в то время как все слои внимания и другие параметры, не относящиеся к экспертам, остаются замороженными.

Основная проблема, связанная с независимыми экспертами, — это координация. FlexOlmo решает эту проблему, используя замороженную общедоступную модель в качестве эталона. Общедоступный эксперт не меняется в процессе обучения, в то время как новые эксперты обучаются на локальных данных. Таким образом, все эксперты соответствуют одной и той же эталонной модели и могут быть объединены без дополнительного переобучения.

FlexOlmo хорошо подходит для случаев, когда необходимо строго контролировать доступ к данным. Источники данных можно активировать или деактивировать в зависимости от приложения. Например, токсичный контент может быть включен для исследования, но исключен из общего доступа.

Исследователи продемонстрировали это, удалив эксперта по новостям в ходе тестового запуска. Как и ожидалось, производительность при выполнении задач, связанных с новостями, снизилась, но результаты в других областях остались стабильными.

Даже если лицензии изменятся или истечёт срок действия прав на использование, источники данных можно будет деактивировать без переобучения всей модели. В итоговой модели 37 миллиардов параметров,

связь технологии общество семья крипто mefdayy

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Hierarchical Reasoning Model: иерархическая модель рассуждений, имитирующая работу мозга человека habr.com / 11 месяцев назад

Qwen3-MT — Alibaba выпускает еще одну модель для машинного перевода habr.com / 11 месяцев назад

Alibaba выпустила «самую мощную» ИИ-модель для программирования — Qwen3-Coder habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

27.07 / 12:48

происшествия наука история самит транш В Англии нашли римскую монету в возрасте 1700 лет: как выглядела (фото)

Во время археологических работ на маршруте будущей железнодорожной линии East West Rail в Великобритании исследователи обнаружили редкую римскую монету, отчеканенную в 287 году нашей эры. На ней изображен Караузий – римский военачальник, провозгласивший себя императором Британии.

27.07 / 12:47

технологии санкции общество политика банк Минцифры: при отзыве зарубежных SSL-сертификатов российские сайты могут некорректно открываться в иностранных браузерах

Минцифры сообщило, что при отзыве зарубежных SSL-сертификатов некоторые российские сайты могут некорректно открываться в иностранных браузерах (Google Chrome, Safari, Edge), а соединение с различными сервисами может отображаться как небезопасное. В ведомстве пояснили, что некоторые российские ресурсы уже сообщили о возможной недоступности и ошибках при подключении из-за отзывов сертификатов иностранными удостоверяющими центрами.

27.07 / 12:47

погода закон промышленность самит энергетика Лучшее за неделю (13.07 — 19.07)

Привет, Хабр! Сегодня расскажем про проблему с перебором IPv4-адресов, идентификацию покупателей хостинга через «Госуслуги», влияние жары в Европе на работу ЦОДов и лучшие статьи прошлой недели: про Nintendo Switch 2, хранение данных в Docker, изобретение письменности и многое другое.

27.07 / 12:47

связь технологии экономика президент общество «Ведомости»: после роста в 2025 году мобильный интернет-трафик в России начал сокращаться

В 2025 году по сравнению с 2024-м падения потребления мобильного интернета на фоне ограничений сотовой связи не было, пишут «Ведомости» со ссылкой на опрошенных операторов и телекомэкспертов. По данным Института статистических исследований и экономики знаний (ИСИЭЗ) НИУ ВШЭ, в среднем каждый абонент ежемесячно потреблял по 24 ГБ мобильного интернета (288 ГБ ежегодно). Уже в первом полугодии 2026 года мобильное интернет‑потребление стало сокращаться на фоне регулярных ограничений доступа к сотовой сети, в том числе и в мегаполисах.

27.07 / 12:47

люди экономика работодатель стартап Стартап Refer делает ставку на то, что соискатели будут платить за возможность получить работу

Стартап Refer — одна из нескольких компаний, использующих модель «обратного рекрутинга», при которой соискатели, а не работодатели, платят комиссию за получение работы, пишет Business Insider.

27.07 / 12:47

Razer выпустила кресло Soma Chroma с реагирующей на геймплей подсветкой

Razer выпустила игровое кресло Soma Chroma с реагирующей на геймплей RGB-подсветкой и синхронизацией с остальной частью экосистемы Chroma. Динамичная подсветка совместима с более чем 300 играми, включая Battlefield 6, 007 First Light, Diablo VI и Cyberpunk 2077. Новинка обойдётся в $500.

27.07 / 12:27

нефть президент инфляция политика курс Мнения экспертов касательно предстоящего решения ФРС по ставке разделились

29 июля 2026 года ожидается заседание Федерального комитета по операциям на открытом рынке ФРС (FOMC), который примет решение по процентной ставке. Сценарий смягчения политики даже не рассматривается, при этом есть довольно большая вероятность — более 33% — что показатель повысят на 0,25%, согласно прогнозу биржи CME. Предыдущее заседание и позиция Уорша В прошлый раз ФРС оставила процентную ставку без изменений, на уровне 3,5%-3,75%. Отметим, что вероятность смягчения политики была низкой на фоне высокой инфляции в мае 2026 года и высоких цен на нефть. Кроме того, пре

27.07 / 12:12

iPhone технологии Apple смартфон Android Почему пользователи Android на самом деле переходят на iPhone

Привыкшие к широкому ассортименту пользователи Android при переходе на iOS чаще выбирают базовые или прошлогодние модели iPhone.

27.07 / 12:12

продукты люди здоровье Здоровье и красота еда Как избежать скачков глюкозы после еды

Экстракт этого растения подавляет голод при похудении и защищает сосуды от образования атеросклеротических бляшек.

27.07 / 11:58

здоровье BMW Mercedes-Benz интересное мода и стиль BYD Da Han: китайский «Большой Хан», длиннее Mercedes S-Class и с запасом хода 1000 км

Компания BYD решила, что обычного седана Han рынку недостаточно, поэтому официально представила его «старшего брата» — Da Han (что можно перевести как «Большой Хан»). Это не просто очередное обновление, а полноценный флагман линейки Dynasty, который своими размерами и характеристиками пытается занять место на территории представительских автомобилей немецкой тройки. Официальные изображения, опубликованные в китайских соцсетях, демонстрируют устройство в глубоком зелёном цвете, который, очевидно, станет основным для маркетинговых материалов.

Лента новостей

На главную страницу