Об этом же в других СМИ

habr.com / 1 год назад

RetroLLM: расширение возможностей больших языковых моделей для получения точных данных в процессе генерации

cursorinfo.co.il / 1 год назад

Как прогулка способствует продлению жизни - интересное исследование ученых

cursorinfo.co.il / 1 год назад

Как употребление кофе влияет на риск развития диабета - новое исследование

habr.com / 1 год назад

Meta* показывает, что языковые модели все еще не могут пройти сложные тесты по теории разума

cursorinfo.co.il / 1 год назад

В какое время нужно пить кофе, чтобы дольше жить – исследование

Больше по теме

24.12.2024 - 23:45 / habr.com

Исследование Hugging Face: Как малые языковые модели превосходят гигантов благодаря масштабированию

В новом исследовании Hugging Face исследователи продемонстрировали, как можно настроить малые языковые модели SLM так, чтобы они превосходили гораздо более крупные модели. Их результаты показывают, что модель Llama 3 с параметрами 3B может превзойти версию модели 70B в сложных математических задачах. Компания Hugging Face полностью задокументировала весь процесс и предоставила дорожную карту для предприятий, желающих появится больше инструментов и методов, которые помогут предприятиям максимально эффективно использовать свои ресурсы.

Основная идея, лежащая в основе таких моделей, как o1, заключается в масштабировании вычислений во время теста, что фактически означает использование большего количества циклов вычислений во время вывода для тестирования и проверки различных ответов и путей рассуждений перед выдачей окончательного ответа. Масштабирование вычислений во время теста особенно полезно, когда недостаточно памяти для запуска большой модели.

Поскольку o1 является частной моделью, а OpenAI умалчивает о ее внутренних механизмах, исследователи строят предположения о том, как она работает и пытаются провести обратную разработку процесса. Уже существует несколько открытых альтернатив o1 .

Работа Hugging Face основана на исследовании DeepMind, опубликованном в августе , в котором исследуются компромиссы между временем вывода и предварительным вычислением. Исследование предоставляет комплексные рекомендации по балансировке обучения и вычисления вывода для получения наилучших результатов при фиксированном бюджете. Помимо использования дополнительного времени для вычисления вывода, успех метода зависит от двух ключевых компонентов: модели вознаграждения, которая оценивает ответы SLM и алгоритма поиска, который оптимизирует

продукты общество бюджет предприятия dilnaz04

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Hugging Face выпустила фреймворк Smolagents, упрощающий создание AI-агентов с помощью всего нескольких строк кода habr.com / 1 год назад

Deepseek V3 становится самой мощной открытой языковой моделью в Китае на сегодня habr.com / 1 год назад

Ученые выяснили, как «украсть» действующую модель искусственного интеллекта nbnews.com.ua / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

22.07 / 15:20

Samsung медицина здоровье общество Здоровье и красота Samsung запустила ИИ-помощника для здоровья: новый Health Assistant анализирует организм и дает персональные рекомендации

На данный момент Health Assistant уже доступен в рамках бета-тестирования для некоторых пользователей Samsung Health в США. В дальнейшем Samsung планирует постепенно расширять доступность сервиса и добавлять новые функции.

22.07 / 15:07

история NASA буря интересное Ядерный реактор вместо солнечных панелей: NASA отправит SR-1 Freedom на Марс

Американское космическое агентство NASA решило, что для серьезного освоения Марса солнечных панелей и слабых радиоизотопных генераторов уже недостаточно. Как стало известно из планов ведомства, озвученных для издания Politico, в 2028 году к Красной планете должен отправиться аппарат Space Reactor-1 Freedom (SR-1). Это не просто очередной спутник, а первый в истории межпланетный корабль, который будет работать на основе ядерного распада. Проект оценивают в $2.1 млрд, и это только начало «атомных» амбиций США в далеком космосе.

22.07 / 15:06

бизнес Block google Джек Дорси представил платформу для группового чата Buzz

Сооснователь Twitter (теперь X) и компании Block Джек Дорси представил платформу для группового чата, призванную заменить Slack и GitHub. Проект называется Buzz и доступен с открытым исходным кодом. По словам Дорси, Buzz предназначена для команд и ИИ-агентов. Он позволяет обмениваться сообщениями, ставить задачи, вести разработку и планирование в рамках одного пространства. Фактически это аналог Slack, но с дополнительными функция

22.07 / 14:50

promo ByDex — современный сервис для работы с USDT, QR-платежей и виртуальных карт

Цифровые активы становятся все более востребованным

22.07 / 14:47

Samsung технологии Складные смартфоны Встречайте: Galaxy Z Fold 8 Ultra — бескомпромиссный складной флагман Samsung с улучшенным экраном и мощным охлаждением

В дополнение к базовому складному смартфону 2026 года Galaxy Z Fold 8, который получил новый форм-фактор, Samsung представила и флагманскую Ultra-модель. Она заинтересует тех пользователей, которые хотят получить прирост производительности и автономности и при этом не планируют привыкать к переработанному соотношению сторон.

22.07 / 14:39

бизнес продукты самит google gemini Google представила сразу три новые ИИ-модели Gemini: акцент сделан на программирование, анализ данных и кибербезопасность

Анонс стал частью стратегии Google по активному развитию собственной ИИ-экосистемы на фоне усиливающейся конкуренции с OpenAI, Anthropic, Microsoft и xAI. Новые модели призваны предложить разработчикам более высокую производительность, снизить стоимость вычислений и расширить возможности автоматизации.

22.07 / 14:23

экономика общество прогноз инвестор google CEO JPMorgan увидел недооцененные риски для рынков и сделал новый прогноз относительно эпохи ИИ

Генеральный директор JPMorgan Chase Джейми Даймон заявил, что инвесторы недооценивают геополитические и фискальные риски для мировой экономики, пишет CNBC. По его мнению, нынешние оценки акций и долгосрочных казначейских облигаций США не учитывают в полной мере потенциальные потрясения, что может иметь значение как для традиционных, так и для криптовалютных рынков, которые все чаще реагируют на макроэкономические факторы. Среди ключевых угроз он назвал войны в Украине и на Ближнем Востоке, напряженность между США и Китаем, а также рост военных расходов на фоне рекордных бюджетных дефицитов. США объединили ИИ-гигантов OpenAI, Anthropic и Google против Китая 08.04.2026 Читать США пригрозили санкциями китайским ИИ-компаниям 22.07.2026 Читать По словам банкира, даже если часть этих рисков уже учтена в

22.07 / 14:15

Samsung технологии звезда Широкоформатная база: Samsung представила Galaxy Z Fold 8 — переосмысленный складной смартфон в новом форм-факторе

Состоялась презентация Galaxy Unpacked, на которой Samsung представила свои флагманские новинки. Главной звездой ивента несомненно стал Galaxy Z Fold 8 — складной смартфон, который является базовой моделью 2026 года и получил совершенно новый форм-фактор: теперь это широкоформатный гаджет, который станет конкурентом Pura X Max и еще непредставленному iPhone Ultra.

22.07 / 14:07

люди животные общество самит профессор Почему собаки имитируют половой акт – причины странного поведения

Согласно выводам исследователей, в подавляющем большинстве случаев (около 65%) собачьи садки происходят без очевидной причины.

22.07 / 14:07

связь ученые животные общество книги Собаки ревнуют хозяев: эксперимент разрушил давний научный миф

Привычная реакция собак на внимание хозяина может скрывать чувство, которое долго считали исключительно человеческим.

Лента новостей

На главную страницу