Об этом же в других СМИ

habr.com / 1 год назад

«Лаборатория Касперского»: популярными провайдерами облачных решений в РФ стали Yandex Cloud и VK Cloud

itc.ua / 1 год назад

ilenta.com / 1 год назад

Произошла утечка данных о местоположении миллионов пользователей популярных приложений

gagadget.com / 1 год назад

Meta блокирует ссылки на социальную сеть Pixelfed, которая конкурирует с Instagram, тем самым делая её только популярней

gagadget.com / 1 год назад

Новая китайская социальная сеть стремительно захватывает популярность среди американской молодежи

Больше по теме

27.12.2024 - 13:39 / habr.com

Популярная техника повышения эффективности AI имеет свои недостатки

Одна из самых широко используемых техник повышения эффективности моделей AI — квантизация — имеет свои ограничения, и индустрия может быстро приближаться к ним. В контексте AI квантизация означает уменьшение количества битов — наименьших единиц, которые может обрабатывать компьютер, — необходимых для представления информации. Рассмотрим аналогию: когда кто-то спрашивает время, вы, вероятно, скажете «полдень», а не «двенадцать часов, одна секунда и четыре миллисекунды». Это и есть квантизация; оба ответа верны, но один из них немного более точный. Насколько точность действительно нужна, зависит от контекста.

Модели AI состоят из нескольких компонентов, которые можно квантизировать, в частности параметров, внутренних переменных, которые модели используют для прогнозов или принятия решений. Это удобно, учитывая, что модели выполняют миллионы вычислений во время работы. Квантизированные модели с меньшим количеством битов для представления их параметров менее требовательны математически, а следовательно, и вычислительно. (Для ясности, это отличается от «дистилляции», которая является более сложной и избирательной обрезкой параметров.)

Но квантизация может иметь больше компромиссов, чем предполагалось ранее. Постоянно уменьшающаяся модель. Согласно исследованию ученых из Гарварда, Стэнфорда, MIT, Databricks и Carnegie Mellon, квантизированные модели работают хуже, если исходная неквантизированная версия модели обучалась в течение длительного времени на большом объеме данных. Другими словами, в определенный момент может оказаться лучше просто обучить меньшую модель, чем ужимать большую.

Это может означать плохие новости для компаний, занимающихся AI, которые обучают чрезвычайно большие модели, а затем квантизируют их, чтобы

экономика Nvidia самит доллар google крипто dilnaz04

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Отныне иностранные компании смогут модернизировать военную технику для Сил обороны Украины gagadget.com / 1 год назад

«Чудо техники» поздравляет Вас с Новым 2025 годом! chudo.tech / 1 год назад

Китайские ученые совершили прорыв в эффективности динамической беспроводной зарядки hitechexpert.top / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

13.07 / 22:29

продукты продукты питания культура самит Здоровье и красота Пять доступных трав, которые снижают риски развития сахарного диабета

Традиционный салат-латук стремительно теряет популярность среди диетологов. Ему на смену приходят более концентрированные растительные источники.

13.07 / 22:29

люди ученые животные наука общество Ключ к продлению жизни до 240 лет ищут сингапурские ученые

Хронические скрытые процессы внутри тканей признаны главным катализатором старения. Они вызывают опасные поражения сердца и мозга у людей.

13.07 / 22:03

Samsung технологии экономика прогноз самит Samsung готовит к выпуску новый бюджетный смартфон Galaxy A07s

Пока компания официально не анонсировала устройство, однако обнаруженная прошивка подтверждает, что работа над смартфоном уже идет.

13.07 / 21:14

история самит крипто gemini Новая модель Meta* обходит Opus 4.8 и GPT-5.5 в агентских задачах — и стоит $1.25 за миллион токенов

Meta* Superintelligence Labs представила Muse Spark 1.1 — мультимодальную reasoning-модель, заточенную под агентские сценарии (Meta* признана экстремистской и запрещена в России). Релиз вышел всего через три месяца после первой Muse Spark, с которой Meta* в апреле вернулась в гонку фронтирных моделей. Глава Meta Superintelligence Labs Александр Ванг заявил, что по многим агентским тестам новая модель соперничает с GPT-5.5 и Claude Opus 4.8, а в использовании инструментов — лидирует.

13.07 / 20:51

бюджет школы интересное Митап ко Дню сисадмина: три доклада из практики

Работающие серверы, спокойный сон руководства и сохранность данных — если за это отвечаете вы, то 17 июля Школа 21 в Ярославле собирает вечер как раз для вас.

13.07 / 20:32

Samsung технологии золото общество евро Ремонт смартфонов Samsung стал дороже: компания повысила цены на запчасти

По данным издания The Chosun, стоимость материалов для ремонта смартфонов Samsung в среднем выросла на 5%. Это означает, что средний ремонт мобильного устройства теперь обходится примерно на 11 000 южнокорейских вон дороже — около 7,4 доллара, 6,5 евро, 5,5 фунта стерлингов или 705 индийских рупий.

13.07 / 19:52

люди общество лечение сон деменция Какое поведение во сне может предупреждать о деменции

Тревожный признак вероятного развития деменции можно выявить когда человек крепко спит, говорят врачи.

13.07 / 19:33

технологии интернет общество техника Пять скрытых функций роутера, о которых забывает большинство

Несколько встроенных возможностей роутера способны сделать домашнюю сеть безопаснее и стабильнее.

13.07 / 19:09

Жюльен с грибами, свининой и сливками - Журнал "ФОКУС ВНИМАНИЯ"

Жюльен — одно из тех блюд, которые давно стали классикой домашней кухни. Его ценят за насыщенный сливочный вкус, аромат грибов и аппетитную сырную корочку, под которой скрывается нежная, сочная начинка.

13.07 / 19:04

продукты общество самит ожирение иммунитет Что нужно есть вечером, чтобы меньше храпеть ночью

Простые хитрости помогут лучше выспаться и избавиться от храпа, или по крайней мере существенно его уменьшить.

Лента новостей

На главную страницу