Об этом же в других СМИ

gagadget.com / 1 год назад

Французы случайно раскрыли засекреченные данные о подводных атомных лодках через приложение для пробежек

cursorinfo.co.il / 1 год назад

Как доходы жены могут загнать мужа в депрессию: новые данные ученых

habr.com / 1 год назад

Telegram передал данные более 33 тыс. пользователей (IP-адреса и номера телефонов) правоохранительным органам 29 стран

itc.ua / 1 год назад

Google Drive теперь быстрее синхронизирует данные и использует меньше трафика

habr.com / 1 год назад

Комплект In Case of Death уничтожит данные с iPad Pro 11 после смерти владельца

Больше по теме

28.12.2024 - 04:02 / habr.com

Синтетические данные в обучении AI: возможности и ограничения

Возможно ли обучить AI только на данных, сгенерированных другим AI? Это может показаться безумной идеей, но она существует уже довольно давно. И по мере того как новые, реальные данные становятся все труднее достать, эта идея набирает популярность.

Компания Anthropic использовала синтетические данные для обучения одной из своих флагманских моделей, Claude 3.5 Sonnet. Meta* доработала свои модели Llama 3.1, используя данные, сгенерированные AI. Говорят, что OpenAI использует синтетические данные для обучения своей модели «reasoning» o1 для предстоящего Orion.

Но почему AI вообще нужны данные — и какие именно данные ему нужны? И могут ли эти данные действительно быть заменены синтетическими данными?

Системы AI — это статистические машины. Обучаясь на большом количестве примеров, они изучают шаблоны в этих примерах, чтобы делать прогнозы. Аннотации, обычно текст, обозначающий значение или части данных, которые эти системы поглощают, являются ключевым элементом в этих примерах. Они служат ориентирами, обучая модель различать вещи, места и идеи.

Рассмотрим модель классификации фотографий, которой показывают множество изображений кухонь с меткой «кухня». По мере обучения модель начнет устанавливать ассоциации между «кухней» и общими характеристиками кухонь (например, тем, что они содержат холодильники и столешницы). После обучения, получив фотографию кухни, которая не входила в начальные примеры, модель должна будет распознать её как таковую. (Конечно, если бы фотографии кухонь были помечены как «корова», она бы идентифицировала их как коров, что подчеркивает важность качественной аннотации.)

Желание развивать AI и необходимость предоставлять помеченные данные для его разработки взорвали рынок услуг аннотации. По оценкам Dimension

бизнес технологии люди общество доллар dilnaz04

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

В OneDrive запретят бесплатно хранить данные уволенных сотрудников habr.com / 1 год назад

Дания получила еще три новых F-35A gagadget.com / 1 год назад

Опубликованы ключевые данные и результаты тестирования Qualcomm Snapdragon 8s Elite hitechexpert.top / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

12.07 / 19:36

дети общество самит психология дети и родители Шесть нюансов поведения родителей, влияющих на личность ребенка

Дети воспитываются не родительскими нотациями, а повседневными бытовыми привычками и реакциями взрослых, которые те даже не замечают.

12.07 / 19:36

продукты люди здоровье общество офтальмология Как высокий уровень холестерина можно увидеть по глазам

Повышенный холестерин зачастую не имеет симптомов, потому определить его можно лишь по сопутствующим симптомам. Например, обратив внимание на глаза.

12.07 / 18:58

происшествия закон общество семья выплаты В Китае начался суд из-за смерти 32-летнего программиста, который, по заявлению семьи, умер после длительных переработок

В китайском Гуанчжоу началось судебное разбирательство по иску родственников 32-летнего программиста, который, как утверждают члены его семьи, умер в результате длительных переработок, сообщает China Newsweek.

12.07 / 18:58

экономика SpaceX политика крипто токен Вышел Grok 4.5 — модель доступна бесплатно в Cursor и Grok Build

SpaceXAI (так теперь называется xAI после слияния со SpaceX) открыла доступ к Grok 4.5. Модель стала вариантом по умолчанию в агенте Grok Build и появилась в Cursor на всех тарифах — там ее можно попробовать бесплатно в течение ограниченного времени. Разработчикам также доступен API по цене в $2 за миллион входных токенов и $6 за миллион выходных

12.07 / 18:27

Samsung технологии Apple прогноз самит Samsung готовит новый SmartTag спустя три года: когда ждать анонс и что может измениться

Последняя модель появилась еще в 2023 году, и с тех пор линейка не обновлялась. Теперь известный немецкий инсайдер Роланд Квандт сообщил, что преемник SmartTag 2 будет представлен уже в этом году.

12.07 / 18:04

общество самит энергетика протестующие астрология Умеют убеждать: этим знакам Зодиака невозможно отказать

Есть знаки Зодиака, которым почти невозможно отказать из-за их харизма и умения убеждать.

12.07 / 16:33

люди ученые общество кофе питание Чашка в день снижает риск смерти – напиток посоветовали эксперты

Международные исследователи доказали, что ежедневная привычка пить кофе и зеленый чай способна снизить риск преждевременной смерти более чем на четверть.

12.07 / 16:25

связь технологии деньги интересное мода и стиль Nokia 102 4G (2026): возвращение к истокам без лишнего «интеллекта»

Пока мир сходит с ума от нейросетей в каждом утюге, бренд Nokia решил пойти против течения. В сеть попали детали о новой итерации Nokia 102 4G образца 2026 года — и это тот случай, когда «меньше» значит «лучше». Устройство напоминает нам о временах, когда телефон был инструментом для связи, а не центром поглощения цифрового контента.

12.07 / 16:14

технологии экономика самит Рассекречен бюджетный смартфон HMD Asha 305: дизайн в стиле iPhone и Android 14 Go

Информацией поделился известный инсайдер SmashX_60. По его данным, в Таиланде новинка будет стоить 2390 бат, что соответствует примерно 75 долларам.

12.07 / 15:38

деньги закон общество суд курьез Итальянка нашла огромную сумму денег – финал оказался неожиданным

Городские чиновники пытались забрать себе найденную в общественном транспорте валюту, аргументируя это тем, что женщина сделала находку в рабочее время.

Лента новостей

На главную страницу