Об этом же в других СМИ

habr.com / 1 год назад

Исследователи научились из космоса отслеживать движение пластиковых отходов

itc.ua / 1 год назад

Языковые модели ИИ научились распознавать эмоции и скрытый смысл лучше некоторых людей

gagadget.com / 1 год назад

Россия глушит GPS в Балтии: исследователи запеленговали источники сигналов возле Калининграда

habr.com / 1 год назад

Исследователи говорят, что, возможно, они нашли способ преодолеть «стену данных»

habr.com / 1 год назад

Исследование Pfizer о причинах трудностей больших языковых моделей при решении задач

Больше по теме

18.06.2025 - 10:38 / habr.com

Исследователи Anthropic обучают языковые модели самосовершенствованию

Исследователи из компании Anthropic разработали новый метод под названием «Максимизация внутренней согласованности» (Internal Coherence Maximization, ICM), который позволяет точно настроить языковые модели, используя только их собственные результаты. Этот подход может помочь (или даже заменить) человеческий контроль при выполнении сложных задач.

Традиционно большие языковые модели дорабатываются с помощью человеческого контроля, например, с помощью примеров ответов или обратной связи. Но по мере того как модели становятся больше, а их задачи — сложнее, человеческий контроль становится менее надёжным, утверждают исследователи из Anthropic, Schmidt Sciences, Independent, Constellation, Нью-Йоркского университета и Университета Джорджа Вашингтона в новом исследовании.

Их решением является алгоритм, называемый Internal Coherence Maximization, или ICM, который обучает модели без внешних меток, полагаясь исключительно на внутреннюю согласованность.

В основе ICM лежит простая идея: языковая модель, такая как Claude или Llama, должна сама определять, какой ответ на вопрос является правильным, и делать это с помощью двух основных критериев.

Первый — это взаимная предсказуемость. Это означает, что модель проверяет, может ли она достоверно вывести правильный ответ на новый вопрос на основе ответов на аналогичные предыдущие вопросы. Если модель распознаёт закономерности в похожих случаях, она может применить их к новым ответам, создавая внутреннюю согласованность — набор ответов, которые сочетаются друг с другом и отражают общее понимание.

Второй критерий — логическая непротиворечивость. Здесь модель проверяет собственные ответы на наличие противоречий. Например, если модель считает два разных решения одной и той же математической задачи

связь люди общество самит Maxim Джордж Вашингтон mefdayy Вашингтон Нью-Йорк

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Исследователи МТИ объединили GenAI и движок физического моделирования для улучшения конструкций роботов habr.com / 1 год назад

Исследователи DeepSeek выпустили nano-vLLM — компактный движок для запуска языковых моделей habr.com / 1 год назад

Исследователи обучают ИИ генерировать длинные тексты, используя только метод обучения с подкреплением habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

20.07 / 05:14

технологии происшествия люди климат самит Инженеры научили мини-дрон самостоятельно уничтожать комаров в полете

Речь идет об официальной информации, опубликованной самой Tornyol Systems. При этом проект пока находится на стадии активной разработки, поэтому массовые поставки устройства еще не начались.

20.07 / 04:47

медицина технологии ученые наука общество Жизнь после смерти: ученые заставили донорские глаза видеть свет

Уникальная медицинская система помогла продлить базовые функции сетчатки. Устройство детально имитирует естественные процессы кровообращения.

20.07 / 04:16

бизнес экономика Nvidia общество самит Экс-директор OpenAI отдала в паблик модель на 975B

Бум вокруг думающих ИИ-моделей продолжается. Команда Thinking Machines Lab представила свою первую и сразу флагманскую мультимодальную модель с открытыми весами — Inkling.

20.07 / 03:47

NASA эвакуация Луна космос прогноз Астронавты могут безвозвратно остаться на Луне - тревожный прогноз

Ученые NASA назвали условия, при которых астронавты окажутся на Луне без шансов быть спасенными.

20.07 / 03:19

продукты самит google Microsoft обучает своих продавцов негативно отзываться об OpenAI и Anthropic

Microsoft готовит своих специалистов по продажам к более жёсткой конкуренции с другими крупными игроками в сфере искусственного интеллекта. На внутреннем совещании руководство компании представило план, согласно которому им предписано в невыгодном свете сравнивать ИИ-продукты таких компаний, как OpenAI, Google и Anthropic, с собственными разработками Microsoft.

20.07 / 03:19

продукты технологии Apple музыка доллар OpenAI выпустила клавиатуру для вайбкодинга, а на подходе — умная колонка

OpenAI сделала первый шаг в сторону собственного железа. Правда, вопреки ожиданиям, дебютным устройством стала не загадочная разработка команды Джони Айва, а компактная клавиатура Codex Micro, предназначенная для работы с ИИ-агентами.

20.07 / 02:46

продукты люди здоровье продукты питания общество Постоянно хочется сладкого - о чем пытается сигнализировать организм

Если тяга к сладкому возникает почти каждый день, следует обратить внимание на рацион, сон, уровень стресса.

20.07 / 01:22

ученые история общество изнасилование искусство Изнасилование погубило известную музу Боттичелли – исследование

Флорентийская красавица XV века умерла в возрасте двадцати трех лет. Врачи того времени ошибочно списали ее тяжелые симптомы на туберкулез.

20.07 / 00:53

продукты продажа люди продукты питания самит Рис или картофель — что лучше для балансировки уровня сахара в крови

Американские диетологи объяснили, почему способ приготовления и правильное соседство продуктов на тарелке важнее, чем полный отказ от популярных углеводов.

19.07 / 23:23

технологии смартфон Эксперт гаджет Популярный способ ускорить смартфон оказался мифом

Популярная рекомендация для владельцев Android не выдержала проверки экспериментом и оказалась далеко не такой эффективной, как считалось.

Лента новостей

На главную страницу