Об этом же в других СМИ

habr.com / 1 год назад

Meta* теперь может использовать общедоступные данные Facebook и Instagram для обучения ИИ

habr.com / 1 год назад

Meta* запускает программу, призванную стимулировать стартапы к использованию моделей ИИ Llama

habr.com / 1 год назад

Новая модель ИИ от Anthropic переходит к шантажу, когда инженеры пытаются отключить её

habr.com / 1 год назад

Как модель ИИ Anthropic Claude Opus 4 выражает себя через эмодзи

habr.com / 1 год назад

OpenAI обновляет модель искусственного интеллекта, на которой работает агент Operator

Больше по теме

16.05.2025 - 07:30 / habr.com

Модели рассуждений в ИИ: от предварительного обучения к автономному мышлению

Якуб Пачоцки, возглавляющий разработку передовых моделей в OpenAI, говорит, что способность ИИ самостоятельно генерировать знания знаменует собой поворотный момент для бизнеса и исследований.

По словам Пачоцки, так называемые модели рассуждений находятся на пути к автономному генерированию знаний. Он описывает это как форму «рассуждения», хотя она принципиально отличается от того, как мыслят люди.

«Я бы сказал, что это форма рассуждения, но это не значит, что это то же самое, что и человеческое рассуждение», — говорит он Nature.

Эти модели основаны на двухэтапном процессе обучения. Сначала происходит предварительное обучение без учителя, в ходе которого ИИ поглощает огромные объёмы данных и создаёт «модель мира» — своего рода внутреннюю карту реальности, но без какой-либо осознанной структуры или временной шкалы, объясняет Пачоцки.

На втором этапе используется обучение с подкреплением с обратной связью от человека (RLHF), чтобы превратить этот фундамент в полезного помощника. Пачоцки говорит, что этот шаг ещё более важен в новейших моделях мышления. Помимо RLHF, OpenAI также использует более классическое обучение с подкреплением, которое лучше всего подходит для задач с чётко определёнными правильными и неправильными ответами. RLHF может решать более сложные задачи, но оно не так хорошо масштабируется.

Пачоцки сомневается в том, что предварительное обучение и обучение с подкреплением вообще следует рассматривать как отдельные этапы.

«Модели рассуждений не учатся думать в вакууме, они основаны на модели, которая обучилась в ходе предварительного обучения», — говорит он. Его текущая работа сосредоточена на том, как взаимодействуют эти два этапа и как их объединить — на эту идею недавно также указал его начальник Сэм Альтман.

бизнес связь люди общество самит роды Сэм Альтман mefdayy

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Mistral представляет Devstral Small 24B — новую языковую модель с открытым исходным кодом для программирования habr.com / 1 год назад

Sakana AI исследует мышление, основанное на времени, с помощью модели ИИ, имитирующей мозг habr.com / 1 год назад

Stability AI выпускает модель преобразования текста в звук, которая работает на мобильных устройствах habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

22.07 / 08:09

технологии общество экспедиция журналист школы Проект «Дни научного кино ФАНК» открывает бесплатный доступ к научным фильмам лекциям и квизам

Проект «Дни научного кино ФАНК» запускает бесплатную онлайн‑платформу «ДНК Онлайн». Платформа будет работать с 4 июля по 7 декабря 2026 года. «Дни научного кино ФАНК» реализуется при грантовой поддержке Министерства науки и высшего образования Российской Федерации в рамках Десятилетия науки и технологий. Дополнительную поддержку оказывают Московский институт психоанализа, компания «Норникель» и Российская академия наук.

22.07 / 08:09

технологии Apple санкции СМИ общество Правительство утвердило перевод всех служебных коммуникаций госслужащих на платформу «Макс» к 2030 году

Премьер-министр России Михаил Мишустин подписал распоряжение о переводе государственных и муниципальных служащих на платформу «Макс» к 2030 году. Документ опубликован на официальном портале правовых актов.

22.07 / 08:08

происшествия вода происшествие курьез Курьезный потоп в США – не обошлось без шеста для стриптиза (ВИДЕО)

Пострадавшая девушка призналась, что испытала сильный шок от случившегося происшествия. Она до последнего не верила в реальность аварии.

22.07 / 08:05

связь технологии смартфон самит электроэнергия Можно ли пользоваться телефоном во время зарядки: ответ экспертов

Современные смартфоны оснащены защитными системами, которые позволяют одновременно подключать их к сети и запускать приложения. Однако техническая возможность ещё не означает, что это полезно для аккумулятора. Если телефон не нужен срочно, лучше на время отложить его в сторону и дать ему зарядиться.

22.07 / 07:50

люди СМИ общество рубль электромобиль В России начались первые официальные отгрузки электромобилей «Атом»

Электромобиль «Атом» начали отгружать первым покупателям. Две машины были вручены 17 июля 2026 года. Об этом сообщил портал Drom со ссылкой на сообщение генерального директора АО «Кама» Игоря Поваразднюка. Кроме того, блогер и популяризатор российского импортозамещения Максим Горшенин заявил, что официально первым получил электромобиль в России.

22.07 / 07:45

дети общество самит психология психика 5 традиций родителей, с которыми дети растут близкими

Что на самом деле укрепляет доверие между родителями и детьми: опыт экспертов.

22.07 / 07:45

культура наука золото история Знаменитости О ней упоминают во многих летописях: в Перу обнаружили уникальную цитадель инков (фото)

Археологи в Перу сообщили о масштабном открытии в Южных Андах — они обнаружили древнюю крепость инков Такрачульо, площадь которой примерно в четыре раза превышает знаменитый Мачу-Пикчу. На территории комплекса исследователи зафиксировали сотни построек и нашли тысячи артефактов.

22.07 / 07:45

люди туризм самит курорт Знаменитости Загадочный объект на пляже Уэльса удивил туристов

Отдыхающие сравнивают загадочную инсталляцию с известным фантастическим фильмом. Объект напоминает монолит из знаменитой Космической одиссеи.

22.07 / 07:23

продукты технологии люди мозг стартап Китай провёл первую в мире коммерческую операцию по имплантации интерфейса «мозг–компьютер»

Китай провёл первую в мире коммерческую операцию с использованием инвазивного интерфейса «мозг–компьютер». Согласно заявлению Комиссии по науке и технологиям муниципалитета Шанхая, китайские хирурги имплантировали чип размером с монету пациенту с нарушением подвижности кисти, вызванным повреждением спинного мозга в результате автомобильной аварии, произошедшей 10 лет назад.

22.07 / 07:23

технологии Apple деньги общество рубль По опросу, рынок ИИ-поиска в России вырастет на фоне спроса на работу с закрытыми данными и корпоративными ИИ‑сервисами

Российский рынок ИИ-поиска в 2026 году может вырасти на 33%. Об этом сообщило издание «Ведомости» со ссылкой на проведённый среди разработчиков искусственного интеллекта опрос. Под ИИ‑поиском понимаются решения для поиска информации в интернете и во внутренних системах с помощью искусственного интеллекта.

Лента новостей

На главную страницу