Об этом же в других СМИ

hitechexpert.top / 1 год назад

Acura RSX утверждает, что это собственная операционная система Asimo OS от Honda

gagadget.com / 1 год назад

Google Workspace интегрирует Gemini и повышает цены: что это значит для пользователей

itc.ua / 1 год назад

OpenAI добавила функцию Tasks в ChatGPT — и теперь чат-бот может написать вам первым

habr.com / 1 год назад

Deepseek v3 на уровне o1 OpenAI: что показывают независимые бенчмарки

gagadget.com / 1 год назад

Google создает "нейтральный" фонд для развития Chromium: что это значит для браузеров?

Больше по теме

27.12.2024 - 15:14 / habr.com

Система o3 от OpenAI достигла уровня человека в тесте на общий интеллект. Что это значит?

Новая модель AI только что достигла результатов на уровне человека в тесте, разработанном для измерения «общего интеллекта». 20 декабря система o3 от OpenAI набрала 85% в тесте ARC-AGI, что значительно выше предыдущего лучшего результата AI в 55% и на уровне среднего результата человека. Она также показала хорошие результаты в очень сложном тесте по математике. Создание искусственного общего интеллекта, или AGI, является заявленной целью всех крупных исследовательских лабораторий AI. На первый взгляд, OpenAI, по-видимому, сделала значительный шаг к этой цели. Хотя скептицизм остается, многие исследователи и разработчики AI считают, что что-то изменилось. Для многих перспектива AGI теперь кажется более реальной, срочной и ближе, чем ожидалось.

Правы ли они? Обобщение и интеллект Чтобы понять, что означает результат o3, нужно понять, что такое тест ARC-AGI. В технических терминах, это тест на «эффективность выборки» системы AI в адаптации к чему-то новому — сколько примеров новой ситуации системе нужно увидеть, чтобы понять, как она работает. Система AI, такая как ChatGPT (GPT-4), не очень эффективна в плане выборки. Она была обучена на миллионах примеров человеческого текста, создавая вероятностные «правила» о том, какие комбинации слов наиболее вероятны. Результат довольно хорош в обычных задачах. Он плох в редких задачах, потому что у него меньше данных об этих задачах.

Пока AI-системы не смогут учиться на небольшом количестве примеров и адаптироваться с большей эффективностью выборки, они будут использоваться только для очень повторяющихся задач и задач, где допустимы редкие ошибки. Способность точно решать ранее неизвестные или новые задачи из ограниченного количества данных известна как способность обобщать. Это

общество самит школы google dilnaz04

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

«Киевстар» до 2026 года отключит 3G-сеть. Аналогичное решение тестируют Vodafone и lifecell. Что это значит для абонентов forbes.ua / 1 год назад

Исследование: робохирурги, обученные по видео, достигли уровня людей и научились исправлять ошибки habr.com / 1 год назад

OpenAI прогнозирует что AI-агенты смогут заменить многих работников уже в этом году 24tv.ua / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

24.07 / 03:41

продукты деньги рубль бюджет самит Где купить токены? Запускаем ИИ-роутер с 300+ LLM

Когда проекту нужны возможности генеративного ИИ, перед разработчиком встает чисто инфраструктурный тупик. Одной модели для всех задач почти никогда не хватает. В итоге вы ищете обходные пути для оплаты зарубежными картами или закупаете токены вразнобой у десятка разных неофициальных агрегаторов и занимаетесь менеджментом подписок.

24.07 / 03:41

происшествия люди животные человек кошка Почему кошки предпочитают питаться с пола - ответ экспертов

Часто хозяева замечают, что кошки отдают предпочтение еде, которая высыпана на пол, несмотря на наличие миски рядом.

24.07 / 03:08

Samsung технологии Apple Amazon Samsung объявила о запуске своей первой кредитной карты на рынке США под названием Samsung Galaxy Card

Samsung представила свою первую кредитную карту Samsung Galaxy Card для пользователей в США. Новинка предлагает существенный кешбэк при покупке продукции южнокорейского производителя.

24.07 / 02:39

происшествия история ядерное оружие самит пилот Одна из самых странных ядерных катастроф – что произошло в 1968 году

Ошибка пилота превратила рутинный вылет в смертельную ловушку для экипажа. Пожар на борту заставил военных эвакуироваться посреди полярной ночи.

24.07 / 01:50

происшествия золото история самит археология Пропуск в загробный мир: в Египте нашли гробницы с золотыми языками

Ученые связывают обнаруженные гробницы с античным торговым городом Левкаспис. Этот крупный прибрежный центр процветал во времена Римской империи.

23.07 / 23:30

люди экономика общество человек Здоровье и красота Почему людям с ожирением так трудно похудеть - исследование

Ученые изучили данные 1754 человек и обнаружили необычную реакцию организма на увеличение физических нагрузок.

23.07 / 23:17

продукты Alibaba представила Qwen3.8 — 2,4-триллионную ИИ-модель и пообещала открыть ее веса

Alibaba анонсировала новую флагманскую модель Qwen3.8. Китацы заявляют, что модель содержит 2,4 трлн параметров. Обещают и выложить веса.

23.07 / 22:49

Огурцы по-корейски — хрустящая закуска с насыщенным вкусом - Журнал "ФОКУС ВНИМАНИЯ"

Огурцы по-корейски — одна из самых популярных корейских закусок, которая сочетает свежесть овощей, пикантные специи и насыщенный аромат кунжутного масла.

23.07 / 22:49

Как изменился путь клиента: сегодня вас «гуглят» раньше, чем покупают - Журнал "ФОКУС ВНИМАНИЯ"

Еще несколько лет назад путь клиента выглядел достаточно просто. Человек увидел рекламу, перешёл на сайт, посмотрел предложение, пообщался с менеджером и принял решение.

23.07 / 22:28

продукты связь технологии экспорт общество Документация Delta Design обновилась: варианты исполнений, веб-панель Identity, новые аппертуры DeltaCAM

Сегодня в пользовательской документации Eremex вышло несколько новых статей, а также провели техническое обслуживание самого сайта: поправили битые ссылки, ускорили загрузку и улучшили поиск.

Лента новостей

На главную страницу