Об этом же в других СМИ

habr.com / 3 месяца назад

Кто убедительнее — GPT-5.4 или Claude Opus 4.6? Новый бенчмарк стравил 15 моделей

habr.com / 3 месяца назад

ChatGPT для взрослых заморожен бессрочно — OpenAI теперь строит «суперприложение»

habr.com / 3 месяца назад

3 бита хватит: Google ускорила работу LLM за счет сжатия кэша

habr.com / 3 месяца назад

Вышел бенчмарк ARC-AGI-3: люди набирают 100%, GPT-5.4 — 0,26%

habr.com / 3 месяца назад

OpenAI закончила предобучение модели Spud. В компании появился отдел по запуску AGI

Больше по теме

12.03.2026 - 07:14 / habr.com

Карпати написал ИИ-агента, который ускорил обучение GPT-2 на 11%

Андрей Карпати, бывший директор по ИИ в Tesla и сооснователь OpenAI, представил autoresearch — открытый инструмент, в котором ИИ-агент самостоятельно оптимизирует обучение нейросетей. За два дня автономной работы агент провел около 700 экспериментов с кодом проекта nanochat и нашел примерно 20 изменений, которые реально улучшили качество модели. В результате время обучения до уровня GPT-2 на таблице лидеров проекта сократилось с 2,02 до 1,80 часа.

Агент работал по полному исследовательскому циклу: читал код, формулировал гипотезу, вносил правки, запускал эксперимент и оценивал результат — без участия человека. Среди находок — забытый множитель в нормализации внимания, из-за которого внимание было слишком размытым, отсутствие регуляризации для Value Embeddings, слишком консервативные настройки полосового внимания (banded attention) и некорректные параметры оптимизатора AdamW. Все улучшения оказались аддитивными и перенеслись с маленькой модели (depth=12) на более крупную (depth=24).

Карпати подчеркнул, что занимается ручной оптимизацией нейросетей уже 20 лет, и впервые увидел, как агент проделал весь этот цикл полностью автономно. "Выглядит невероятно", — написал он, отметив, что пока речь идет не о прорывных открытиях, а о реальных, рабочих улучшениях поверх тщательно настроенного проекта. Код autoresearch открыт под лицензией MIT и состоит всего из трех ключевых файлов: скрипта подготовки данных, скрипта обучения и markdown-файла с инструкциями для агента.

По мнению Карпати, все крупные ИИ-лаборатории придут к этому подходу: рой агентов оптимизирует маленькие модели, лучшие находки масштабируются на крупные, а люди подключаются только в исключительных случаях. Он уже запустил второй раунд autoresearch и параллельно

люди Tesla общество runawayllm

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

GPT-5.4 Pro опроверг открытую гипотезу теории вероятностей за 3 страницы habr.com / 3 месяца назад

113 000 ключей DeepSeek утекли на GitHub — и это лишь часть проблемы habr.com / 3 месяца назад

Visa разрешила ИИ-агентам платить по карте через командную строку habr.com / 3 месяца назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

22.07 / 11:46

технологии люди спорт общество политика 5G приходит в Киев: сеть нового поколения показала скорость до 1,7 Гбит/с, а следующим городом станет Одесса

Запуск в Киеве позволяет протестировать работу оборудования практически во всех типах городской среды — от центральных улиц до жилых районов. Специалисты анализируют качество покрытия, стабильность соединения, скорость передачи данных и устойчивость сигнала в реальных условиях эксплуатации.

22.07 / 11:45

связь технологии экономика общество стартап Light Flip: раскладушка для тех, кто хочет «удалиться» из интернета, не выбрасывая телефон

Пока индустрия соревнуется в количестве терафлопсов и гибкости экранов, стартап Light решил пойти путем радикального упрощения. Тан Кайвей (Tan Kaiwei), человек, который когда-то работал над культовым Motorola Razr, объединился с Джо Холлиером (Joe Hollier), чтобы представить Light Flip. Это устройство для тех, кто устал от бесконечных уведомлений и хочет вернуть себе контроль над своим временем, не превращаясь в отшельника.

22.07 / 11:45

люди криминал задержание расследование криптовалюта Опасно бывает даже в Steam: преступник украл криптовалюты на $220 тысяч с помощью восьми игр с "сюрпризом"

Платформа Steam прикладывает огромные усилия для обеспечения безопасности пользователей, однако все же находятся люди, которые знают, как обойти системы защиты и использовать брешь в преступных целях. Федеральное бюро расследований США сообщило о задержании 21-летнего жителя Флориды, который организовал схему кражи криптовалюты через видеоигры. Зэйэра Донтейвиуса Замариона Уилкинса (Zyaire Dontaevious Zamarion Wilkins) обвиняют во внедрении вредоносного ПО в восемь игр, с помощью которого удалось похитить активов на сумму около $220 тыс.

22.07 / 11:39

закон общество прогноз законопроект сенат Закон CLARITY опинился в центре спора вокруг Polymarket и спортивных ставок

Юристы и представители индустрии призвали Конгресс США расширить полномочия CFTC для надзора за рынками прогнозов. Во время слушаний подкомитета Палаты представителей 21 июля 2026 года прозвучали заявления, что законопроект CLARITY может предоставить регулятору необходимые инструменты для контроля как цифровых активов, так и стремительно растущих платформ вроде Kalshi и Polymarket. CLARITY Act может расширить полномочия CFTC Во время слушаний подкомитета Палаты представителей США по товарным рынкам, цифровым активам и развитию сельских территорий обсуждали вопросы защиты пользователей и целостности рынка спортивных контрактов

22.07 / 11:37

Проект Moonshine Micro для распознавания речи и синтеза речи в микроконтроллерах и DSP использует всего 470 КБ ОЗУ

Представлен открытый ИИ-проект под названием Moonshine Micro. Это решение для голосовых интерфейсов для микроконтроллеров. Проект позволяет выполнить распознавание речи и синтез речи в микроконтроллерах и DSP, который использует менее чем 500 КБ оперативной памяти.

22.07 / 11:37

Apple общество Apple начала тестировать ИИ-систему для записи разговоров сотрудников и покупателей

По информации инсайдера Марка Гурмана из Bloomberg, Apple тестирует новую функцию Live Notes на основе искусственного интеллекта, которая может расшифровывать разговоры между сотрудниками Genius Bar и клиентами в некоторых магазинах Apple Store.

22.07 / 11:35

технологии Wi-Fi общество самит мобильный телефон Почему нужно отключать мобильный интернет, если есть Wi-Fi: об этом мало кто знает

Многие пользователи оставляют мобильный интернет включенным даже после подключения к Wi-Fi, ошибочно полагая, что это не имеет никакого значения. На самом деле такая привычка может приводить к излишнему расходу мобильного трафика и более быстрому разряду аккумулятора смартфона. Особенно если на устройстве работают фоновые сервисы.

22.07 / 11:35

iPhone смартфон зарядка аккумулятор гаджет Как нельзя заряжать iPhone: 4 действия, которые убивают аккумулятор

Главная задача при зарядке iPhone – любой ценой избегать перегрева. Поскольку не весь ток в процессе попадает непосредственно в аккумулятор, потерянная энергия не исчезает в воздухе – она превращается в тепло, главного врага литий-ионных батарей. Кроме того, тепло выделяется при движении ионов лития между электродами.

22.07 / 11:23

интересное Xbox Game Pass Сделка с XBOX полностью окупила разработку STALKER 2: еще до релиза украинский шутер стал коммерчески успешным

Спустя почти два года после релиза S.T.A.L.K.E.R. 2: Heart of Chornobyl выяснилась интересная деталь о разработке долгожданного украинского шутера.

22.07 / 11:23

технологии Монитор для побед: Asus представила новую модель ROG Strix с 24,5” Fast IPS-панелью, частотой до 420 Гц и минимальным временем отклика

Asus официально представила новый киберспортивный монитор ROG Strix XG259QNSR Ace, ориентированный на любителей динамичных соревновательных игр.

Лента новостей

На главную страницу