Об этом же в других СМИ

habr.com / 11 месяцев назад

Microsoft ведёт переговоры о сохранении доступа к технологиям OpenAI после достижения рубежа AGI

habr.com / 11 месяцев назад

Началась бета Grok Imagine: быстрые картинки и пикантный режим

hitechexpert.top / 11 месяцев назад

Opera переносит спор с Microsoft в Бразилию

charter97.org / 11 месяцев назад

TIME: ИИ Grok от Илона Маска научится создавать видео

gagadget.com / 11 месяцев назад

Маск снижает зависимость от Китая: в дополнение к чипам Samsung электромобили Tesla получат аккумуляторы от LG

Больше по теме

15.07.2025 - 16:24 / habr.com

Grok 4 — «AGI у нас дома» или просто хайп?

Как известно, вчера вышла новая итерация ИИ от xAI — Grok 4.
Пока в техсообществе считалось хорошим тоном нахваливать Claude Opus, немного — GPT‑4o, и снисходительно хихикать над творением Илона Маска, Grok ворвался и внезапно взорвал танцпол. По крайней мере — в бенчмарках.

Что это такое: Humanity’s Last Exam — это один из самых амбициозных и по-настоящему сложных бенчмарков для оценки уровня искусственного интеллекта, приближённого к человеческому мышлению. Его невозможно пройти просто доставая информации из интернета или памяти без настоящего логического мышления. К этому экзамену нельзя заранее подготвиться.

Название является шуткой обыгрывающей то, что если ИИ его пройдёт - то человечество больше не нужно. Или не совсем шуткой. Когда ИИ достигнет в нём результата близкого к 100% - что это? Правильно, AGI.

Как он устроен: HLE включает в себя вопросы из реальных школьных, университетских и олимпиадных тестов, которые требуют логики, интуиции, обобщения и многоступенчатого рассуждения. Чтобы модели нельзя было натренировать, тест изолирован от «натаскивания», как это бывает с популярными экзаменами вроде SAT, GRE и т. д.

Почему это важно для AGI: Если ИИ хорошо справляется с HLE — это признак приближения к General Intelligence, а не просто хорошо адаптированный к тесту fine‑tuned болтун. В отличие от стандартных бенчмарков, HLE проверяет глубину понимания, а не натренированность на датасете.

Что это такое: ARC-AGI (или ARC-Challenge) — это бенчмарк из серии Abstraction and Reasoning Corpus, разработанный для оценки способности ИИ к абстрактному мышлению, переносу знаний и решению задач без обучения на примерах.

Как он устроен: Каждая задача — это набор input‑output примеров: ИИ видит лишь несколько пар «вход‑выход», а затем

происшествия спорт общество самит Илон Маск

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Thinking Machines Lab пока не выпустила ни одного продукта, но уже привлекла $2 млрд венчурного капитала habr.com / 11 месяцев назад

Grok 4 встал на путь исправления — больше никаких ссылок на мнение своего «хозяина» habr.com / 11 месяцев назад

В Grok добавили аниме-компаньоншу — пользователи шутят, что «AGI наступил» habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

19.07 / 04:25

продукты СМИ история финансирование google Для использования стал доступен российский сервис «Мультисканер» для проверки файлов на вредоносносы — аналог VirusTotal

Российский сервис «Мультисканер» для проверки файлов на вредоносное ПО снова стал доступен для использования. Загружать файлы можно и без авторизации в системе. История запросов сохраняется, но её можно стереть, удалив данные сайта через браузер. Максимальный размер загружаемого файла — 256 МБ (в тесте файл размером 120 МБ завис на загрузке 50%), поддерживаются более 30 форматов файлов, включая .doc, .docx, .exe, .pdf, .pptx и .zip.

19.07 / 03:45

технологии Nvidia Вышло обновление утилиты HWMonitor 1.65

В середине июля 2026 года состоялся выпуск обновления HWMonitor 1.65 — freeware утилиты для мониторинга компонентов ПК на ОС Windows. Разработка проекта ведётся более 16 лет. Обновление HWMonitor 1.60 опубликовали в октябре 2025 года. Версия HWMonitor 1.61 вышла в декабре 2025 года. Сборку HWMonitor 1.62 представили в феврале 2026 года. Версия HWMonitor 1.63 вышла в апреле 2026 года. Обновление HWMonitor 1.64 вышло в июне 2026 года.

19.07 / 03:01

экспедиция интересное животный мир Жил 110 миллионов лет назад: австралийские ученые нашли коготь огромного плотоядного динозавра

Теперь ученым придется разгадать палеонтологическую загадку

19.07 / 02:38

люди ученые общество БПЛА животный мир Война объявлена – инженеры создали дрон-убийцу комаров

Инженеры представили инновационного автономного дрона, который «вычисляет» комаров по звуку взмаха крыльев и уничтожает их с высокой точностью.

19.07 / 01:47

ученые животные наука общество Знаменитости Главный миф об облике и жизни тираннозавра разрушили ученые

Палеонтологи полностью пересмотрели скорость взросления знаменитого тираннозавра. Выяснилось, что этот хищник рос почти до сорока лет.

19.07 / 00:48

продукты медицина продукты питания Здоровье и красота лекарства Дешевая зелень из магазина может спасти от тяжести в желудке

Исследования подтвердили, что обычная мята не просто украшает летние блюда, но и эффективно помогает пищеварению, снижает стресс и повышает тонус.

18.07 / 23:30

здоровье общество человек Здоровье и красота врачи Привычки, которые незаметно ускоряют старение организма, назвали врачи

Многие совершают эти ошибки ежедневно, не подозревая, что они постепенно приближают старость.

18.07 / 22:37

люди здоровье общество мозг возраст Какая привычка убережет от слабоумия людей в возрасте

Врачи уверяют, что есть простой способ существенно снизить риски болезни Альцгеймера.

18.07 / 22:17

технологии Apple Релиз инструмента для работы с MKV-файлами MKVToolNix 100.0

В июле 2026 года состоялся стабильный релиз инструмента для работы с MKV‑файлами MKVToolNix 100.0 под кодовым названием «Do Hot Girls Like Chords». Предыдущая версия проекта вышла в мае 2026 года.

18.07 / 22:17

технологии Apache крипто Вышло обновление FreeRDP 3.29 с 22 патчами безопасности

14 июля 2026 года состоялся выпуск открытого проекта FreeRDP 3.29. Это реализация протокола удалённого рабочего стола Microsoft (Remote Desktop Protocol — RDP), опубликованная на GitHub под лицензией Apache License 2.0. Исходный код проекта написан на С и С++. Разработка решения ведётся более 15 лет. Стабильная версия FreeRDP 3.20 вышла в декабре 2025 года.

Лента новостей

На главную страницу