



ИИ-система Locus превзошла экспертов в научных исследованиях
Intology анонсировала Locus, систему «искусственного учёного», которая по предварительным результатам обходит человеческих исследователей, и это не просто хайп. На бенчмарке RE‑Bench, под равными временными и вычислительными ресурсами, Locus показывает результаты выше, чем лучшие специалисты в области ИИ из ведущих лабораторий.
Locus также устанавливает SOTA‑результаты на KernelBench и MLE‑Bench Lite, что говорит о её универсальности и способности решать сложные научные задачи. Инновация заключается именно в длительном горизонте работы. В отличие от других систем, Locus может постоянно улучшаться на протяжении нескольких дней, одновременно запускает тысячи экспериментов и проводит структурированный научный поиск.
RE‑Bench - это набор задач, имитирующих передовую исследовательскую работу в ИИ, например, восстановление испорченных моделей, предсказание оптимальных конфигураций или проектирование архитектур с необычными ограничениями. За непрерывный 64‑часовой запуск Locus набрал 1.30 балла, тогда как человеческие эксперты показали 1.27, что подчёркивает конкурентоспособность ИИ в исследовательской деятельности.
Кроме этого, Locus продемонстрировал впечатляющие результаты в оптимизации ядер. На KernelBench система ускорила вычисления до 100× в некоторых сценариях, например, при работе с LayerNorm. В ходе этих экспериментов Locus использовал продвинутые оптимизации - асинхронные копии, группирование потоков и векторизацию, чтобы максимально эффективно работать на GPU типа NVIDIA H100.
На MLE‑Bench Lite Locus также впечатлил: решая задачи машинного обучения (обработка данных, выбор признаков, обучение моделей), модель заработала медали в 77% соревнований Kaggle, превзойдя предыдущий рекорд, установленный Microsoft.
Ещё одна
Читать на habr.com