В DeepMind научили роборуки чинить роботов
Исследователи из Google DeepMind представили метод обучения, который позволил им обучить робота выполнять такие действия, как завязывание шнурков, подвешивание рубашек и даже починку других роботов.
Исследователи применили обучающую платформу ALOHA Unleashed и собственную программу моделирования DemoStart, которая позволяет роботам обучаться в процессе наблюдения за людьми.
Исследование команды DeepMind в первую очередь демонстрирует, как роботы учатся выполнять сложные задачи на визуальных демонстрациях. ALOHA Unleashed помогает им учиться выполнять сложные и новые задачи по манипуляции двумя руками; DemoStart же использует моделирование для улучшения реальных характеристик роботизированной руки с несколькими пальцами.
До сих пор большинство передовых роботов с искусственным интеллектом способны лишь поднимать и размещать предметы и делать это только с помощью одной руки.
Метод ALOHA Unleashed основан на платформе ALOHA 2, которая представляет собой доработку недорогой аппаратной системы с открытым исходным кодом для двуручного телеуправления, разработанной в Стэнфордском университете.
Сначала исследователи собрали демонстрационные данные, удалённо управляя поведением робота при выполнении сложных задач. Затем они применили метод диффузии, предсказывая действия робота по случайному шуму, аналогично тому, как модель Imagen генерирует изображения.
DemoStart использует алгоритм обучения с подкреплением, чтобы помочь роботам в симуляциях. Сначала модель учится на простых действиях, а со временем начинает осваивать более сложные. Ей требуется в 100 раз меньше смоделированных демонстраций, чтобы научиться решать задачу в симуляции.
Робот достиг показателя успешности более 98% в ряде различных задач, включая переориентацию кубиков
Читать на habr.com

