Новая модель искусственного интеллекта DeepMind помогает роботам складывать оригами
С момента своего дебюта в конце прошлого года Gemini 2.0 стал основой для нескольких Google продукты, включая новый чатбот под названием AI Mode. Теперь Google DeepMind использует ту же технологию для чего-то немного более интересного. В среду лаборатория искусственного интеллекта было объявлено две новые модели на базе Gemini, которые, по словам компании, «заложат основу для нового поколения полезных роботов».
Первая, Gemini Robotics, была разработана DeepMind для упрощения прямого управления роботами. По словам компании, системы ИИ для роботов должны обладать тремя качествами: универсальностью, интерактивностью и ловкостью.
Первая подразумевает гибкость робота, позволяющую ему адаптироваться к новым ситуациям, включая те, которые не были охвачены его обучением. Интерактивность — это способность робота реагировать на людей и окружающую среду. Наконец, ловкость, которая в основном говорит сама за себя: многие задачи, которые люди могут выполнять, не задумываясь, требуют мелкой моторики, которую роботам трудно освоить.
«Хотя наша предыдущая работа продемонстрировала прогресс в этих областях, Gemini Robotics представляет собой значительный скачок вперед в производительности по всем трем осям, приближая нас к созданию по-настоящему универсальных роботов», — говорят в DeepMind.
Например, Gemini Robotics позволила роботу ALOHA 2 от DeepMind складывать оригами и запечатывать пакеты Ziploc. Двурукий робот также понимает все инструкции, данные ему на естественном, повседневном языке. Как видно из видео, предоставленного Google, он может даже выполнять задачи, несмотря на препятствия, например, когда исследователь перемещается вокруг контейнера Tupperware, в который он только что попросил робота положить фрукты.
