Калифорнийский университет в Беркли демонстрирует ускоренное обучение, которое ставит роботов на ноги за считанные минуты

Роботы, использующие ИИ для изучения новой задачи, обычно требуют трудоемкого и повторяющегося процесса обучения. Исследователи Калифорнийского университета в Беркли пытаются упростить и сократить этот процесс с помощью инновационной методики обучения, в которой робот заполняет пробелы, а не начинает с нуля.

Команда поделилась несколькими направлениями работы с TechCrunch, чтобы показать их на TC Sessions: Robotics сегодня, и в видео ниже вы можете услышать о них - сначала от исследователя Калифорнийского университета в Беркли Стивена Джеймса.

«Техника, которую мы используем, представляет собой своего рода настройку контрастного обучения, когда она берет видео на YouTube и как бы исправляет множество областей, и идея состоит в том, что затем робот пытается реконструировать этот образ, - объяснил Джеймс.«Он должен понять, что может быть в этих пятнах, чтобы затем сгенерировать идею о том, что может быть за ними; он должен получить действительно хорошее представление о том, что происходит в мире».

Конечно, нельзя чему-то научиться, просто просматривая YouTube, как это обычно бывает в человеческом мире. Операторы должны перемещать самого робота либо физически, либо с помощью контроллера виртуальной реальности, чтобы дать ему общее представление о том, что он пытается сделать. Он сочетает эту информацию с более широким пониманием мира, полученным из заполнения видеоизображений, и в конечном итоге может интегрировать также многие другие источники.

Подход уже дает результаты, Джеймс сказал: «Обычно иногда для выполнения новой задачи могут потребоваться сотни демонстраций, тогда как сейчас мы можем дать несколько демонстраций, может быть, 10, и он может выполнить задачу..”

Алехандро Эсконтрела специализируется на разработке моделей, которые извлекают соответствующие данные из видео на YouTube, такие как движения животных, людей или других роботов. Робот использует эти модели, чтобы информировать о своем поведении, оценивая, похоже ли данное движение на то, что ему следует попробовать.

В конечном итоге он пытается воспроизвести движения из видео таким образом, что другая модель, наблюдающая за ними, не может сказать, гоняется ли за мячом робот или настоящая немецкая овчарка.

Интересно, что многие подобные роботы сначала учатся в среде моделирования, проверяя движения по существу в виртуальной реальности. Но, как объясняет Данияр Хафнер, процессы стали достаточно эффективными, чтобы можно было пропустить этот тест, позволив роботу возиться в реальном мире и учиться вживую на таких взаимодействиях, как ходьба, спотыкание и, конечно же, толчки. Преимущество здесь в том, что он может учиться во время работы, а не возвращаться к симулятору для интеграции новой информации, что еще больше упрощает задачу.

«Я думаю, что святой Грааль обучения роботов - научиться как можно большему в реальном мире и как можно быстрее», - сказал Хафнер. Они определенно движутся к этой цели. Полное видео работы команды смотрите здесь.