Одной из работ, для которой лучше всего подходят роботы, является утомительная, повторяющаяся задача «взять и разместить», распространенная на складах, но люди все же справляются с ней намного лучше. Исследователи из Калифорнийского университета в Беркли набирают обороты с парой моделей машинного обучения, которые работают вместе, чтобы позволить роботу-манипулятору планировать захват и траекторию всего за миллисекунды.
Людям не нужно много думать о том, как взять предмет и положить его в другое место - это не только то, что мы делаем каждый день годами, но и наши чувства и мозг хорошо адаптированы для задачи. Никто не думает: «А что, если бы я взял чашку, дернул ее очень далеко вверх, потом вбок, потом очень медленно опустил на стол» - пути, по которым мы могли бы перемещать объект, ограничены и обычно довольно эффективны.
Роботы, однако, не обладают здравым смыслом или интуицией. Не имея «очевидного» решения, им необходимо оценить тысячи потенциальных путей для захвата объекта и его перемещения, что включает в себя расчет задействованных сил, потенциальных столкновений, влияет ли это на тип захвата, который следует использовать, и т. д..
Как только робот решит, что делать, он может выполнить его быстро, но это решение требует времени - в лучшем случае несколько секунд, а возможно, и больше, в зависимости от ситуации. К счастью, робототехники из Калифорнийского университета в Беркли придумали решение, которое сокращает время, необходимое для выполнения этой задачи, примерно на 99 процентов.
В системе используются две модели машинного обучения, работающие попеременно. Первый - это быстродействующий генератор потенциальных путей, по которым движется рука робота, на основе множества примеров движений. Он создает множество вариантов, а вторая модель машинного обучения, обученная выбирать лучшие, выбирает из них. Этот путь, однако, имеет тенденцию быть немного неровным и требует точной настройки специальным планировщиком движений, но, поскольку планировщику движений дается «горячий старт» с общей формой пути, который необходимо пройти, его последний штрих это минутная работа.

Диаграмма, показывающая процесс принятия решения - первый агент создает потенциальные пути, а второй выбирает лучший. Третья система оптимизирует выбранный путь.
Если планировщик движений работал сам по себе, обычно на его завершение уходило от 10 до 40 секунд. Однако при горячем старте это редко занимало больше десятой доли секунды.
Однако это лабораторный расчет, а не то, что вы увидите в реальной ситуации на складе. Робот в реальном мире также должен выполнить задачу, которую можно выполнить только очень быстро. Но даже если период планирования движения в реальной среде составляет всего две или три секунды, сокращение его почти до нуля приводит к очень быстрому сложению.
“Каждая секунда на счету. Существующие системы тратят до половины своего времени цикла на планирование движения, поэтому этот метод может значительно ускорить выборку в час», - сказал директор лаборатории и старший автор Кен Голдберг. Он добавил, что правильное восприятие окружающей среды также требует много времени, но оно ускоряется благодаря улучшенным возможностям компьютерного зрения.
Сейчас роботы, занимающиеся сбором и размещением товаров, далеки от эффективности людей, но небольшие улучшения сделают их конкурентоспособными и, в конечном итоге, более чем конкурентоспособными. Работа, выполняемая людьми, опасна и утомительна, но миллионы людей во всем мире выполняют ее, потому что нет другого способа удовлетворить спрос, создаваемый растущей экономикой онлайн-торговли.
Исследование команды опубликовано на этой неделе в журнале Science Robotics.