Инженер Spotlight: Д-р Tin Lun Lam от NXROBO о сложностях проектирования домашних роботов
Генеральный директор NXROBO Д-р Тин Лун Лам поговорил со Стивом Араром из AAC о трудностях процесса проектирования, машинного обучения и о том, как создать эффективную команду инженеров. Гонконгский NXROBO недавно дебютировал с роботизированным дворецким BIG-i.
На протяжении многих лет на горизонте скрываются домашние роботы. BIG-i - последний вклад NXROBO в эту отрасль, домашний робот, который может взаимодействовать с членами семьи и умными устройствами.
Робот использует пользовательскую операционную систему, разработанную NXROBO для анализа голосовых команд и визуальных сигналов. Робот, который в настоящее время говорит только по-английски и по-китайски, запрограммирован с помощью голосовых команд типа «если-то-тогда-то». Например, родители могут определить различные условные ситуации, такие как «Если вы увидите, как Томми хватается за еду, напоминайте ему, чтобы мыть руки». В результате с одним предложением пользователи могут создавать пользовательские функции.
BIG-i использует широкий спектр датчиков для достижения разных целей. Некоторые из этих датчиков, таких как датчики наклона и датчики препятствий, используются для предотвращения падения или столкновения робота с препятствиями. Другие датчики контролируют параметры окружающей среды, такие как температура, влажность, давление и свет, а также позволяют разработчикам создавать пользовательские функции.
Чтобы выполнить локализацию звука, BIG-i полагается на микрофонный массив на 360 градусов. Камера RGB-D, размещенная внутри глаза BIG-i, позволяет отслеживать и распознавать объекты, а также создавать 3D-карту. Для управления интеллектуальными устройствами BIG-i использует модули Wi-Fi, Bluetooth и инфракрасные модули. По словам доктора Лама, мягкое тело робота требовало, чтобы все датчики располагались внутри глазного яблока BIG-i.
Интервью с доктором Ламом
Чтобы получить дальнейшее понимание домашних роботов и процесс их дизайна, Стив Арар от AAC переписывался с доктором Ламом, генеральным директором NXROBO. В качестве немного фона доктор Лам имеет докторскую степень по автоматизации и компьютеризированной инженерии из Китайского университета в Гонконге.

BIG-i «глаз». Изображение предоставлено NXROBO
AAC: такие продукты, как BIG-i, еще не достигли популярности, поэтому есть множество проблем, которые нужно преодолеть, и вопросы, которые нужно ответить, когда речь заходит о дизайне. Какова была самая сложная часть проектирования домашнего робота «если-это-то-то». Понимаете ли вы, что можно включить систему искусственного интеллекта, которая позволяет роботам анализировать предложения в любом формате и выполнять задачи на основе собственного обучения?
Доктор Лам: Это одно направление, которое мы отправляем. Но по-прежнему существует множество трудностей для преодоления из-за огромной разницы между человеческим языком и машинным языком. Сравните с последним, человеческий язык гораздо более разнообразен и случайен.

BIG-i в домашней обстановке. Изображение предоставлено NXROBO
AAC: В вашем видео Kickstarter вы используете «Hey BIG-i, если вы слышите странный шум, пожалуйста, проверьте его» в качестве примера применения распознавания команд. Учитывая, что существует так много возможных интерпретаций этого языка, как робот определяет «странный шум»?
Доктор Лам: Теперь у нас есть звуковая библиотека, которая поможет определить «странный шум». Если звук находится на определенной частоте или громче определенного количества децибел, робот будет классифицировать звук как «странный». База данных может быть обновлена, поэтому определение будет становиться все более и более совершенным в будущем.
AAC: Какой совет у вас есть для инженеров, которые разрабатывают собственные продукты, особенно те, которые преследуют crowdfunding для своих проектов?
Доктор Лам: Вы должны найти верного партнера - нет ничего более важного, чем это. Это требует не только установления общей цели для всех, но и поиска партнеров, которые дополняют друг друга, как с точки зрения характера, так и навыков. Вы можете создать правильный продукт только при создании правильной команды.
Что касается crowdfunding, вы должны четко понимать причину, по которой вы начали кампанию. Не отвлекайтесь. Фокус на вашей первоначальной цели, скорее всего, приведет вас к успеху. Вы можете получить помощь от пользователей с открытой связью.
AAC: BIG-i - сложный продукт. Какова была ваша команда и как вы разделили процедуру прототипирования на управляемые подпроекты?
Доктор Лам: Интеллектуальный робот - это один из видов междисциплинарного, высокоинтегрированного продукта. Невозможно завершить процесс разработки, а только овладеть одной областью знаний, поэтому команде R & D понадобятся опытные таланты в каждой конкретной технической области. Между тем, ответственный человек необходим для управления распределением работы, определения схемы, распределения времени и т. Д. Ему необходимо иметь богатый опыт во всех смежных областях, чтобы сделать проект более успешным. Благодаря таким талантам в нашей команде мы смогли эффективно разработать продукт.

Список спецификаций BIG-i - каждая запись в этом списке представляет собой другую задачу дизайна для команды доктора Лама. Изображение предоставлено Kickstarter
AAC: Как вы думаете, сколько времени вам понадобится, чтобы увидеть роботов, которые могут подражать человеческому поведению, например, вылить чашку чая?
Д-р Лам: В определенных условиях технология уже достаточно зрелая, чтобы робот мог вылить чашку чая и сделать подобное. Фактически, промышленные роботы уже выполнили задачи, намного более сложные и точные.
Для роботов, которые работают дома, им приходится сталкиваться с двумя основными проблемами: если робот может подавать чай, как мы можем сделать его совместимым с чашками разных материалов и разных форм? Между тем, если робот может обслуживать чай, это означает, что он обладает определенными спортивными способностями. Мы должны учитывать, может ли эта способность привести к неожиданным последствиям.
AAC: Какие дополнительные функции вы хотели бы интегрировать в будущие итерации BIG-i?
Д-р Лам: Теперь мы делаем BIG-i изучаем новые языки по запросу некоторых партнеров. В будущем BIG-i будет говорить больше языков, чтобы он мог общаться с большим количеством пользователей из разных стран.
Более того, операционная система NXROBO BIG-i позволяет разработчикам свободно разрабатывать приложения, и эти приложения могут создавать различные функции. Например, BIG-i может переводить язык жестов и помогать глухонемым людям общаться. Это также может помочь передать голографические изображения, чтобы вы могли посетить музей, оставаясь дома.
Между тем, мы будем корпорацией с большим количеством сторонних сторон, чтобы добавить такие функции, как интернет-магазины, авиабилеты и бронирование гостиниц.
Спасибо, доктор Лам, за ваше время и знания!
Рекомендуемое изображение, используемое любезно предоставлено NXROBO.