Руки помощи направляют роботов в процессе обучения: инженеры совершенствуют методику обучения роботов для совместной работы посредством демонстрации.

Инженер Rice Марсия О’Мэлли и аспирант Дилан Лоузи усовершенствовали личный метод обучения роботов, применяя мягкую физическую обратную сообщение с машинами в течении выполнения ими задач. Цель пребывает в том, чтобы упростить обучение роботов, каковые должны действенно трудиться совместно c людьми.

Документ об их изучении размещён в IEEE Explore.«Исторически роль роботов заключалась в том, чтобы брать на себя рутинные задачи, каковые мы не хотим делать: производство, сборочные линии, сварка, покраска», — сказал О’Мэлли, профессор машиностроения, электротехники, вычислительной техники и информатики. . «По мере того, как мы становимся более склонными делиться личной информацией с разработками, например, как мои часы регистрируют, сколько шагов я делаю, эта разработка также переходит на встроенное оборудование.«Роботы уже находятся в отечественных строениях, пылесосят, реализовывают контроль отечественные термостаты или стригут газон», — сказала она. «Имеется самые разные способы, которыми разработки пронизывают нашу жизнь. Я уже говорю с Алекса на кухне, так почему бы не иметь еще машины, с которыми мы можем физически сотрудничать?

Большая часть отечественной работы содержится в безопасности робота человека и обеспечении взаимодействия».По словам исследователей, роботы, адаптированные к реакции на физическое взаимодействие и робота человека (pHRI), традиционно рассматривают такие сотрудничества как нарушения и возвращаются к собственному начальному поведению, в то время, в то время, когда сотрудничества заканчиваются. Исследователи Райса усовершенствовали pHRI при помощи метода, что разрешает людям физически корректировать траекторию робота в настоящем времени.В базе программы лежит концепция контроля импеданса, фактически способ руководить тем, что происходит, в то время, в то время, когда дело доходит до столкновения.

Робот, что разрешает руководить импедансом при помощи физического входа, корректирует собственную запрограммированную траекторию, чтобы реагировать, но возвращается к собственной исходной траектории, в то время, в то время, когда вход заканчивается.Способ Райса основан на данной концепции, вследствие того что он разрешает роботу корректировать личный путь за пределами ввода и вычислять новый маршрут к собственной цели, что-то наподобие совокупности GPS, которая пересчитывает маршрут к месту назначения, в то время, в то время, когда водитель пропускает поворот.

Лоузи совершил большую часть прошлого лета в лаборатории Анки Драган, доцента электротехники и компьютерных наук Калифорнийского университета в Беркли, осуществляя контроль теорию. Он и другие студенты обучили руку и руку робота доставить чашку кофе по столу, а затем использовали улучшенный pHRI, чтобы держать ее подальше от компьютерной клавиатуры и достаточно низко, чтобы чашка не разбилась при падении. (Отдельная статья об опытах размещена в Proceedings of Machine Learning Research.)

Цель была в том, дабы деформировать запрограммированную траекторию робота при помощи физического сотрудничества. «Тут у робота имеется план или желаемая траектория, которая обрисовывает, как, в соответствии с его мнению, робот обязан делать задачу», — написал Лоузи в эссе об опытах в Беркли. «Мы представили способ настоящего времени, что поменял или деформировал будущую желаемую траекторию робота».В режиме импеданса робот последовательно возвращался к собственной исходной траектории по окончании сотрудничества.

В режиме обучения обратная сообщение поменяла не только состояние робота в течении сотрудничества, но да да и то, как он продвигался к цели, сказал Лоузи. К примеру, если пользователь укажет ему, чтобы чашка не проходила над клавиатурой, это не будет прекращаться и в будущем. «Способом перепланирования желаемой траектории робота по окончании каждого нового наблюдения робот имел возможность генерировать поведение, которое соответствует предпочтениям человека», — сказал он.В грядущих тестах учавствовали 10 учеников Райс, каковые использовали реабилитационного робота с обратной связью по силе, OpenWrist лаборатории О’Мэлли, чтобы руководить курсором около препятствий на экране компьютера и приземляться на голубой точку. В тестах вначале употреблялся простой контроль импеданса, а затем контроль импеданса с физически интерактивной деформацией траектории, аналог pHRI, что разрешал студентам обучать устройство изучению новых траекторий.

Результаты показали, что опробования с деформацией траектории были физически несложнее и "настойчиво попросили" значительно меньшего сотрудничества для достижения цели. Испытания показали, что сотрудничества смогут программировать свободных роботов, каковые имеют пара степеней свободы, в этом случае сгибая руку и вращая запястье.Одним из текущих ограничений имеется то, что pHRI еще не может поменять время, которое требуется роботу для выполнения задачи, но это входит в повестку дня команды Райса.«Смена парадигмы в данной работе содержится в том, что вместо того, чтобы рассматривать человека как случайное нарушение, робот обязан относиться к человеку как к разумному существу, у которого имеется событие для сотрудничества и которое пробует передать что-то важное», — сказал Лоузи. «Робот не должен уйти с дороги.

Он обязан осознавать, что происходит, и лучше делать собственную работу».


Портал обо всем