Использование подкрепления с рисунком для обучения роботов для выполнения простых задач в широких условиях
Развертывание в среде на открытом воздухе.Кредит: Илия Радозавов
За последние несколько лет роботисты использовали различные методы для обучения роботов для эффективного и быстрого движения в различных средах.Но, как примечают исследователи с этим новым усилием, такие роботы не имеют очень много полезных приложений.Они предполагают, что роботы, способные выполнять обыденные задачи медленным, но эффективным образом, были бы гораздо более полезными.С этой целью они обратились к обучению подкреплению симуляции.
Техника включает в себя обучение моделируемой версии робота для выполнения желаемых задач, подвергая ее миллиардам примеров в моделируемых средах.Метод также включает в себя использование системы вознаграждения/штрафов в рамках обучения робота - если он делает что -то правильно, поскольку он пытается достичь цели, он вознаграждается, например, получение «1».Однако, если это делает что-то не так, он получает «-1».Со временем он улучшает свою производительность, поскольку стремится увеличить свой счет вознаграждений.
Исследовательская группа использовала подход к обучению робота под названием Digit для проведения пути по тротуару в неизвестной части города и восстановления после неоднократного нападения на большой мяч, чтобы преодолеть физическую сдержанность, чтобы пройти через материалы, которые могутПолучите его поездку, носить рюкзак, нести мешок с мусором в мусорное ведро и использовать сумку, чтобы носить личные вещи.
Исследователи предполагают, что обучение подкреплению с рисованием может быть использовано для обучения роботов в реальных условиях, таких как дом, офис или фабричный этаж.Идея, они отмечают, состоит в том, чтобы сделать роботов более полезными.
Больше информации: Ilija radosavovic et al., Реальная гуманоидная локомоция с обучением подкреплением, научной робототехникой (2024).Doi: 10.1126/scirobotics.adi9579
Нашли ошибку в тексте? Напишите нам.