ChatGPT обучает роботов уборке в квартире
Предоставлено: Ву и др.
Разные люди, как правило, имеют уникальные потребности и предпочтения, особенно когда речь идет об уборке. Домашние роботы, особенно роботы, предназначенные для помощи людям в домашних делах, в идеале должны быть в состоянии выполнять задачи таким образом, чтобы учитывать эти индивидуальные предпочтения.
Исследователи из Принстонского университета и Стэнфордского университета недавно решили персонализировать помощь, предлагаемую домашними роботами, используя большие языковые модели (LLM), класс моделей искусственного интеллекта, которые становятся все более популярными после выпуска ChatGPT. Их подход, представленный в статье, предварительно опубликованной на arXiv, был первоначально протестирован на мобильном роботе под названием TidyBot, разработанном для уборки помещений.
«Чтобы робот мог эффективно персонализировать физическую помощь, он должен изучить пользовательские предпочтения, которые могут быть повторно применены к будущим сценариям», — пишут Джимми Ву, Рика Антонова и их коллеги в своей статье.
Подход, предложенный исследователями, использует широко задокументированные возможности обобщения LLM, таких как ChatGPT. Эти модели могут обобщать информацию или предоставлять обобщенные рекомендации после обучения на относительно небольших наборах данных или примерах сценариев.
В рамках своего исследования ученые использовали LLM для создания меток предпочтений пользователя, основанных на нескольких входных данных, предлагаемых пользователями. Например, пользователь может написать промпт, такой как «Красная цветная одежда идет в ящик, а белая — в шкаф», и модель сформулирует обобщенные предпочтения, которые затем могут направлять действия робота.
«Ключевая проблема заключается в определении правильного места для размещения каждого объекта, поскольку предпочтения людей могут сильно различаться в зависимости от личного вкуса или культурного происхождения», — объяснили Ву, Антонова и их коллеги в своей статье.
«Например, один человек может предпочесть хранить рубашки в ящике, а другой — на полке. Мы стремимся создать системы, которые могут изучать такие предпочтения на нескольких примерах через предыдущие взаимодействия с конкретным человеком. Мы показываем, что роботы могут сочетать языковое планирование и восприятие с возможностями обобщения больших языковых моделей (LLM) для вывода обобщенных пользовательских предпочтений, которые широко применимы к будущим взаимодействиям. ”
Чтобы оценить свой подход, исследователи провели серию тестов, оценивая как обобщенные предпочтения, которые он производил при подаче данных из текстовых наборов данных, так и то, как он влиял на способность реального робота приводить себя в порядок персонализированными способами. Они специально применили его к TidyBot, роботу, которого они разработали, который моет пол, а также подбирает случайные объекты в его окружении и размещает их в определенных местах.
«Этот подход обеспечивает быструю адаптацию и достигает точности 91,2% на невидимых объектах в нашем эталонном наборе данных», — пишут Ву, Антонова и их коллеги.
Предложенный исследователями подход на основе LLM и робот TidyBot, который они разработали, вскоре также могут способствовать созданию все более совершенных домашних роботов, которые могут выполнять работу по дому и убирать окружающую среду способами, которые соответствуют предпочтениям их пользователей. Дальнейшие исследования также могут развить этот метод и улучшить его производительность, например, позволяя ему лучше работать в сильно загроможденных средах.
«Наша реализация реальной системы содержит упрощения, такие как использование рукописных примитивов манипуляций, использование нисходящих захватов и предположение об известных местоположениях сосудов», — пишут исследователи.
«Эти ограничения могут быть устранены путем включения более продвинутых примитивов в нашу систему и расширения возможностей системы восприятия. Кроме того, поскольку мобильные роботы не могут ездить по объектам, система не будет хорошо работать в чрезмерном беспорядке. Было бы интересно включить более продвинутое высокоуровневое планирование, чтобы вместо того, чтобы всегда подбирать ближайший объект, робот мог рассуждать о том, нужно ли ему сначала расчистить себе путь, чтобы пройти через беспорядок».
Создай свой умный дом и обучи робота убирать квартиру 🔗
Оригинал статьи: Jimmy Wu et al, TidyBot: Personalized Robot Assistance with Large Language Models, arXiv (2023).
Нашли ошибку в тексте? Напишите нам.