4 мин. чтения
5/3/2024 6:00:02 AM

Random Robots: новый алгоритм ИИ для роботов последовательно превосходит современные системы

Article Preview Image Хотя текущее исследование проверяло алгоритм ИИ только на моделируемых роботах, исследователи разработали Noodlebot для будущего тестирования алгоритма в реальном мире.Кредит: Северо -Западный университет

Успех алгоритма, называемый максимальным диффузионным подкреплением (Maxdiff RL), заключается в его способности поощрять роботов к как можно случайно исследовать свои среды, чтобы получить разнообразный набор опыта.

Эта «спроектированная случайность» улучшает качество данных, которые собирают роботы в отношении их собственного окружения.И, используя более качественные данные, моделируемые роботы продемонстрировали более быстрое и более эффективное обучение, повышая их общую надежность и производительность.

При тестировании на другие платформы ИИ моделируемые роботы, использующие новый алгоритм Северо-Западного, последовательно превосходили современные модели.На самом деле новый алгоритм работает так хорошо, что роботы выучили новые задачи, а затем успешно выполнили их в течение одной попытки - с первого раза справились с ними.Это резко контрастирует с современными моделями ИИ, которые обеспечивают более медленное обучение посредством проб и ошибок.

Исследование под названием «Maximum Diffusion Areffusion Learning Learning» опубликовано в журнале Nature Machine Intelligence.

«Другие рамки ИИ могут быть несколько ненадежными», - сказал Томас Берруэта из Северо -Запада, который руководил исследованием.«Иногда они полностью придумывают задачу, но в других случаях они полностью потерпят неудачу. С нашими рамками, если робот способен вообще решать задачу, каждый раз, когда вы включаете робота, вы можете ожидать, что он будет делатьИменно то, что его просили сделать.

Берруэта является президентом на северо -западе и доктор философии.Кандидат в области машиностроения в Школе технического инженера Маккормика.Эксперт по робототехнике Тодд Мерфи, профессор машиностроения в Маккормике и советнике Берруты, является старшим автором газеты.Берруэта и Мерфи в соавторстве в статье с Эллисон Пиноски, также доктор философии.Кандидат в лаборатории Мерфи.

Чтобы обучить алгоритмы машинного обучения, исследователи и разработчики используют большое количество больших данных, которые люди тщательно фильтруют и курируют.ИИ учится из этих учебных данных, используя пробные и ошибки, пока не достигнет оптимальных результатов.

В то время как этот процесс хорошо работает для бестелесных систем, таких как Chatgpt и Google Gemini (ранее Bard), он не работает для воплощенных систем ИИ, таких как роботы.Вместо этого роботы сами собирают данные - без роскоши кураторов человека.

«Традиционные алгоритмы не совместимы с робототехникой двумя различными способами», - сказал Мерфи.

«Во -первых, бестелесные системы могут воспользоваться миром, в котором физические законы не применяются. Во -вторых, индивидуальные сбои не имеют никаких последствий. Для применений в области информатики единственное, что важно, это то, что он преуспевает в большинстве случаев. В робототехнике одна неудачаможет быть катастрофическим “.

Чтобы решить это разъединение, Берруэта, Мерфи и Пиноски стремились разработать новый алгоритм, который гарантирует, что роботы будут собирать высококачественные данные на ходу.

По своей сути, Maxdiff RL командует роботами, чтобы двигаться более случайным образом, чтобы собрать тщательные, разнообразные данные об их средах.Учившись с помощью самостоятельного случайного опыта, роботы приобретают необходимые навыки для выполнения полезных задач.

Чтобы проверить новый алгоритм, исследователи сравнили его с современными современными моделями.Используя компьютерное моделирование, исследователи попросили моделируемых роботов выполнить серию стандартных задач.По всем направлениям роботы, использующие Maxdiff RL, учились быстрее, чем другие модели.Они также правильно выполняли задачи гораздо более последовательно и надежно, чем другие.

Возможно, еще более впечатляет: роботы, использующие метод Maxdiff RL, часто преуспели в правильном выполнении задачи за одну попытку.И это даже когда они начали без знаний.

«Наши роботы были быстрее и более гибкими - способными эффективно обобщать то, что они изучили, и применять его к новым ситуациям», - сказала Берруэта.«Для реальных приложений, где роботы не могут позволить себе бесконечное время для проб и ошибок, это огромное преимущество».

Поскольку MaxDiff RL является общим алгоритмом, его можно использовать для различных приложений.Исследователи надеются, что это решат основополагающие проблемы, сдерживающие поле, в конечном итоге прокладывая путь к надежному принятию решений в интеллектуальной робототехнике.

«Это не должно использоваться только для роботизированных транспортных средств, которые перемещаются», - сказал Пиноски.«Он также может быть использован для стационарных роботов, таких как роботизированная рука на кухне, которая узнает, как загрузить посудомоечную машину. По мере того, как задачи и физическая среда становятся более сложными, роль воплощения становится еще более важной для рассмотрения во время учебного процесса.Это важный шаг к реальным системам, которые выполняют более сложные, более интересные задачи ».

Больше информации: Максимальное обучение диффузионного усиления, интеллект природы (2024).Doi: 10.1038/s42256-024-00829-3

Получи бесплатную еженедельную рассылку со ссылками на репозитории и лонгриды самых интересных историй о стартапах 🚀, AI технологиях 👩‍💻 и программировании 💻!
Присоединяйся к тысячам читателей для получения одного еженедельного письма

Подписывайся на нас:

Нашли ошибку в тексте? Напишите нам.

Добавляй ЛРНЧ в свою ленту Google Новостей.
Читайте далее 📖

DeepMind разрабатывает робота, который может играть в любительском уровне пинг-понг

8/10/2024 · 4 мин. чтения

DeepMind разрабатывает робота, который может играть в любительском уровне пинг-понг

Пикотаур - непревзойденный микроробот

8/10/2024 · 4 мин. чтения

Пикотаур - непревзойденный микроробот

*Facebook, Instagram, Meta - запрещенные в РФ организации.