Улучшение распознавания взаимодействия: сила графика слияния и сближения сверточных сетей
Ученые из Технологического университета Чонцина разработали передовый метод повышения распознавания взаимодействия.Кредит: Хаоцян Ван, Школа искусственного интеллекта, Технологический университет Чунцин.
Распознавание взаимодействия человека играет решающую роль в различных применениях, начиная от усиления интерфейсов человека-компьютеров до улучшения систем наблюдения.Традиционные методы, как правило, зависит от данных RGB, борются с такими проблемами, как изменения освещения и окклюзии, что делает точное распознавание проблемой.
Методы, основанные на скелетах, которые фокусируются на структуре человеческих суставов, обеспечивают многообещающую альтернативу из-за их устойчивости против таких изменений в окружающей среде.
Недавно введенный MS-GCN решает давнюю проблему захвата динамики взаимодействия между несколькими людьми, что часто упускается из виду обычными сетями свертки графиков.Интегрируя свертку графика слияния и рассеяния с иерархическим вниманием и модуль краткосрочной зависимости, MS-GCN превосходит понимание нюансированных отношений между различными частями тела во время взаимодействий.
Инновационные особенности MS-GCN:
Эффективность MS-GCN подчеркивается его производительностью на двух распознанных наборах данных, NTU60 и NTU120, где он достиг современных результатов.Подход был строго подтвержден с помощью обширных экспериментов, демонстрируя его превосходство над существующими методами как в сценариях с двойным человеком, так и в индивидуальном взаимодействии.
Поскольку роботы и системы ИИ все чаще интегрируются в повседневную жизнь, их способность понимать и взаимодействовать с людьми в нюансированном и значимым образом, имеет первостепенное значение.MS-GCN не только продвигает область распознавания действий, но и открывает новые возможности для разработки более интуитивных и отзывчивых систем ИИ.
Это исследование подчеркивает значительный шаг вперед в поисках искусственного интеллекта, который может легко интегрироваться в человеческую среду, предлагая представление о будущем, где цифровые системы могут предвидеть и реагировать на действия человека с беспрецедентной точностью и эффективностью.
More information: Haoqiang Wang et al, Merge-and-Split Graph Convolutional Network for Skeleton-Based Interaction Recognition, Cyborg and Bionic Systems (2024). DOI: 10.34133/cbsystems.0102
Нашли ошибку в тексте? Напишите нам.