5 мин. чтения
9/22/2023 6:00:01 AM

Интеллектуальный динамик позволяет пользователям отключить звук в различных областях комнаты

Article Preview Image Команда, возглавляемая исследователями из Университета Вашингтона, разработала умный динамик, изменяющий форму, который использует самостоятельные микрофоны для разделения комнат на речевые зоны и отслеживать положение отдельных ораторов.Здесь рой роботов показан на его зарядной станции, которую роботы могут вернуться к автоматическому.Кредит: Апрель Хонг/Вашингтонский университет

Например, способность найти и контролировать звук - изолировать одного человека, говорящего из определенного места в переполненной комнате - вызов исследователей, особенно без визуальных сигналов из камер.

Команда, возглавляемая исследователями из Университета Вашингтона, разработала умный динамик, изменяющий форму, который использует самостоятельные микрофоны для разделения комнат на речевые зоны и отслеживать позиции отдельных ораторов.С помощью алгоритмов глубокого обучения команды система позволяет пользователям отключить определенные области или отдельные одновременные LRNч, даже если у двух соседних людей есть похожие голоса.

Как флот комнат, каждый в дюйме в диаметре, микрофоны автоматически развертываются, а затем возвращаются на зарядную станцию.Это позволяет перемещать систему между средами и автоматически настраиваться.Например, на собрании конференц-зала такую систему может быть развернута вместо центрального микрофона, что позволяет лучше контролировать аудио.

Команда опубликовала свои выводы в природе.

«Если я закрываю глаза и 10 человек разговаривают в комнате, я понятия не имею, кто говорит, что и где они находятся в комнате.Технология »,-сказал автор соавторства Малек Итани, докторант UW в Школе компьютерных наук и инженерии Пола Г. Аллена.«Впервые, используя то, что мы называем роботизированным« акустическим рой », мы можем отслеживать позиции нескольких людей, разговаривающих в комнате и отделить свою речь».

Предыдущее исследование робота Swarms потребовало использования камер накладных расходов или камер, проекторов или специальных поверхностей.Система команды UW является первой, которая точно распространяет рой робота, используя только звук.

Прототип команды состоит из семи маленьких роботов, которые распространяются по столам разных размеров.По мере того, как они переходят от своего зарядного устройства, каждый робот издает высокочастотный звук, например, летучая мышь, используя эту частоту и другие датчики, чтобы избежать препятствий и перемещаться, не падая со стола.

Автоматическое развертывание позволяет роботам поместить себя для максимальной точности, позволяя большему управлению звуковым управлением, чем если бы человек установил их.Роботы рассеиваются как можно дальше друг от друга, так как большие расстояния облегчают дифференцированные и локальные люди, говорящие.У современных потребительских умных динамиков есть несколько микрофонов, но складывались на одном и том же устройстве, они слишком близки, чтобы позволить немому и активным зонам этой системы.

«Если у меня есть один микрофон в футе от меня, и еще один микрофон в двух футах, мой голос приедет к микрофону, который сначала находится в футе. Если кто -то еще ближе к микрофону, который находится в двух футах, их голос прибудет туда.Во-первых,-сказал автор соавтора Туочао Чен, докторант UW в школе Аллена.

«Мы разработали нейронные сети, которые используют эти затраченные по времени сигналы, чтобы отделить то, что говорит каждый человек, и отслеживать свои позиции в пространстве. Таким образомкомната.”

Команда проверила роботов в офисах, жилых комнатах и кухнях с группами из трех до пяти человек.Во всех этих средах система может различать различные голоса в пределах 1,6 фута (50 сантиметров) друг от друга 90% случаев без предварительной информации о количестве динамиков.Система смогла обработать три секунды звука за 1,82 секунды в среднем-достаточно быстрой для трансляции в прямом эфире, хотя и слишком долго для общения в реальном времени, таких как видеозвонки.

Исследователи говорят, что по мере развития технологии акустические рои могут быть развернуты в умных домах, чтобы лучше дифференцировать людей, разговаривающих с умными ораторами.Это потенциально может позволить только людям, сидящим на диване, в «активной зоне», например, управлять телевизором.

Исследователи планируют в конечном итоге сделать роботы микрофона, которые могут перемещаться по комнатам, а не ограничивать таблицы.Команда также исследует, могут ли динамики излучать звуки, которые позволяют реально немому и активным зонам, поэтому люди в разных частях комнаты могут слышать различный звук.Текущее исследование является еще одним шагом к научно -фантастическим технологиям, таким как «конус молчания» в «Get Smart» и «Dune», пишут авторы.

Конечно, любая технология, которая вызывает сравнение с вымышленными шпионскими инструментами, поднимает вопросы конфиденциальности.Исследователи признают потенциал для неправильного использования, поэтому они включали охранников против этого: микрофоны перемещаются со звуком, а не в бортовой камере, как другие подобные системы.

Роботы легко видны, и их свет моргает, когда они активны.Вместо того, чтобы обрабатывать звук в облаке, как это делают большинство умных динамиков, акустические рой обрабатывают все аудио локально, как ограничение конфиденциальности.И хотя первые мысли некоторых людей могут быть о наблюдении, система может быть использована для обратного, говорит команда.

«У него есть потенциал, чтобы на самом деле пользоваться конфиденциальностью, помимо того, что позволяют текущие умные динамики», - сказал Итани.«Я могу сказать:« Не записывай ничего вокруг моего стола », и наша система создаст пузырь три фута вокруг меня. Ничто в этом пузыре не будет записано. Или две группы говорят рядом друг с другом, и одна группа имеетЧастный LRNч, в то время как другая группа записывается, один LRNч может находиться в отключенной зоне, и она останется частной ».

Такуя Йошиока, главный менеджер по исследованиям в Microsoft, является соавтором в этом документе, а Shyam Gollakota, профессор школы Allen, является старшим автором.

Больше информации: Создание речевых зон с использованием самораспределяющихся акустических рой, природная связь (2023).Doi: 10.1038/s41467-023-40869-8.www.nature.com/articles/s41467-023-40869-8 🔗

Получи бесплатную еженедельную рассылку со ссылками на репозитории и лонгриды самых интересных историй о стартапах 🚀, AI технологиях 👩‍💻 и программировании 💻!
Присоединяйся к тысячам читателей для получения одного еженедельного письма

Подписывайся на нас:

Нашли ошибку в тексте? Напишите нам.

Добавляй ЛРНЧ в свою ленту Google Новостей.
Читайте далее 📖

Диск размером с DVD, который может хранить 1 миллион фильмов

2/23/2024 · 5 мин. чтения

Диск размером с DVD, который может хранить 1 миллион фильмов

Новые структурные идеи могут привести к механическому улучшению сплавов

2/23/2024 · 5 мин. чтения

Новые структурные идеи могут привести к механическому улучшению сплавов