3 мин. чтения
5/1/2024 12:00:02 PM

Афроамериканские носители английского языка адаптируют свою речь, чтобы их понимали с помощью голосовых технологий

Article Preview Image Афроамериканские носители английского языка корректируют ставки и высоту на основе аудитории.Кредит: Мишель Кон, Сион Менгеша, Михал Лахав и Кортни Хелдрет

Взаимодействие с голосовыми технологиями, такими как Amazon Alexa, Apple Siri и Google Assistant, может облегчить жизнь, повышая эффективность и производительность. Тем не менее, ошибки в генерации и понимании речи во время взаимодействия являются общими. При использовании этих устройств пользователи часто изменяют свою речь, говорят более громко или исопльзуют и более медленный темп.

Исследования речи, ориентированной на технологии, обычно фокусируются на основных разновидностях английского языка в США, не рассматривая группы ораторов, которые более последовательно неправильно понимают технологии.В Jasa Express Letters исследователи из Google Research, Калифорнийского университета, Дэвиса и Стэнфордского университета хотели устранить этот пробел.

Одной из групп, обычно неправильно понимаемой голосовой технологией, являются люди, которые говорят афроамериканский английский или AAE.Поскольку скорость автоматических ошибок распознавания речи может быть выше для динамиков AAE, может привести к последствию лингвистической дискриминации в технологии.

«Во всех системах автоматического распознавания речи четверо из каждых десяти слов, произнесенных чернокожими людьми, транскрибируются неправильно»,-сказал соавтор Сион Менгеша.«Это влияет на справедливость для афроамериканских носителей английского языка в каждом учреждении с использованием голосовых технологий, включая здравоохранение и занятость».

«Мы увидели возможность лучше понять эту проблему, поговорив с чернокожими пользователями и понимая их эмоциональные, поведенческие и лингвистические реакции при взаимодействии с голосовыми технологиями»,-сказала соавтор Кортни Хелдрет.

Команда разработала эксперимент, чтобы проверить, как ораторы AAE адаптируют свою речь, когда я представлял разговор с голосовым помощником, по сравнению с разговором с другом, членом семьи или незнакомцем.

Исследование проверило знакомых условий речи, ориентированных на человека, незнакомого человека и голосового помощника, сравнивая скорость речи и вариацию высоты тона.Участники исследования включали 19 взрослых, идентифицирующих себя как чернокожих или афроамериканцев, которые сталкивались с проблемами голосовой технологии.

Каждый участник задавал серию вопросов для голосового помощника.Те же вопросы были повторены, как будто разговаривая со знакомым человеком и, опять же, с незнакомцем.Каждый вопрос был записан в общей сложности 153 записи.

Анализ записей показал, что докладчики демонстрировали две постоянные корректировки, когда они разговаривали с голосовой технологией по сравнению с разговором с другим человеком: более медленная скорость речи с меньшим изменением шага (более монотонная речь).

«Эти выводы показывают, что у людей есть умственные модели того, как разговаривать с технологиями»,-сказала соавтор Мишель Кон.«Набор режима», который они привлекают, чтобы их лучше понять, в свете различий в системах распознавания речи ».

Есть и другие группы, неправильно понятые голосовыми технологиями, такими как ораторы второго языка.Исследователи надеются расширить языковые сорта, изучаемые в экспериментах по взаимодействию с компанией человека, и устроить барьеры в технологии, чтобы они могли поддерживать всех, кто хочет его использовать.

Больше информации: Афроамериканские носители английского языка и корректировки ставок для воображаемых технологических и человеческих адресов, Jasa Express Letters (2024).Doi: 10.1121/10.0025484

Получи бесплатную еженедельную рассылку со ссылками на репозитории и лонгриды самых интересных историй о стартапах 🚀, AI технологиях 👩‍💻 и программировании 💻!
Присоединяйся к тысячам читателей для получения одного еженедельного письма

Подписывайся на нас:

Нашли ошибку в тексте? Напишите нам.

Добавляй ЛРНЧ в свою ленту Google Новостей.
Читайте далее 📖

Генеративный ИИ создает персонализированные сборники рассказов для детей

7/27/2024 · 3 мин. чтения

Генеративный ИИ создает персонализированные сборники рассказов для детей

Носимые датчики помогают спортсменам усерднее работать

7/24/2024 · 3 мин. чтения

Носимые датчики помогают спортсменам усерднее работать

*Facebook, Instagram, Meta - запрещенные в РФ организации.