Разговорной агент, который объединяет большие языковые модели и помощь в доменных областях
Система Furchat.Кредит: Cherakara et al.
Большие языковые модели (LLMS) представляют собой продвинутые методы глубокого обучения, которые могут взаимодействовать с людьми в режиме реального времени и реагировать на подсказки по широкому спектру тем.Эти модели приобрели большую популярность после выпуска CHATGPT, модели, созданной OpenAI, которая удивила многих пользователей за его способность генерировать человеческие ответы на свои вопросы.
В то время как LLMS становятся все более распространенными, большинство из них являются общими, а не настраиваемыми, чтобы предоставить ответы на конкретные темы.Чат -боты и роботы, представленные в некоторых аэропортах, торговых центрах и общественных пространствах, с другой стороны, часто основаны на других типах моделей обработки естественного языка (NLP).
Исследователи из Университета Хериот-Ватт и Алана Ай недавно создали Furchat, нового воплощенного Lrnчal Agent, основанного на LLMS, предназначенных для предложения информации в конкретных условиях.Этот агент, представленный в бумаге, предварительно опубликованном по ARXIV, может иметь интересные разговоры с пользователями через робот Furhat, гуманоидный роботизированный бюст.
«Мы хотели исследовать несколько аспектов воплощенного ИИ для естественного взаимодействия с людьми», - сказал Оливер Лемон, один из исследователей, который провели исследование.«В частности, мы были заинтересованы в объединении общего« открытого домена », который вы можете иметь с LLM, такими как CHATGPT, с более полезными и конкретными источниками информации, в данном случае, например, о здании и организации (т.е.Национальный роботарий Великобритании). Мы также построили аналогичную систему для информации о больнице (больница Broca в Париже для весеннего проекта), используя робот ARI и по -французски ».
Ключевой целью недавней работы команды было применение LLMS-специфических LRNч, кроме того, Lemon и его коллеги надеялись проверить способность этих моделей генерировать соответствующие выражения лица, согласованные с тем, что робот или аватар общается или реагирует на ATданное время.
«Furchat объединяет большую языковую модель (LLM), такую как CHATGPT или одна из многих альтернатив с открытым исходным кодом (например, Llama) с анимированным роботом с поддержкой речи»,-сказал Лемон.«Это первая система, которая, как мы знаем, сочетает в себе LLMS как для общих LRNч, так и для конкретных источников информации (например, документы об организации) с автоматическими выразительными роботами -анимациями».
Ответы, данные воплощенным агентом команды, и его выражения лица генерируются моделью GPT 3.5.Затем они передаются в разговорных терминах и физически роботом Фурхат.
Чтобы оценить эффективность Furchat, исследователи провели тест с пользователями человека, попросив их поделиться своими отзывами после того, как они взаимодействовали с агентом.Они специально установили робота в Национальном роботариуме Великобритании в Шотландии, где он взаимодействовал с посетителями и предложил им информацию о объекте, его исследованиях, предстоящих событиях и многом другом.
«Мы исследуем, как использовать и дополнительно развивать недавние достижения в области ИИ в LLMS для создания более полезных, полезных и убедительных систем для сотрудничества между людьми, роботами и системами искусственного интеллекта в целом», - пояснил Лемон.«Такие системы должны быть фактически точными, например, объяснять, как присутствующая информация получена в конкретных документах или изображениях.
«Мы работаем над этими функциями, чтобы обеспечить более надежные и объяснимые системы ИИ и роботов. В то же время мы работаем над системами, которые объединяют зрение и язык для воплощенных агентов, которые могут работать вместе с людьми. Это будет иметь все большее значение вВ ближайшие годы развиваются все больше систем для сотрудничества с человеком и аи. ».
В первоначальном эксперименте команды в реальном мире система Furchat, по-видимому, эффективна в общении с пользователями как гладко, так и информативно.В будущем это исследование может поощрять введение аналогичных воплощенных агентов ИИ на основе LLM в общественных местах или в музеях, фестивалях и других местах.
«В настоящее время мы работаем над расширением воплощенных липких агентов на так называемые« многопартийные »Лрнс, где взаимодействие включает в себя несколько людей, например, при посещении больницы с родственником»,-добавил Лемон.«Затем мы планируем расширить их использование на сценарии, где команды роботов и людей сотрудничают, чтобы решать реальные проблемы».
Больше информации: Neeraj Cherakara et al., Furchat: воплощенный разговорной агент с использованием LLMS, объединяющий открытый и закрытый диалог с выражениями лица, Arxiv (2023).Doi: 10.48550/arxiv.2308.15214
Нашли ошибку в тексте? Напишите нам.