Алгоритм модели глубокого обучения для анализа настроений
Кредит: Pixabay/CC0 Общественный домен
Мы живем в эпоху удивительного распространения данных и обмена контентом, созданным пользователем, во всех видах медиа, от социальных сетей до новостных сайтов, обзоров электронной коммерции до бесконечных форумов для всех видов интереса и ниши.
Возможность точно интерпретировать эмоции, передаваемые с помощью таких сообщений, все более важна для социальных наук и политики, маркетинга, бизнеса и экономики и в других местах.
Последние достижения в области так называемого «анализа настроений» привели к разработке более сложных моделей, способных извлечь и интерпретировать эмоциональные тонкости в текстовых данных.Одной из таких модели являются Bert-Abilstm-присутствующие репрезентации энкодера от трансформаторов, внимание к двунаправленной долгосрочной кратковременной памяти.
Исследования, опубликованные в Международном журнале информационных и коммуникационных технологий, о том, как этот крупномасштабный предварительно обученный алгоритм можно использовать для анализа настроений.Однако, как отмечает автор Жубин Луо из Университета гуманитарных наук, науки и техники Хунань в Китае, используется системой Abilstm, означает, что есть некоторые ограничения, поскольку она фокусируется на глобальных функциях и может упускать из виду нюансы.
Берт, объясняет Ло, может изучать языковые представления из обширных тел текста.Abilstm, повторяющаяся нейронная сеть, обрабатывает текстовые последовательности.В настоящее время LUO добавил TextCnn (текстовая сверточная нейронная сеть) в систему, чтобы сделать Bert-CNN-ABILSTM, более сложную версию модели.
В целом, базовый двунаправленный подход позволяет модели понимать контекст как по прошествию, так и в будущем, и будущие сегменты текста.Это важно для захвата долгосрочных зависимостей в тексте.Механизм внимания в Abilstm дополнительно уточняет это, позволяя модели сосредоточиться на наиболее подходящих частях текста при создании прогнозов, тем самым повышая точность анализа настроений.
Затем компонент TextCnn использует сверточные ядра различных размеров, чтобы обнаружить различные детали функций в тексте.Это позволяет модели захватить гораздо более тонкие локальные шаблоны в тексте, которые были бы пропущены более простыми моделями, обеспечивая еще более подробный анализ текстового контента.
Улучшения, представленные LUO, особенно актуальны для сценариев, которые требуют подробной классификации текста и распознавания.Это может включать анализ настроений в социальных сетях, оценку отзывов клиентов на платформах электронной коммерции или расширение возможностей «интеллектуальных» онлайн-систем вопросов и ответов.
More information: Zhubin Luo, A study into text sentiment analysis model based on deep learning, International Journal of Information and Communication Technology (2024). DOI: 10.1504/IJICT.2024.139869
Нашли ошибку в тексте? Напишите нам.