Opinion mining, also called sentiment analysis, is the field of study that analyzes people opinions, sentiments, evaluations, appraisals, attitudes, and emotions towards entities such as products, services, organizations, individuals, issues, events, topics, and their attributes. Holistic lexicon-based approach does not consider the strength of each opinion, i.e., whether the opinion is very strongly negative (or positive), strongly negative (or positive), moderate negative (or positive), very weakly negative (or positive) and weakly negative (or positive). In this paper, we propose approach to rank entities based on orientation and strength of the entity reviews and user's queries by classifying them in granularity levels (i.e. very weak, weak, moderate, very strong and strong) by combining opinion words (i.e. adverb, adjective, noun and verb) that are related to aspect of interest of certain product. We shall use fuzzy logic algorithmic approach in order to classify opinion words into different category and syntactic dependency resolution to find relations for desired aspect words. Opinion words related to certain aspects of interest are considered to find the entity score for that aspect in the review.
- ID статьи: 2510.25778
- Название: Review Based Entity Ranking using Fuzzy Logic Algorithmic Approach: Analysis
- Авторы: Pratik N. Kalamkar, Anupama G. Phakatkar
- Классификация: cs.CL (Вычислительная лингвистика), cs.LG (Машинное обучение)
- Время публикации/конференция: International Journal Of Engineering And Computer Science (IJECS), Volume 03, Issue 09, September 2014
- Ссылка на статью: https://arxiv.org/abs/2510.25778
В данной статье предлагается метод ранжирования сущностей на основе нечеткой логики, который ранжирует сущности путем анализа полярности и интенсивности мнений пользователей в отзывах. В отличие от традиционных методов на основе словарей, статья классифицирует мнения на более детальные уровни интенсивности (очень слабое, слабое, среднее, сильное, очень сильное) и объединяет слова мнений, связанные с конкретными аспектами продукта (наречия, прилагательные, существительные и глаголы). Система использует алгоритм нечеткой логики для классификации слов мнений и синтаксический анализ зависимостей для определения отношений с целевыми словами аспектов, таким образом вычисляя оценки для производительности сущности в конкретных аспектах.
Статья направлена на решение проблемы ранжирования сущностей на основе отзывов пользователей, в частности на то, как учитывать интенсивность и направленность мнений на детальном уровне для более точного отражения предпочтений пользователей к конкретным аспектам сущностей.
- Быстрое развитие социальных сетей и интернета: привело к свободному распространению большого количества мнений о продуктах и услугах в интернете, которые оказывают значительное влияние на решения людей
- Ограничения традиционных систем поиска: существующие поисковые системы в основном основаны на информационном поиске и не учитывают интенсивность полярности мнений
- Широкие перспективы применения: практически в каждой области существует потребность в применении, например в рекомендациях продуктов электронной коммерции, оценке услуг и т.д.
- Холистический подход на основе словарей: не учитывает интенсивность мнений, просто классифицирует мнения как положительные, отрицательные или нейтральные
- Ранжирование сущностей на основе мнений (Ganesan & Zhai, 2010): хотя предложил метод ранжирования на основе мнений, ему не хватает детальной классификации мнений и анализа синтаксических зависимостей
- Отсутствие анализа на уровне аспектов: существующие методы затрудняются в точном ранжировании конкретных аспектов сущностей (например, управляемость автомобиля, расход топлива и т.д.)
Объединение способности нечеткой логики к детальной классификации эмоций и способности условных случайных полей (CRF) к извлечению аспектов для предложения более точной системы ранжирования сущностей, преодолевающей недостатки существующих методов.
- Предложена структура детальной классификации эмоций: классифицирует мнения на пять уровней интенсивности (очень слабое, слабое, среднее, сильное, очень сильное), а не на традиционную трехклассовую классификацию (положительное, отрицательное, нейтральное)
- Интеграция различных методов NLP:
- Использование CRF для извлечения аспектов
- Использование синтаксического анализа зависимостей для определения отношений между словами мнений и словами аспектов
- Использование нечеткой логики для классификации интенсивности эмоций
- Ранжирование сущностей на уровне аспектов: способность ранжировать сущности в соответствии с конкретными аспектами, интересующими пользователя, а не только на основе общей оценки
- Практическая реализация и проверка системы: метод был проверен на реальном наборе данных, содержащем 42 230 отзывов об автомобилях
Входные данные:
- Запрос пользователя (выражающий предпочтение к определенному аспекту сущности, например "хорошая управляемость")
- Набор отзывов о кандидатных сущностях
Выходные данные:
- Список сущностей, отсортированный по степени соответствия запросу пользователя, с оценками
Ограничения:
- Необходимо определить слова аспектов в отзывах
- Необходимо проанализировать синтаксические отношения между словами мнений и словами аспектов
- Необходимо количественно оценить интенсивность и направленность мнений
Вся система состоит из трех основных этапов:
1.1 Выбор метода
- Использование метода контролируемого обучения, в частности условных случайных полей (CRF)
- Превосходит методы на основе частых существительных благодаря способности к обучению и возможности непрерывного совершенствования с большим количеством обучающих данных в конкретной области
1.2 Определение модели CRF
Пусть X — случайная переменная последовательности данных, подлежащих разметке, а Y — случайная переменная соответствующей последовательности меток. Учитывая граф G = (V,E), такой что Y = (Yv)v∈V, пара (X,Y) является условным случайным полем тогда и только тогда, когда при условии X случайная переменная Yv удовлетворяет свойству Маркова относительно графа G:
p(Yv |X, Yw, w ≠ v) = p(Yv |X, Yw, w ~ v)
где w ~ v означает, что w и v являются соседями в графе G.
1.3 Обучение и тестирование
- Использование 12 000 вручную размеченных отзывов (примерно 33% от общего количества) в качестве обучающих данных
- Разметка различных аспектов, связанных с автомобилями: расход топлива (mileage), управляемость (handling), внутреннее оборудование (interiors), внешний вид (exteriors), звуковая система (sound system), тормоза (brakes) и т.д.
2.1 Определение слов мнений
- Использование средства разметки частей речи (POS tagger) OpenNLP для определения прилагательных и наречий
- Использование модуля синтаксического анализа зависимостей Stanford для анализа синтаксических зависимостей
- Рассмотрение только слов мнений, связанных с целевым аспектом
Пример:
Для предложения "The car is good having very stable handling", если пользователя интересует аспект "handling", рассматриваются только слова мнений "very" и "stable".
2.2 Проектирование системы нечеткой логики
(1) Фаззификация (Fuzzification)
- Использование словаря SentiWords (содержит 155 000 слов с значениями полярности в диапазоне от -1 до 1)
- Фактически использовалось 6 800 отфильтрованных слов
- Связывание каждого слова мнения с определенной степенью полярности
(2) Проектирование функций принадлежности
- Использование треугольных функций принадлежности
- Разделение входного пространства на три нечетких множества: Low (низкое), Moderate (среднее), High (высокое)
(3) Проектирование нечетких правил
Разработка правил на основе наличия наречий, прилагательных, глаголов и существительных, например:
- IF adverb is High AND adjective is High THEN orientation is High
- Правила учитывают влияние комбинаций частей речи на интенсивность эмоций
(4) Дефаззификация (Defuzzification)
- Использование функции дефаззификации Mamdani
- Преобразование нечеткого выхода в точную числовую оценку
2.3 Выходные данные
- Получение направления эмоций и интенсивности для каждого предложения в отзыве, содержащего целевой аспект
- Проведение аналогичной обработки запроса пользователя
3.1 Агрегирование оценок
- Сбор оценок всех предложений, содержащих целевой аспект, из всех отзывов о сущности
- Агрегирование этих оценок для получения общей оценки сущности по данному аспекту
3.2 Стратегия ранжирования
- Сортировка сущностей в порядке убывания оценок
- Более высокая оценка указывает на лучшее соответствие производительности сущности предпочтениям пользователя
3.3 Сравнение с базовыми методами
- Сравнение с алгоритмом BM25
- BM25 — это широко используемый эффективный и надежный алгоритм ранжирования в области информационного поиска
- Детальный анализ эмоций:
- Преодоление традиционной трехклассовой классификации положительное/отрицательное/нейтральное
- Введение пятиуровневой классификации интенсивности для более точного отражения мнений пользователей
- Ранжирование на уровне аспектов:
- Не общее ранжирование сущностей, а ранжирование в соответствии с конкретными аспектами, интересующими пользователя
- Обеспечение точного соответствия слов мнений и слов аспектов через синтаксический анализ зависимостей
- Применение нечеткой логики:
- Обработка нечеткости и неопределенности интенсивности эмоций
- По сравнению с жесткой классификацией, лучше соответствует восприятию человеком интенсивности эмоций
- Интеграция нескольких методов:
- CRF для извлечения аспектов (использование преимуществ разметки последовательностей)
- Синтаксический анализ зависимостей для определения отношений
- Нечеткая логика для количественной оценки интенсивности
- Формирование полного процесса обработки
Масштаб набора данных:
- Общее количество отзывов: 42 230
- Количество сущностей: более 150 моделей автомобилей
- Временной диапазон: данные за три года
- Обучающие данные: 12 000 вручную размеченных отзывов (примерно 33%)
Характеристики данных:
- Реальные данные отзывов пользователей
- Охватывают несколько марок и моделей автомобилей
- Содержат оценки по нескольким аспектам (расход топлива, управляемость, внутреннее оборудование, внешний вид, звуковая система, тормоза и т.д.)
Предварительная обработка данных:
- Ручная разметка слов аспектов для обучения CRF
- Использование метода полуконтролируемого обучения
1. Сравнение ранжирования:
- Сравнение результатов ранжирования с алгоритмом BM25
- Демонстрация различий в ранжировании и оценках
2. Анализ точности:
- Подготовка стандартных идеальных оценок для каждого файла отзывов
- Вычисление разницы между оценками системы и идеальными оценками
- Анализ причин отклонений оценок
3. Показатели производительности:
- Время обработки: отношение размера отзывов (МБ) к времени обработки (мм:сс)
- Использование памяти: отношение размера отзывов к использованию памяти (МБ)
Основной базовый метод: BM25
- Причина выбора: BM25 показывает эффективность и надежность в различных задачах
- Инструмент реализации: использование инструмента Lemur для ранжирования BM25
- Аспекты сравнения: порядок ранжирования, различия в оценках
Технологический стек:
- Разметка POS: OpenNLP
- Синтаксический анализ зависимостей: Stanford Parser
- Словарь эмоций: SentiWords (6 800 отфильтрованных слов)
- Машинное обучение: CRF (условные случайные поля)
- Нечеткая логика: дефаззификация Mamdani
Стратегии оптимизации:
- Широкое использование многопоточности для повышения эффективности обработки
- Запуск на многоядерных процессорах Intel
Процесс обработки:
- Использование CRF для извлечения аспектов
- Использование разметки POS для определения слов мнений
- Использование синтаксического анализа зависимостей для установления отношений
- Использование нечеткой логики для вычисления интенсивности
- Агрегирование оценок и ранжирование
Сравнение с BM25 (Таблица 1):
| Название сущности | Предложенная система | | BM25 | |
|---|
| Ранг | Оценка | Ранг | Оценка |
| mazda_rx-8 | 1 | 3.5483 | 8 | -5.818 |
| bmw_6_series | 2 | 2.3656 | 7 | -5.562 |
| suzuki_reno | 3 | 1.8086 | 5 | -5.274 |
| lexus_gs_450h | 4 | 1.3 | 2 | -5.134 |
| chevrolet_malibu_maxx | 5 | 1.1767 | 4 | -5.227 |
| cadillac_escalade_ext | 6 | 1 | 1 | -4.979 |
| chrysler_crossfire | 7 | 0.9451 | 6 | -5.472 |
| volvo_s80 | 8 | 0.848 | 3 | -5.212 |
Ключевые выводы:
- Значительные различия в ранжировании: предложенный метод и BM25 дают совершенно разные результаты ранжирования
- Различные системы оценок: предложенный метод использует положительные оценки, BM25 использует отрицательные
- Чувствительность к аспектам: предложенный метод может ранжировать по конкретным аспектам (например, "управляемость"), в то время как BM25 этого не может
График 1: Сравнение с идеальными оценками
Из графика можно наблюдать:
- Большинство сущностей: вычисленные системой оценки близки к идеальным оценкам
- Наличие отклонений: оценки некоторых сущностей отличаются от ожидаемых
Анализ причин отклонений:
- Ошибки синтаксического анализа зависимостей:
- Отзывы с орфографическими ошибками
- Отзывы с грамматическими ошибками
- Приводит к невозможности правильного определения отношений между словами мнений и словами аспектов
- Недостаточное покрытие словаря:
- Некоторые слова мнений не найдены в словаре SentiWords
- Приводит к невозможности точного вычисления интенсивности эмоций
Время обработки (График: размер отзывов vs. время обработки):
- Тенденция: время обработки линейно растет с размером набора данных отзывов
- Эффективность: для 10 МБ данных отзывов время обработки составляет примерно 10 минут
- Масштабируемость: линейное отношение указывает на хорошую масштабируемость системы
Использование памяти (График: размер отзывов vs. использование памяти):
- Начальный этап: использование памяти быстро растет (с 400 МБ до примерно 1600 МБ)
- Стабильный этап: при обработке больших наборов данных использование памяти стабилизируется
- Причина: многопоточность полностью использует все ядра процессора при обработке больших объемов данных
- Диапазон памяти: 400 МБ - 1700 МБ
- Эффективность метода:
- Предложенный метод может обеспечить результаты ранжирования, полностью отличающиеся от BM25
- Ранжирование на основе аспектов и интенсивности эмоций лучше соответствует реальным потребностям пользователей
- Ценность детальной классификации:
- Детальная классификация эмоций, реализованная через нечеткую логику, может захватить тонкие различия в мнениях
- Обеспечивает более точную основу для ранжирования сущностей
- Приемлемая производительность:
- Хотя время обработки растет с объемом данных, оно сохраняет линейное отношение
- Использование памяти находится в приемлемом диапазоне
- Проблемы и ограничения:
- Имеет определенные требования к качеству отзывов (орфография, грамматика)
- Зависит от охвата словаря эмоций
Ранжирование сущностей на основе мнений (Ganesan & Zhai, 2010):
- Метод: предложено использование расширения мнений (opinion expansion) в сочетании с алгоритмом BM25
- Вклад: первое систематическое исследование проблемы ранжирования сущностей на основе мнений
- Ограничения:
- Не учитывает детальную классификацию мнений
- Отсутствует анализ синтаксических зависимостей
- Невозможно точное ранжирование по конкретным аспектам
Классификация эмоций на основе нечеткой логики (Nadali, 2010):
- Метод: использование нечеткой логики для детальной классификации мнений пользователей
- Вклад: введение нечеткой логики для обработки неопределенности интенсивности эмоций
- Ограничения: не объединено с задачей ранжирования сущностей
Анализ эмоций и извлечение мнений (Bing Liu, 2012):
- Предоставляет систематический обзор анализа эмоций и извлечения мнений
- Определяет основные концепции и задачи в этой области
CRF для разметки последовательностей (Lafferty et al., 2001):
- Предложена модель условных случайных полей для сегментации и разметки данных последовательностей
- Обеспечивает теоретическую основу для извлечения аспектов
Типизированные зависимости Stanford (de Marneffe & Manning, 2008):
- Предоставляет инструмент синтаксического анализа зависимостей
- Используется для определения отношений между словами мнений и словами аспектов
- Первое объединение: объединение детальной классификации эмоций с ранжированием сущностей на уровне аспектов
- Интеграция методов: успешная интеграция CRF, синтаксического анализа зависимостей и нечеткой логики
- Практическая система: реализация и проверка полной системы на реальном наборе данных
- Эффективность метода:
- Предложенный метод на основе нечеткой логики может обеспечить более точное ранжирование сущностей, чем традиционный информационный поиск
- Детальная классификация эмоций предоставляет более богатую информацию
- Ценность ранжирования на уровне аспектов:
- Пользователи могут получить настраиваемые результаты ранжирования в соответствии с конкретными интересующими их аспектами
- Повышает релевантность и практическую полезность ранжирования
- Техническая осуществимость:
- Производительность системы на реальном наборе данных подтверждает осуществимость метода
- Показатели производительности (время, память) находятся в приемлемом диапазоне
- Потенциал применения:
- Может служить плагином для поисковых систем (например, Google, Bing)
- Может применяться на сайтах онлайн-покупок для повышения пользовательского опыта
- Зависимость от качества данных:
- Чувствительность к орфографическим и грамматическим ошибкам
- Синтаксический анализ зависимостей может не работать при столкновении с нестандартным текстом
- Проблема охвата словаря:
- Зависит от охвата словаря SentiWords
- Невозможно вычислить интенсивность эмоций для слов, отсутствующих в словаре
- Вычислительные затраты:
- Требуется многоэтапная обработка (CRF, синтаксический анализ, нечеткая логика)
- При обработке крупномасштабных данных может возникнуть проблема эффективности
- Адаптация к области:
- Модель CRF требует переобучения для различных областей
- Модель, обученная на данных об автомобилях, может быть неприменима к другим категориям продуктов
- Ограничения оценки:
- Отсутствие стандартного эталона оценки
- Не проводилось исследование с участием пользователей для проверки качества ранжирования
- Улучшение синтаксического анализа зависимостей:
- Разработка методов анализа, более устойчивых к шумным текстам
- Введение предварительной обработки с исправлением орфографии и грамматики
- Расширение словаря эмоций:
- Использование методов глубокого обучения для автоматического изучения полярности слов
- Рассмотрение специфичных для области слов эмоций
- Трансфер между областями:
- Исследование методов трансферного обучения для снижения требований к разметке в новых областях
- Разработка универсальной модели извлечения аспектов
- Исследование с участием пользователей:
- Проведение опросов удовлетворенности пользователей
- Сравнение с ручным ранжированием
- Система реального времени:
- Оптимизация эффективности алгоритма для поддержки ранжирования в реальном времени
- Разработка механизма онлайн-обучения для непрерывного совершенствования модели
- Инновационность:
- Детальная классификация эмоций: пятиуровневая классификация интенсивности является важным расширением традиционной трехклассовой классификации
- Ранжирование на уровне аспектов: ранжирование по конкретным аспектам — это практичная и инновационная идея
- Интеграция методов: успешная интеграция нескольких методов NLP
- Практическая ценность:
- Реальные сценарии применения: применение на данных отзывов об автомобилях имеет практическое значение
- Масштабируемость: метод может быть распространен на другие категории продуктов и области
- Удобство для пользователя: позволяет пользователям указывать интересующие их аспекты
- Обоснованность метода:
- Выбор нечеткой логики: подходит для обработки нечеткости интенсивности эмоций
- Использование CRF: стандартный метод для задач разметки последовательностей
- Синтаксический анализ зависимостей: обеспечивает точное соответствие слов мнений и слов аспектов
- Достаточность экспериментов:
- Крупномасштабный набор данных: 42 230 отзывов обеспечивают достаточное тестирование
- Многомерная оценка: включает сравнение ранжирования, анализ точности, тестирование производительности
- Убедительное сравнение: сравнение с BM25 убедительно
- Ограничения методов оценки:
- Отсутствие стандартных метрик: не используются стандартные метрики оценки ранжирования, такие как NDCG, MAP
- Субъективность: определение идеальных оценок не объясняется подробно
- Отсутствие исследования с пользователями: не проводилась оценка удовлетворенности реальных пользователей
- Ограничения метода:
- Зависимость от словаря: сильная зависимость от качества и охвата словаря SentiWords
- Проектирование правил: проектирование нечетких правил не объясняется систематически, может содержать субъективность
- Распространение ошибок: ошибки в многоэтапном процессе обработки накапливаются и распространяются
- Недостатки экспериментального проектирования:
- Одна область: тестирование только в области автомобилей, способность к обобщению неизвестна
- Единственный метод сравнения: сравнение только с BM25, отсутствует сравнение с другими методами извлечения мнений
- Статистическая значимость: не сообщается о статистической значимости результатов
- Недостаток технических деталей:
- Параметры нечеткой логики: конкретные параметры функций принадлежности не объясняются подробно
- Метод агрегирования: стратегия агрегирования оценок из нескольких отзывов описана неясно
- Обработка запросов: процесс анализа и сопоставления запросов пользователя описан кратко
- Проблемы воспроизводимости:
- Код не открыт: невозможно проверить детали реализации
- Данные не опубликованы: размеченные данные и экспериментальные данные недоступны
- Неясные параметры: многие гиперпараметры и пороги не указаны явно
- Вклад в область:
- Пионерская работа: раннее исследование в области детального ранжирования сущностей на уровне аспектов
- Методологический вклад: демонстрирует осуществимость интеграции нескольких методов
- Определение задачи: четко определяет задачу ранжирования сущностей на уровне аспектов
- Практическая ценность:
- Применение в электронной коммерции: может применяться в рекомендациях и ранжировании продуктов
- Улучшение поисковых систем: может служить дополнением к традиционным поисковым системам
- Поддержка принятия решений: помогает пользователям делать выбор на основе конкретных аспектов
- Ограничения:
- Вычислительные затраты: многоэтапная обработка ограничивает крупномасштабное применение в реальном времени
- Адаптация к области: требует большого объема разметки для новых областей
- Технологическая зависимость: зависит от нескольких внешних инструментов и ресурсов
- Воспроизводимость:
- Низкая: отсутствие кода и данных затрудняет воспроизведение
- Зависимость от инструментов: зависит от нескольких специфичных инструментов (OpenNLP, Stanford Parser и т.д.)
- Неизвестные параметры: многие ключевые параметры не указаны явно
- Идеальные сценарии применения:
- Анализ отзывов о продуктах: ранжирование и рекомендации продуктов на платформах электронной коммерции
- Оценка услуг: анализ отзывов о ресторанах, отелях и других услугах
- Мониторинг бренда: мониторинг производительности продуктов в конкретных аспектах
- Исследование рынка: анализ предпочтений пользователей к различным аспектам продуктов
- Условия применимости:
- Высокое качество отзывов: относительно стандартная орфография и грамматика
- Четкие аспекты: продукты или услуги имеют четко определяемые аспекты
- Достаточный объем отзывов: достаточно данных отзывов для обучения и тестирования
- Стабильность области: категория продуктов и стиль отзывов относительно стабильны
- Неприменимые сценарии:
- Требования к реальному времени: высокие требования к задержке ранжирования
- Низкое качество отзывов: тексты социальных сетей, полные шума и ошибок
- Неясные аспекты: сложно определить четкие аспекты абстрактных концепций
- Разреженные данные: очень мало отзывов о продуктах с длинным хвостом
Статья цитирует 23 важные справочные работы, ключевые из которых включают:
- Bing Liu (2012): "Sentiment Analysis and Opinion Mining" — авторитетный обзор в области анализа эмоций
- Kavita Ganesan & Cheng Xiang Zhai (2012): "Opinion-Based Entity Ranking" — пионерская работа в области ранжирования сущностей на основе мнений
- Samaneh Nadali (2010): "Sentiment Classification Based on Fuzzy Logic" — применение нечеткой логики в классификации эмоций
- John Lafferty et al. (2001): "Conditional Random Fields" — исходная статья модели CRF
- Marie-Catherine de Marneffe & Christopher D. Manning (2008): "Stanford Typed Dependencies Manual" — инструмент синтаксического анализа зависимостей
Общая оценка: В данной статье предложен инновационный метод ранжирования сущностей на уровне аспектов путем интеграции CRF, синтаксического анализа зависимостей и нечеткой логики для реализации детальной классификации эмоций. Метод имеет сильную практическую ценность, но имеет недостатки в методах оценки, технических деталях и воспроизводимости. Как работа 2014 года, это исследование имеет прогностическую ценность в методологии и предоставляет ценные идеи для последующих исследований.