2025-11-25T15:55:18.432351

Group Decision-Making System with Sentiment Analysis of Discussion Chat and Fuzzy Consensus Modeling

Yerkin, Shamoi
Group Decision-Making (GDM) plays a crucial role in various real-life scenarios where individuals express their opinions in natural language rather than structured numerical values. Traditional GDM approaches often overlook the subjectivity and ambiguity present in human discussions, making it challenging to achieve a fair and consensus-driven decision. This paper proposes a fuzzy consensus-based group decision-making system that integrates sentiment and emotion analysis to extract preference values from textual inputs. The proposed framework combines explicit voting preferences with sentiment scores derived from chat discussions, which are then processed using a Fuzzy Inference System (FIS) to compute a total preference score for each alternative and determine the top-ranked option. To ensure fairness in group decision-making, we introduce a fuzzy logic-based consensus measurement model that evaluates participants' agreement and confidence levels to assess overall feedback. To illustrate the effectiveness of our approach, we apply the methodology to a restaurant selection scenario, where a group of individuals must decide on a dining option based on brief chat discussions. The results demonstrate that the fuzzy consensus mechanism successfully aggregates individual preferences and ensures a balanced outcome that accurately reflects group sentiment.
academic

Sistema de Toma de Decisiones Grupales con Análisis de Sentimientos de Chat de Discusión y Modelado de Consenso Difuso

Información Básica

  • ID del Artículo: 2503.18765
  • Título: Group Decision-Making System with Sentiment Analysis of Discussion Chat and Fuzzy Consensus Modeling
  • Autores: Adilet Yerkin, Pakizar Shamoi (Universidad Técnica Kazajo-Británica)
  • Clasificación: cs.HC (Interacción Humano-Computadora)
  • Fecha de Publicación: 14 de octubre de 2025 (arXiv v2)
  • Enlace del Artículo: https://arxiv.org/abs/2503.18765

Resumen

La toma de decisiones grupales (GDM) desempeña un papel importante en la vida real, donde los individuos típicamente expresan sus opiniones mediante lenguaje natural en lugar de valores numéricos estructurados. Los métodos tradicionales de GDM frecuentemente ignoran la subjetividad y ambigüedad inherentes en las discusiones humanas, lo que dificulta la implementación de decisiones justas y basadas en consenso. Este artículo propone un sistema de toma de decisiones grupales basado en consenso difuso que integra análisis de sentimientos y emociones para extraer valores de preferencia a partir de entradas de texto. El marco propuesto combina preferencias de votación explícitas con puntuaciones de sentimiento extraídas de discusiones de chat, procesando posteriormente estos datos mediante un sistema de inferencia difusa (FIS) para calcular puntuaciones de preferencia total para cada alternativa y determinar la opción con mayor clasificación. Para garantizar la equidad en la toma de decisiones grupales, se introduce un modelo de medición de consenso basado en lógica difusa que evalúa los niveles de acuerdo y confianza de los participantes para evaluar la retroalimentación general.

Antecedentes de Investigación y Motivación

1. Problemas a Resolver

Los sistemas tradicionales de toma de decisiones grupales enfrentan los siguientes desafíos fundamentales:

  • Ausencia de Procesamiento de Lenguaje Natural: Los sistemas GDM existentes dependen principalmente de evaluaciones numéricas estructuradas, mientras que en la realidad las personas expresan preferencias más frecuentemente mediante lenguaje natural
  • Procesamiento Insuficiente de Subjetividad y Ambigüedad: Los métodos tradicionales tienen dificultades para manejar la subjetividad e incertidumbre inherentes en las discusiones humanas
  • Mecanismos de Medición de Consenso Imperfectos: Falta de mecanismos efectivos para evaluar el grado de consenso entre miembros del grupo
  • Limitaciones de la Comunicación Mediada por Computadora (CMC): Aunque las discusiones en línea facilitan la colaboración, carecen de expresión emocional, afectando el logro del consenso

2. Importancia del Problema

  • Demanda de Aplicaciones Prácticas: La toma de decisiones moderna depende cada vez más de plataformas en línea y comunicación digitalizada
  • Requisitos de Equidad: Es necesario garantizar que las opiniones de todos los participantes se consideren e integren equitativamente
  • Mejora de Eficiencia: El análisis de sentimientos automatizado y la agregación de preferencias pueden mejorar la eficiencia en la toma de decisiones

3. Limitaciones de Métodos Existentes

  • Requisitos de Numerización: Los métodos tradicionales requieren que los participantes proporcionen evaluaciones numéricas explícitas, lo que no se alinea con los modos de comunicación natural
  • Pérdida de Información Emocional: Se ignora la información emocional rica contenida en las discusiones de texto
  • Mecanismos de Evaluación de Consenso Únicos: Se basan principalmente en funciones de similitud, sin considerar la satisfacción de expertos y niveles de confianza

Contribuciones Principales

  1. Modelo de Medición de Consenso Difuso: Desarrollo de un modelo de medición de consenso basado en lógica difusa que evalúa los niveles de acuerdo y confianza de los participantes, garantizando un proceso de decisión justo y coherente con la cognición humana
  2. Marco Híbrido de Agregación de Preferencias: El sistema combina preferencias de votación explícitas con puntuaciones de sentimiento, calculando puntuaciones de preferencia total para cada alternativa mediante un sistema de inferencia difusa
  3. Validación de Decisiones a Pequeña Escala: Se verificó la efectividad del método mediante un escenario de selección de restaurante, logrando un alto nivel de consenso en la toma de decisiones con participación humana
  4. Medida de Consenso de Coherencia Humana: Se propone un método de evaluación de consenso basado en el acuerdo de expertos y niveles de confianza, en lugar de depender únicamente de funciones de similitud calculadas automáticamente

Explicación Detallada del Método

Definición de Tarea

Entrada:

  • Conjunto de alternativas X = {x₁, x₂, ..., xₙ}
  • Conjunto de expertos E = {e₁, e₂, ..., eₘ}
  • Conjunto de características F = {f₁, f₂, ..., fₚ}
  • Contenido de discusión textual

Salida:

  • Alternativa con clasificación más alta
  • Evaluación del nivel de consenso grupal

Restricciones:

  • Rango de valores de evaluación de preferencia: {-1, 0, 1} (en contra, irrelevante, a favor)
  • Rango de puntuación de sentimiento: -1, 1
  • Rango de puntuación de preferencia total: 0, 10

Arquitectura del Modelo

1. Sistema de Obtención de Preferencias

Los expertos proporcionan evaluaciones de preferencia para cada característica, con la fórmula de cálculo de preferencia:

Prefₑⱼ(xᵢ) = Σᵢ,ⱼ,ₖ fₖ(xᵢ) × zₖ(eⱼ)

donde fₖ(xᵢ) es el valor de la k-ésima característica de la alternativa xᵢ, y zₖ(eⱼ) es la evaluación de preferencia del experto eⱼ para la k-ésima característica.

2. Módulo de Análisis de Sentimientos y Emociones

  • Análisis de Sentimientos: Utiliza la herramienta de análisis de sentimientos VADER para extraer puntuaciones de sentimiento compuesto (de -1 a +1)
  • Análisis de Emociones: Utiliza la biblioteca Text2Emotion para identificar cinco emociones (sorpresa, miedo, tristeza, alegría, ira)
  • Puntuación de Sentimiento Integrada: SP = αS + βE, donde α y β son pesos que equilibran la importancia del sentimiento y la emoción

Cálculo de puntuación de emoción:

Puntuación de Emoción Positiva (PES) = máx('alegría', 'sorpresa')
Puntuación de Emoción Negativa (NES) = máx('ira', 'tristeza', 'miedo')
Puntuación de Emoción Integrada = PES - NES
Puntuación de Sentimiento Total = Puntuación de Sentimiento × 0.6 + Puntuación de Emoción × 0.4

3. Sistema de Inferencia Difusa (FIS)

Variables de Entrada:

  • Preferencia de Votación (0-100): Preferencia de votación explícita del experto para la alternativa
  • Preferencia de Sentimiento (-1 a 1): Evaluación de sentimiento extraída de discusiones de texto

Variable de Salida:

  • Puntuación de Preferencia Total (0-10): Utilizada para clasificar todas las alternativas

Reglas Difusas: Se definen 15 reglas difusas que producen puntuaciones de preferencia total correspondientes basadas en diferentes combinaciones de preferencia de votación y preferencia de sentimiento.

4. Medición de Consenso de Coherencia Humana

Cálculo de Puntuación de Retroalimentación: Utiliza el sistema de inferencia difusa para procesar los niveles de acuerdo y confianza de los expertos

  • Conjunto de Acuerdo: AL = {al₁, al₂, ..., alₙ}, alᵢ ∈ 0, 10
  • Conjunto de Confianza: CL = {cl₁, cl₂, ..., clₙ}, clᵢ ∈ 0, 10

Función de Pertenencia Trapezoidal:

μ(x) = máx(mín((x-a)/(b-a), 1, (d-x)/(d-c)), 0)

Evaluación del Nivel de Consenso: Utiliza el rango intercuartílico (IQR) para evaluar el consenso general

  • IQR = Q₃ - Q₁
  • Consenso Alto: IQR < 2.0
  • Consenso Medio: 2.0 ≤ IQR ≤ 4.0
  • Consenso Bajo: IQR > 4.0

Puntos de Innovación Técnica

  1. Integración Dual de Preferencias: Primera integración orgánica de votación explícita y preferencia de sentimiento implícita mediante sistema de inferencia difusa
  2. Estrategia Adaptativa de Análisis de Sentimientos: Selecciona análisis de sentimiento puro o análisis conjunto de sentimiento-emoción según la longitud del texto de discusión
  3. Evaluación de Consenso Centrada en el Ser Humano: Método de medición de consenso basado en retroalimentación subjetiva de participantes en lugar de cálculo de similitud objetiva
  4. Procesamiento de Incertidumbre con Lógica Difusa: Uso integral de conjuntos difusos e inferencia difusa para manejar la incertidumbre y subjetividad en el proceso de decisión

Configuración Experimental

Conjunto de Datos

Escenario de Selección de Restaurante:

  • Alternativas: 4 restaurantes (alter1-alter4)
  • Dimensiones de Características: 5 características
    • feat1: Economía (monto promedio de la factura)
    • feat2: Ubicación (calificación de distancia del centro de la ciudad)
    • feat3: Opciones Vegetarianas (indicador binario)
    • feat4: Área Amigable para Niños (indicador binario)
    • feat5: Diseño Interior (calificación promedio)
  • Participantes: 5 expertos (partp1-partp5)
  • Datos de Discusión: Mensajes de texto en chat grupal

Métricas de Evaluación

  1. Puntuación de Preferencia Total: Puntuación integral en rango 0-10
  2. Nivel de Consenso: Clasificación basada en IQR (alto/medio/bajo)
  3. Puntuación de Retroalimentación: Evaluación de satisfacción de expertos (0-10)
  4. Puntuación de Retroalimentación Promedio: Satisfacción general del grupo

Detalles de Implementación

  • Pesos de Sentimiento: Peso de análisis de sentimiento 0.6, peso de análisis de emoción 0.4
  • Normalización de Características: Características continuas booleanas basadas en promedio
  • Inferencia Difusa: Utiliza funciones de pertenencia trapezoidal y método de inferencia Mamdani

Resultados Experimentales

Resultados Principales

Puntuaciones de Preferencia de Restaurante:

  • alter1: 5.0 puntos
  • alter2: 5.99 puntos (puntuación más alta, seleccionado como mejor opción)
  • alter3: 5.0 puntos
  • alter4: 5.36 puntos

Resultados de Evaluación de Consenso:

  • Valor de IQR: 0.19
  • Nivel de Consenso: Alto (IQR < 2.0)
  • Puntuación de Retroalimentación Promedio: ≈8.1 (de 10 puntos)

Análisis de Retroalimentación Individual:

ID de ParticipanteAcuerdo (0-10)Confianza (0-10)Valor de Retroalimentación
1998.14
210108.14
3787.95
4998.14
5797.95

Análisis de Casos

Ejemplo de Análisis de Sentimientos:

  • Comentario Positivo: "This restaurant has amazing food!" (puntuación de sentimiento: 0.81)
  • Comentario Negativo: "I don't like the location" (puntuación de sentimiento: -0.30)

Proceso de Agregación de Preferencias:

  1. Cálculo separado de preferencia de votación y preferencia de sentimiento
  2. Integración mediante FIS para obtener puntuación de preferencia total
  3. alter2 mostró el mejor desempeño tanto en preferencia de votación (62 puntos) como en preferencia de sentimiento (0.67)

Hallazgos Experimentales

  1. Logro de Alto Consenso: IQR=0.19 indica alta coherencia de participantes respecto a la decisión final
  2. Valor de Información de Sentimiento: El análisis de sentimientos complementa efectivamente la información de votación explícita
  3. Efectividad del Sistema: Puntuación de retroalimentación promedio de 8.1 muestra alta satisfacción de participantes con el resultado de decisión
  4. Aplicabilidad del Método: Desempeño excelente en escenarios de decisión rápida a pequeña escala

Trabajo Relacionado

Principales Direcciones de Investigación

  1. Métodos Tradicionales de GDM: Basados en agregación de preferencias numéricas y mecanismos de votación estructurada
  2. Sistemas GDM Difusos: Utilización de conjuntos y lógica difusa para manejar incertidumbre
  3. Aplicación de Análisis de Sentimientos en Decisiones: Integración de tecnología NLP en sistemas de apoyo a la decisión
  4. Mecanismos de Logro de Consenso: Modelos de consenso en toma de decisiones grupales a gran escala

Ventajas del Presente Artículo Comparado con Trabajo Relacionado

  1. Método Integral: Integración simultánea de preferencias explícitas e información de sentimiento implícita
  2. Diseño Centrado en el Ser Humano: Evaluación de consenso basada en retroalimentación subjetiva de participantes
  3. Orientación Práctica: Diseño dirigido a escenarios de comunicación en lenguaje natural en la realidad
  4. Aplicación Integral de Lógica Difusa: Uso sistemático de inferencia difusa en agregación de preferencias y medición de consenso

Conclusiones y Discusión

Conclusiones Principales

  1. Efectividad del Método: El sistema GDM de consenso difuso propuesto puede integrar efectivamente información de múltiples fuentes y lograr alto consenso
  2. Valor del Análisis de Sentimientos: La información de sentimiento en discusiones de texto contribuye significativamente a la calidad de decisión
  3. Superioridad del Mecanismo de Consenso: La medición de consenso basada en retroalimentación humana es más coherente con requisitos prácticos que el cálculo de similitud tradicional
  4. Éxito de Aplicación a Pequeña Escala: Se verificó la practicidad del método en escenarios de decisión rápida como selección de restaurante

Limitaciones

  1. Dependencia de Texto: La efectividad del método depende de la calidad y cantidad del texto de discusión; el desempeño puede disminuir con texto limitado
  2. Restricción de Escala: Actualmente solo verificado en decisiones a pequeña escala; la efectividad en aplicaciones a gran escala requiere validación
  3. Especificidad de Dominio: La configuración de pesos (como sentimiento 0.6, emoción 0.4) puede requerir ajuste según escenarios de aplicación específicos
  4. Limitación de Idioma: Las herramientas de análisis de sentimientos se orientan principalmente al inglés; el soporte multilingüe requiere mejora

Direcciones Futuras

  1. Mecanismo de Pesos Adaptativos: Desarrollo de algoritmos de ajuste de pesos adaptativos basados en contexto
  2. Validación a Gran Escala: Prueba del desempeño del sistema en tareas de decisión más complejas
  3. Extensión Multimodal: Integración de información multimodal como voz e imágenes
  4. Adaptación Transcultural: Investigación de diferencias en expresión emocional entre diferentes contextos culturales

Evaluación Profunda

Fortalezas

  1. Innovación Fuerte: Primera combinación sistemática de análisis de sentimientos, lógica difusa y toma de decisiones grupales
  2. Alto Valor Práctico: Soluciona el problema de toma de decisiones en escenarios de comunicación en lenguaje natural en la realidad
  3. Marco Metodológico Completo: Forma un marco técnico completo desde obtención de preferencias hasta evaluación de consenso
  4. Verificación Suficiente: Demuestra detalladamente la operabilidad del método mediante casos concretos

Insuficiencias

  1. Escala Experimental Limitada: Verificación usando solo un escenario único y datos a pequeña escala
  2. Falta de Fundamento Teórico para Configuración de Parámetros: La selección de parámetros como pesos sentimiento-emoción carece de apoyo teórico o experimental suficiente
  3. Experimentos Comparativos Insuficientes: Falta de comparación sistemática con otros métodos GDM avanzados
  4. Capacidad de Generalización Desconocida: La aplicabilidad en diferentes tipos de tareas de decisión requiere validación

Impacto

  1. Contribución Académica: Introduce nuevas rutas técnicas y mecanismos de evaluación al campo GDM
  2. Perspectiva de Aplicación: Posee amplias perspectivas de aplicación en colaboración en línea, recomendaciones de comercio electrónico y otros campos
  3. Inspiración Metodológica: Proporciona nuevas ideas para investigación posterior sobre fusión de análisis de sentimientos y decisiones

Escenarios Aplicables

  1. Decisiones Rápidas a Pequeña Escala: Como selección de restaurante, arreglo de actividades y otras decisiones grupales cotidianas
  2. Plataformas de Colaboración en Línea: Toma de decisiones de equipos remotos basada en discusiones de chat
  3. Selección de Grupos de Consumidores: Selección de productos/servicios basada en reseñas y discusiones
  4. Escenarios de Educación y Capacitación: Selección y evaluación de recursos de aprendizaje por grupos de estudiantes

Referencias

El artículo cita 51 referencias relacionadas, que incluyen principalmente:

  • Teoría clásica y métodos de toma de decisiones grupales
  • Aplicación de lógica difusa en decisiones
  • Técnicas de análisis de sentimientos y procesamiento de lenguaje natural
  • Investigación relacionada con comunicación mediada por computadora
  • Avances recientes en mecanismos de logro de consenso

Evaluación General: Este artículo propone un marco innovador de toma de decisiones grupales que integra exitosamente técnicas de análisis de sentimientos y lógica difusa. Aunque existe espacio para mejora en la amplitud y profundidad de verificación experimental, su ruta técnica es novedosa, su valor práctico es evidente, y proporciona una contribución valiosa al desarrollo del campo GDM.