2025-11-25T15:55:18.432351

Group Decision-Making System with Sentiment Analysis of Discussion Chat and Fuzzy Consensus Modeling

Yerkin, Shamoi
Group Decision-Making (GDM) plays a crucial role in various real-life scenarios where individuals express their opinions in natural language rather than structured numerical values. Traditional GDM approaches often overlook the subjectivity and ambiguity present in human discussions, making it challenging to achieve a fair and consensus-driven decision. This paper proposes a fuzzy consensus-based group decision-making system that integrates sentiment and emotion analysis to extract preference values from textual inputs. The proposed framework combines explicit voting preferences with sentiment scores derived from chat discussions, which are then processed using a Fuzzy Inference System (FIS) to compute a total preference score for each alternative and determine the top-ranked option. To ensure fairness in group decision-making, we introduce a fuzzy logic-based consensus measurement model that evaluates participants' agreement and confidence levels to assess overall feedback. To illustrate the effectiveness of our approach, we apply the methodology to a restaurant selection scenario, where a group of individuals must decide on a dining option based on brief chat discussions. The results demonstrate that the fuzzy consensus mechanism successfully aggregates individual preferences and ensures a balanced outcome that accurately reflects group sentiment.
academic

Système de Prise de Décision Collective avec Analyse des Sentiments des Discussions par Chat et Modélisation du Consensus Flou

Informations Fondamentales

  • ID de l'article : 2503.18765
  • Titre : Group Decision-Making System with Sentiment Analysis of Discussion Chat and Fuzzy Consensus Modeling
  • Auteurs : Adilet Yerkin, Pakizar Shamoi (Université Technique Kazakh-Britannique)
  • Classification : cs.HC (Interaction Homme-Ordinateur)
  • Date de publication : 14 octobre 2025 (arXiv v2)
  • Lien de l'article : https://arxiv.org/abs/2503.18765

Résumé

La prise de décision collective (PDC) joue un rôle important dans la vie réelle, les individus exprimant généralement leurs opinions en langage naturel plutôt qu'en valeurs numériques structurées. Les méthodes traditionnelles de PDC ignorent souvent la subjectivité et l'ambiguïté inhérentes aux discussions humaines, rendant difficile la réalisation de décisions équitables et basées sur le consensus. Cet article propose un système de prise de décision collective basé sur le consensus flou, qui intègre l'analyse des sentiments et des émotions pour extraire les valeurs de préférence à partir des entrées textuelles. Le cadre proposé combine les préférences de vote explicites avec les scores de sentiment extraits des discussions par chat, puis utilise un système d'inférence floue (SIF) pour traiter ces données, calculer le score de préférence total pour chaque alternative et déterminer l'option classée la plus haute. Pour assurer l'équité de la prise de décision collective, un modèle de mesure du consensus basé sur la logique floue est introduit, qui évalue le niveau d'accord et de confiance des participants pour évaluer les commentaires globaux.

Contexte de Recherche et Motivation

1. Problèmes à Résoudre

Les systèmes traditionnels de prise de décision collective font face aux défis fondamentaux suivants :

  • Absence de traitement du langage naturel : Les systèmes PDC existants dépendent principalement d'évaluations numériques structurées, alors que dans la réalité, les gens expriment davantage leurs préférences en langage naturel
  • Traitement insuffisant de la subjectivité et de l'ambiguïté : Les méthodes traditionnelles ont du mal à gérer la subjectivité et l'incertitude inhérentes aux discussions humaines
  • Mécanismes de mesure du consensus imparfaits : Absence de mécanismes efficaces pour évaluer le degré de consensus entre les membres du groupe
  • Limitations de la communication médiatisée par ordinateur (CMO) : Bien que les discussions en ligne facilitent la collaboration, elles manquent d'expression émotionnelle, affectant la réalisation du consensus

2. Importance du Problème

  • Besoins d'applications pratiques : La prise de décision moderne dépend de plus en plus des plateformes en ligne et de la communication numérique
  • Exigences d'équité : Nécessité d'assurer que les opinions de tous les participants soient considérées et intégrées équitablement
  • Amélioration de l'efficacité : L'analyse automatisée des sentiments et l'agrégation des préférences peuvent améliorer l'efficacité décisionnelle

3. Limitations des Méthodes Existantes

  • Exigences de numérisation : Les méthodes traditionnelles exigent que les participants fournissent des évaluations numériques explicites, ce qui ne correspond pas aux modes de communication naturels
  • Perte d'informations émotionnelles : Ignorance des informations sentimentales riches contenues dans les discussions textuelles
  • Mécanismes d'évaluation du consensus unidimensionnels : Basés principalement sur des fonctions de similarité, sans tenir compte de la satisfaction des experts et du niveau de confiance

Contributions Principales

  1. Modèle de mesure du consensus flou : Développement d'un modèle de mesure du consensus basé sur la logique floue, évaluant le niveau d'accord et de confiance des participants, garantissant un processus décisionnel équitable et conforme à la cognition humaine
  2. Cadre hybride d'agrégation des préférences : Le système combine les préférences de vote explicites avec les scores de sentiment, calculant le score de préférence total pour chaque alternative via un système d'inférence floue
  3. Validation de la prise de décision à petite échelle : Vérification de l'efficacité de la méthode dans un scénario de sélection de restaurant, réalisant un niveau de consensus élevé dans la prise de décision avec participation humaine
  4. Mesure du consensus basée sur la cohérence humaine : Proposition d'une méthode d'évaluation du consensus basée sur l'accord des experts et le niveau de confiance, plutôt que de dépendre uniquement des fonctions de similarité calculées automatiquement

Explication Détaillée de la Méthode

Définition de la Tâche

Entrées :

  • Ensemble d'alternatives X = {x₁, x₂, ..., xₙ}
  • Ensemble d'experts E = {e₁, e₂, ..., eₘ}
  • Ensemble de caractéristiques F = {f₁, f₂, ..., fₚ}
  • Contenu de discussion textuelle

Sorties :

  • Alternative classée la plus haute
  • Évaluation du niveau de consensus du groupe

Contraintes :

  • Plage d'évaluation des préférences : {-1, 0, 1} (opposition, sans importance, approbation)
  • Plage de scores de sentiment : -1, 1
  • Plage de score de préférence total : 0, 10

Architecture du Modèle

1. Système d'Acquisition des Préférences

Les experts fournissent des évaluations de préférence pour chaque caractéristique, la formule de calcul des valeurs de préférence étant :

Prefₑⱼ(xᵢ) = Σᵢ,ⱼ,ₖ fₖ(xᵢ) × zₖ(eⱼ)

où fₖ(xᵢ) est la valeur de la k-ième caractéristique de l'alternative xᵢ, et zₖ(eⱼ) est l'évaluation de préférence de l'expert eⱼ pour la k-ième caractéristique.

2. Module d'Analyse des Sentiments et des Émotions

  • Analyse des sentiments : Utilisation de l'outil d'analyse des sentiments VADER pour extraire les scores de sentiment composites (de -1 à +1)
  • Analyse des émotions : Utilisation de la bibliothèque Text2Emotion pour identifier cinq émotions (surprise, peur, tristesse, joie, colère)
  • Score de sentiment synthétisé : SP = αS + βE, où α et β sont les poids équilibrant l'importance du sentiment et de l'émotion

Calcul du score émotionnel :

Score d'émotions positives (SEP) = max('happy', 'surprise')
Score d'émotions négatives (SEN) = max('angry', 'sad', 'fear')
Score émotionnel synthétisé = SEP - SEN
Score de sentiment total = Score de sentiment × 0,6 + Score émotionnel × 0,4

3. Système d'Inférence Floue (SIF)

Variables d'entrée :

  • Préférence de vote (0-100) : Préférence de vote explicite de l'expert pour l'alternative
  • Préférence sentimentale (-1 à 1) : Évaluation sentimentale extraite de la discussion textuelle

Variable de sortie :

  • Score de préférence total (0-10) : Utilisé pour classer toutes les alternatives

Règles floues : Définition de 15 règles floues, produisant les scores de préférence totaux correspondants basés sur différentes combinaisons de préférences de vote et sentimentales.

4. Mesure du Consensus Basée sur la Cohérence Humaine

Calcul du score de rétroaction : Utilisation d'un système d'inférence floue pour traiter le niveau d'accord et de confiance des experts

  • Ensemble de niveaux d'accord : AL = {al₁, al₂, ..., alₙ}, alᵢ ∈ 0, 10
  • Ensemble de niveaux de confiance : CL = {cl₁, cl₂, ..., clₙ}, clᵢ ∈ 0, 10

Fonctions d'appartenance trapézoïdales :

μ(x) = max(min((x-a)/(b-a), 1, (d-x)/(d-c)), 0)

Évaluation du niveau de consensus : Utilisation de l'écart interquartile (EIQ) pour évaluer le consensus global

  • EIQ = Q₃ - Q₁
  • Consensus élevé : EIQ < 2,0
  • Consensus modéré : 2,0 ≤ EIQ ≤ 4,0
  • Consensus faible : EIQ > 4,0

Points d'Innovation Technique

  1. Intégration double des préférences : Première combinaison organique du vote explicite et de la préférence sentimentale implicite via un système d'inférence floue
  2. Stratégie d'analyse sentimentale adaptative : Sélection de l'analyse pure des sentiments ou de l'analyse conjointe sentiment-émotion selon la longueur du texte de discussion
  3. Évaluation du consensus centrée sur l'humain : Méthode de mesure du consensus basée sur les commentaires subjectifs des participants plutôt que sur le calcul de similarité objective
  4. Traitement de l'incertitude par logique floue : Utilisation complète des ensembles flous et de l'inférence floue pour gérer l'incertitude et la subjectivité dans le processus décisionnel

Configuration Expérimentale

Ensemble de Données

Scénario de sélection de restaurant :

  • Alternatives : 4 restaurants (alter1-alter4)
  • Dimensions de caractéristiques : 5 caractéristiques
    • feat1 : Économie (montant moyen de la facture)
    • feat2 : Localisation (évaluation de la distance du centre-ville)
    • feat3 : Options végétariennes (indicateur binaire)
    • feat4 : Zone adaptée aux enfants (indicateur binaire)
    • feat5 : Design intérieur (évaluation moyenne)
  • Participants : 5 experts (partp1-partp5)
  • Données de discussion : Messages textuels dans le chat de groupe

Métriques d'Évaluation

  1. Score de préférence total : Score synthétisé dans la plage 0-10
  2. Niveau de consensus : Classification basée sur l'EIQ (élevé/modéré/faible)
  3. Score de rétroaction : Évaluation de la satisfaction des experts (0-10)
  4. Score de rétroaction moyen : Satisfaction globale du groupe

Détails d'Implémentation

  • Poids des sentiments : Poids d'analyse des sentiments 0,6, poids d'analyse des émotions 0,4
  • Normalisation des caractéristiques : Traitement booléen des caractéristiques continues basé sur la moyenne
  • Inférence floue : Utilisation de fonctions d'appartenance trapézoïdales et de la méthode d'inférence Mamdani

Résultats Expérimentaux

Résultats Principaux

Scores de préférence de restaurant :

  • alter1 : 5,0 points
  • alter2 : 5,99 points (score le plus élevé, sélectionné comme meilleur choix)
  • alter3 : 5,0 points
  • alter4 : 5,36 points

Résultats d'évaluation du consensus :

  • Valeur EIQ : 0,19
  • Niveau de consensus : Élevé (EIQ < 2,0)
  • Score de rétroaction moyen : ≈ 8,1 (sur 10)

Analyse des rétroactions individuelles :

ID du participantAccord (0-10)Confiance (0-10)Valeur de rétroaction
1998,14
210108,14
3787,95
4998,14
5797,95

Analyse de Cas

Exemple d'analyse sentimentale :

  • Commentaire positif : "This restaurant has amazing food!" (score de sentiment : 0,81)
  • Commentaire négatif : "I don't like the location" (score de sentiment : -0,30)

Processus d'agrégation des préférences :

  1. Calcul séparé des préférences de vote et des préférences sentimentales
  2. Intégration via SIF pour obtenir le score de préférence total
  3. alter2 affiche les meilleures performances en préférence de vote (62 points) et préférence sentimentale (0,67)

Découvertes Expérimentales

  1. Réalisation d'un consensus élevé : EIQ = 0,19 indique un accord élevé des participants sur la décision finale
  2. Valeur des informations sentimentales : L'analyse des sentiments complète efficacement les informations de vote explicites
  3. Efficacité du système : Le score de rétroaction moyen de 8,1 montre une satisfaction élevée des participants envers le résultat décisionnel
  4. Applicabilité de la méthode : Performance satisfaisante dans les scénarios de prise de décision rapide à petite échelle

Travaux Connexes

Principales Directions de Recherche

  1. Méthodes PDC traditionnelles : Agrégation des préférences numériques et mécanismes de vote structurés
  2. Systèmes PDC flous : Utilisation d'ensembles et de logique floue pour gérer l'incertitude
  3. Applications de l'analyse sentimentale dans la prise de décision : Intégration de techniques de traitement du langage naturel dans les systèmes d'aide à la décision
  4. Mécanismes de réalisation du consensus : Modèles de consensus dans la prise de décision collective à grande échelle

Avantages de cet Article par Rapport aux Travaux Connexes

  1. Approche intégrative : Intégration simultanée des préférences explicites et des informations sentimentales implicites
  2. Conception centrée sur l'humain : Évaluation du consensus basée sur les commentaires subjectifs des participants
  3. Orientation pratique : Conception pour les scénarios de communication en langage naturel dans la réalité
  4. Application systématique de la logique floue : Utilisation systématique de l'inférence floue dans l'agrégation des préférences et la mesure du consensus

Conclusion et Discussion

Conclusions Principales

  1. Efficacité de la méthode : Le système PDC basé sur le consensus flou proposé peut efficacement intégrer les informations multisources et réaliser un consensus élevé
  2. Valeur de l'analyse sentimentale : Les informations sentimentales dans les discussions textuelles contribuent significativement à la qualité décisionnelle
  3. Supériorité du mécanisme de consensus : La mesure du consensus basée sur les commentaires humains est plus conforme aux besoins réels que le calcul traditionnel de similarité
  4. Succès de l'application à petite échelle : Vérification de l'applicabilité pratique de la méthode dans des scénarios de prise de décision rapide comme la sélection de restaurant

Limitations

  1. Dépendance textuelle : L'efficacité de la méthode dépend de la qualité et de la quantité du texte de discussion ; les performances peuvent diminuer avec un texte limité
  2. Restrictions d'échelle : Actuellement validée uniquement dans des décisions à petite échelle ; l'efficacité des applications à grande échelle reste à vérifier
  3. Spécificité du domaine : Les paramètres de poids (par exemple, sentiment 0,6, émotion 0,4) peuvent nécessiter un ajustement selon les scénarios d'application spécifiques
  4. Limitations linguistiques : Les outils d'analyse sentimentale sont principalement orientés vers l'anglais ; le support multilingue reste à améliorer

Directions Futures

  1. Mécanisme de poids adaptatif : Développement d'algorithmes d'ajustement des poids adaptatifs basés sur le contexte
  2. Validation à grande échelle : Test des performances du système dans des tâches décisionnelles plus complexes
  3. Extension multimodale : Intégration d'informations multimodales telles que la voix et les images
  4. Adaptation transculturelle : Étude des différences d'expression sentimentale selon les contextes culturels

Évaluation Approfondie

Points Forts

  1. Innovation forte : Première combinaison systématique de l'analyse sentimentale, de la logique floue et de la prise de décision collective
  2. Valeur pratique élevée : Résolution des problèmes décisionnels dans les scénarios réels de communication en langage naturel
  3. Méthodologie complète : Formation d'un cadre technique complet de l'acquisition des préférences à l'évaluation du consensus
  4. Vérification suffisante : Démonstration détaillée de l'opérabilité de la méthode par des cas concrets

Insuffisances

  1. Échelle expérimentale limitée : Vérification utilisant uniquement un scénario unique et des données à petite échelle
  2. Manque de fondement théorique pour les paramètres : Les choix de paramètres tels que les poids sentiment-émotion manquent de soutien théorique ou expérimental suffisant
  3. Expériences comparatives insuffisantes : Absence de comparaison systématique avec d'autres méthodes PDC avancées
  4. Capacité de généralisation inconnue : L'applicabilité dans différents types de tâches décisionnelles reste à vérifier

Impact

  1. Contribution académique : Introduction d'une nouvelle voie technologique et d'un mécanisme d'évaluation pour le domaine PDC
  2. Perspectives d'application : Larges perspectives d'application dans la collaboration en ligne, les recommandations de commerce électronique, etc.
  3. Inspiration méthodologique : Fourniture d'une nouvelle approche pour la fusion de l'analyse sentimentale et de la prise de décision pour les recherches ultérieures

Scénarios d'Application

  1. Prise de décision rapide à petite échelle : Comme la sélection de restaurant, l'organisation d'événements et autres décisions collectives quotidiennes
  2. Plateformes de collaboration en ligne : Prise de décision d'équipe à distance basée sur les discussions par chat
  3. Choix collectifs des consommateurs : Sélection de produits/services basée sur les avis et discussions
  4. Scénarios éducatifs et de formation : Sélection et évaluation des ressources d'apprentissage par des groupes d'étudiants

Références

L'article cite 51 références connexes, incluant principalement :

  • Théories et méthodes classiques de la prise de décision collective
  • Applications de la logique floue dans la prise de décision
  • Techniques d'analyse sentimentale et de traitement du langage naturel
  • Recherches connexes sur la communication médiatisée par ordinateur
  • Progrès récents dans les mécanismes de réalisation du consensus

Évaluation globale : Cet article propose un cadre innovant de prise de décision collective, intégrant avec succès les techniques d'analyse sentimentale et de logique floue. Bien qu'il y ait de la place pour l'amélioration en termes d'ampleur et de profondeur de la vérification expérimentale, sa voie technologique est novatrice, sa valeur pratique est évidente, et elle apporte une contribution précieuse au développement du domaine PDC.