2025-11-25T15:55:18.432351

Group Decision-Making System with Sentiment Analysis of Discussion Chat and Fuzzy Consensus Modeling

Yerkin, Shamoi

Group Decision-Making (GDM) plays a crucial role in various real-life scenarios where individuals express their opinions in natural language rather than structured numerical values. Traditional GDM approaches often overlook the subjectivity and ambiguity present in human discussions, making it challenging to achieve a fair and consensus-driven decision. This paper proposes a fuzzy consensus-based group decision-making system that integrates sentiment and emotion analysis to extract preference values from textual inputs. The proposed framework combines explicit voting preferences with sentiment scores derived from chat discussions, which are then processed using a Fuzzy Inference System (FIS) to compute a total preference score for each alternative and determine the top-ranked option. To ensure fairness in group decision-making, we introduce a fuzzy logic-based consensus measurement model that evaluates participants' agreement and confidence levels to assess overall feedback. To illustrate the effectiveness of our approach, we apply the methodology to a restaurant selection scenario, where a group of individuals must decide on a dining option based on brief chat discussions. The results demonstrate that the fuzzy consensus mechanism successfully aggregates individual preferences and ensures a balanced outcome that accurately reflects group sentiment.

academic

Système de Prise de Décision Collective avec Analyse des Sentiments des Discussions par Chat et Modélisation du Consensus Flou

Informations Fondamentales

ID de l'article : 2503.18765
Titre : Group Decision-Making System with Sentiment Analysis of Discussion Chat and Fuzzy Consensus Modeling
Auteurs : Adilet Yerkin, Pakizar Shamoi (Université Technique Kazakh-Britannique)
Classification : cs.HC (Interaction Homme-Ordinateur)
Date de publication : 14 octobre 2025 (arXiv v2)
Lien de l'article : https://arxiv.org/abs/2503.18765

Résumé

La prise de décision collective (PDC) joue un rôle important dans la vie réelle, les individus exprimant généralement leurs opinions en langage naturel plutôt qu'en valeurs numériques structurées. Les méthodes traditionnelles de PDC ignorent souvent la subjectivité et l'ambiguïté inhérentes aux discussions humaines, rendant difficile la réalisation de décisions équitables et basées sur le consensus. Cet article propose un système de prise de décision collective basé sur le consensus flou, qui intègre l'analyse des sentiments et des émotions pour extraire les valeurs de préférence à partir des entrées textuelles. Le cadre proposé combine les préférences de vote explicites avec les scores de sentiment extraits des discussions par chat, puis utilise un système d'inférence floue (SIF) pour traiter ces données, calculer le score de préférence total pour chaque alternative et déterminer l'option classée la plus haute. Pour assurer l'équité de la prise de décision collective, un modèle de mesure du consensus basé sur la logique floue est introduit, qui évalue le niveau d'accord et de confiance des participants pour évaluer les commentaires globaux.

Contexte de Recherche et Motivation

1. Problèmes à Résoudre

Les systèmes traditionnels de prise de décision collective font face aux défis fondamentaux suivants :

Absence de traitement du langage naturel : Les systèmes PDC existants dépendent principalement d'évaluations numériques structurées, alors que dans la réalité, les gens expriment davantage leurs préférences en langage naturel
Traitement insuffisant de la subjectivité et de l'ambiguïté : Les méthodes traditionnelles ont du mal à gérer la subjectivité et l'incertitude inhérentes aux discussions humaines
Mécanismes de mesure du consensus imparfaits : Absence de mécanismes efficaces pour évaluer le degré de consensus entre les membres du groupe
Limitations de la communication médiatisée par ordinateur (CMO) : Bien que les discussions en ligne facilitent la collaboration, elles manquent d'expression émotionnelle, affectant la réalisation du consensus

2. Importance du Problème

Besoins d'applications pratiques : La prise de décision moderne dépend de plus en plus des plateformes en ligne et de la communication numérique
Exigences d'équité : Nécessité d'assurer que les opinions de tous les participants soient considérées et intégrées équitablement
Amélioration de l'efficacité : L'analyse automatisée des sentiments et l'agrégation des préférences peuvent améliorer l'efficacité décisionnelle

3. Limitations des Méthodes Existantes

Exigences de numérisation : Les méthodes traditionnelles exigent que les participants fournissent des évaluations numériques explicites, ce qui ne correspond pas aux modes de communication naturels
Perte d'informations émotionnelles : Ignorance des informations sentimentales riches contenues dans les discussions textuelles
Mécanismes d'évaluation du consensus unidimensionnels : Basés principalement sur des fonctions de similarité, sans tenir compte de la satisfaction des experts et du niveau de confiance

Contributions Principales

Modèle de mesure du consensus flou : Développement d'un modèle de mesure du consensus basé sur la logique floue, évaluant le niveau d'accord et de confiance des participants, garantissant un processus décisionnel équitable et conforme à la cognition humaine
Cadre hybride d'agrégation des préférences : Le système combine les préférences de vote explicites avec les scores de sentiment, calculant le score de préférence total pour chaque alternative via un système d'inférence floue
Validation de la prise de décision à petite échelle : Vérification de l'efficacité de la méthode dans un scénario de sélection de restaurant, réalisant un niveau de consensus élevé dans la prise de décision avec participation humaine
Mesure du consensus basée sur la cohérence humaine : Proposition d'une méthode d'évaluation du consensus basée sur l'accord des experts et le niveau de confiance, plutôt que de dépendre uniquement des fonctions de similarité calculées automatiquement

Explication Détaillée de la Méthode

Définition de la Tâche

Entrées :

Ensemble d'alternatives X = {x₁, x₂, ..., xₙ}
Ensemble d'experts E = {e₁, e₂, ..., eₘ}
Ensemble de caractéristiques F = {f₁, f₂, ..., fₚ}
Contenu de discussion textuelle

Sorties :

Alternative classée la plus haute
Évaluation du niveau de consensus du groupe

Contraintes :

Plage d'évaluation des préférences : {-1, 0, 1} (opposition, sans importance, approbation)
Plage de scores de sentiment : -1, 1
Plage de score de préférence total : 0, 10

Architecture du Modèle

1. Système d'Acquisition des Préférences

Les experts fournissent des évaluations de préférence pour chaque caractéristique, la formule de calcul des valeurs de préférence étant :

Prefₑⱼ(xᵢ) = Σᵢ,ⱼ,ₖ fₖ(xᵢ) × zₖ(eⱼ)

où fₖ(xᵢ) est la valeur de la k-ième caractéristique de l'alternative xᵢ, et zₖ(eⱼ) est l'évaluation de préférence de l'expert eⱼ pour la k-ième caractéristique.

2. Module d'Analyse des Sentiments et des Émotions

Analyse des sentiments : Utilisation de l'outil d'analyse des sentiments VADER pour extraire les scores de sentiment composites (de -1 à +1)
Analyse des émotions : Utilisation de la bibliothèque Text2Emotion pour identifier cinq émotions (surprise, peur, tristesse, joie, colère)
Score de sentiment synthétisé : SP = αS + βE, où α et β sont les poids équilibrant l'importance du sentiment et de l'émotion

Calcul du score émotionnel :

Score d'émotions positives (SEP) = max('happy', 'surprise')
Score d'émotions négatives (SEN) = max('angry', 'sad', 'fear')
Score émotionnel synthétisé = SEP - SEN
Score de sentiment total = Score de sentiment × 0,6 + Score émotionnel × 0,4

3. Système d'Inférence Floue (SIF)

Variables d'entrée :

Préférence de vote (0-100) : Préférence de vote explicite de l'expert pour l'alternative
Préférence sentimentale (-1 à 1) : Évaluation sentimentale extraite de la discussion textuelle

Variable de sortie :

Score de préférence total (0-10) : Utilisé pour classer toutes les alternatives

Règles floues : Définition de 15 règles floues, produisant les scores de préférence totaux correspondants basés sur différentes combinaisons de préférences de vote et sentimentales.

4. Mesure du Consensus Basée sur la Cohérence Humaine

Calcul du score de rétroaction : Utilisation d'un système d'inférence floue pour traiter le niveau d'accord et de confiance des experts

Ensemble de niveaux d'accord : AL = {al₁, al₂, ..., alₙ}, alᵢ ∈ 0, 10
Ensemble de niveaux de confiance : CL = {cl₁, cl₂, ..., clₙ}, clᵢ ∈ 0, 10

Fonctions d'appartenance trapézoïdales :

μ(x) = max(min((x-a)/(b-a), 1, (d-x)/(d-c)), 0)

Évaluation du niveau de consensus : Utilisation de l'écart interquartile (EIQ) pour évaluer le consensus global

EIQ = Q₃ - Q₁
Consensus élevé : EIQ < 2,0
Consensus modéré : 2,0 ≤ EIQ ≤ 4,0
Consensus faible : EIQ > 4,0

Points d'Innovation Technique

Intégration double des préférences : Première combinaison organique du vote explicite et de la préférence sentimentale implicite via un système d'inférence floue
Stratégie d'analyse sentimentale adaptative : Sélection de l'analyse pure des sentiments ou de l'analyse conjointe sentiment-émotion selon la longueur du texte de discussion
Évaluation du consensus centrée sur l'humain : Méthode de mesure du consensus basée sur les commentaires subjectifs des participants plutôt que sur le calcul de similarité objective
Traitement de l'incertitude par logique floue : Utilisation complète des ensembles flous et de l'inférence floue pour gérer l'incertitude et la subjectivité dans le processus décisionnel

Configuration Expérimentale

Ensemble de Données

Scénario de sélection de restaurant :

Alternatives : 4 restaurants (alter1-alter4)
Dimensions de caractéristiques : 5 caractéristiques
- feat1 : Économie (montant moyen de la facture)
- feat2 : Localisation (évaluation de la distance du centre-ville)
- feat3 : Options végétariennes (indicateur binaire)
- feat4 : Zone adaptée aux enfants (indicateur binaire)
- feat5 : Design intérieur (évaluation moyenne)
Participants : 5 experts (partp1-partp5)
Données de discussion : Messages textuels dans le chat de groupe

Métriques d'Évaluation

Score de préférence total : Score synthétisé dans la plage 0-10
Niveau de consensus : Classification basée sur l'EIQ (élevé/modéré/faible)
Score de rétroaction : Évaluation de la satisfaction des experts (0-10)
Score de rétroaction moyen : Satisfaction globale du groupe

Détails d'Implémentation

Poids des sentiments : Poids d'analyse des sentiments 0,6, poids d'analyse des émotions 0,4
Normalisation des caractéristiques : Traitement booléen des caractéristiques continues basé sur la moyenne
Inférence floue : Utilisation de fonctions d'appartenance trapézoïdales et de la méthode d'inférence Mamdani

Résultats Expérimentaux

Résultats Principaux

Scores de préférence de restaurant :

alter1 : 5,0 points
alter2 : 5,99 points (score le plus élevé, sélectionné comme meilleur choix)
alter3 : 5,0 points
alter4 : 5,36 points

Résultats d'évaluation du consensus :

Valeur EIQ : 0,19
Niveau de consensus : Élevé (EIQ < 2,0)
Score de rétroaction moyen : ≈ 8,1 (sur 10)

Analyse des rétroactions individuelles :

ID du participant	Accord (0-10)	Confiance (0-10)	Valeur de rétroaction
1	9	9	8,14
2	10	10	8,14
3	7	8	7,95
4	9	9	8,14
5	7	9	7,95

Analyse de Cas

Exemple d'analyse sentimentale :

Commentaire positif : "This restaurant has amazing food!" (score de sentiment : 0,81)
Commentaire négatif : "I don't like the location" (score de sentiment : -0,30)

Processus d'agrégation des préférences :

Calcul séparé des préférences de vote et des préférences sentimentales
Intégration via SIF pour obtenir le score de préférence total
alter2 affiche les meilleures performances en préférence de vote (62 points) et préférence sentimentale (0,67)

Découvertes Expérimentales

Réalisation d'un consensus élevé : EIQ = 0,19 indique un accord élevé des participants sur la décision finale
Valeur des informations sentimentales : L'analyse des sentiments complète efficacement les informations de vote explicites
Efficacité du système : Le score de rétroaction moyen de 8,1 montre une satisfaction élevée des participants envers le résultat décisionnel
Applicabilité de la méthode : Performance satisfaisante dans les scénarios de prise de décision rapide à petite échelle

Travaux Connexes

Principales Directions de Recherche

Méthodes PDC traditionnelles : Agrégation des préférences numériques et mécanismes de vote structurés
Systèmes PDC flous : Utilisation d'ensembles et de logique floue pour gérer l'incertitude
Applications de l'analyse sentimentale dans la prise de décision : Intégration de techniques de traitement du langage naturel dans les systèmes d'aide à la décision
Mécanismes de réalisation du consensus : Modèles de consensus dans la prise de décision collective à grande échelle

Avantages de cet Article par Rapport aux Travaux Connexes

Approche intégrative : Intégration simultanée des préférences explicites et des informations sentimentales implicites
Conception centrée sur l'humain : Évaluation du consensus basée sur les commentaires subjectifs des participants
Orientation pratique : Conception pour les scénarios de communication en langage naturel dans la réalité
Application systématique de la logique floue : Utilisation systématique de l'inférence floue dans l'agrégation des préférences et la mesure du consensus

Conclusion et Discussion

Conclusions Principales

Efficacité de la méthode : Le système PDC basé sur le consensus flou proposé peut efficacement intégrer les informations multisources et réaliser un consensus élevé
Valeur de l'analyse sentimentale : Les informations sentimentales dans les discussions textuelles contribuent significativement à la qualité décisionnelle
Supériorité du mécanisme de consensus : La mesure du consensus basée sur les commentaires humains est plus conforme aux besoins réels que le calcul traditionnel de similarité
Succès de l'application à petite échelle : Vérification de l'applicabilité pratique de la méthode dans des scénarios de prise de décision rapide comme la sélection de restaurant

Limitations

Dépendance textuelle : L'efficacité de la méthode dépend de la qualité et de la quantité du texte de discussion ; les performances peuvent diminuer avec un texte limité
Restrictions d'échelle : Actuellement validée uniquement dans des décisions à petite échelle ; l'efficacité des applications à grande échelle reste à vérifier
Spécificité du domaine : Les paramètres de poids (par exemple, sentiment 0,6, émotion 0,4) peuvent nécessiter un ajustement selon les scénarios d'application spécifiques
Limitations linguistiques : Les outils d'analyse sentimentale sont principalement orientés vers l'anglais ; le support multilingue reste à améliorer

Directions Futures

Mécanisme de poids adaptatif : Développement d'algorithmes d'ajustement des poids adaptatifs basés sur le contexte
Validation à grande échelle : Test des performances du système dans des tâches décisionnelles plus complexes
Extension multimodale : Intégration d'informations multimodales telles que la voix et les images
Adaptation transculturelle : Étude des différences d'expression sentimentale selon les contextes culturels

Évaluation Approfondie

Points Forts

Innovation forte : Première combinaison systématique de l'analyse sentimentale, de la logique floue et de la prise de décision collective
Valeur pratique élevée : Résolution des problèmes décisionnels dans les scénarios réels de communication en langage naturel
Méthodologie complète : Formation d'un cadre technique complet de l'acquisition des préférences à l'évaluation du consensus
Vérification suffisante : Démonstration détaillée de l'opérabilité de la méthode par des cas concrets

Insuffisances

Échelle expérimentale limitée : Vérification utilisant uniquement un scénario unique et des données à petite échelle
Manque de fondement théorique pour les paramètres : Les choix de paramètres tels que les poids sentiment-émotion manquent de soutien théorique ou expérimental suffisant
Expériences comparatives insuffisantes : Absence de comparaison systématique avec d'autres méthodes PDC avancées
Capacité de généralisation inconnue : L'applicabilité dans différents types de tâches décisionnelles reste à vérifier

Impact

Contribution académique : Introduction d'une nouvelle voie technologique et d'un mécanisme d'évaluation pour le domaine PDC
Perspectives d'application : Larges perspectives d'application dans la collaboration en ligne, les recommandations de commerce électronique, etc.
Inspiration méthodologique : Fourniture d'une nouvelle approche pour la fusion de l'analyse sentimentale et de la prise de décision pour les recherches ultérieures

Scénarios d'Application

Prise de décision rapide à petite échelle : Comme la sélection de restaurant, l'organisation d'événements et autres décisions collectives quotidiennes
Plateformes de collaboration en ligne : Prise de décision d'équipe à distance basée sur les discussions par chat
Choix collectifs des consommateurs : Sélection de produits/services basée sur les avis et discussions
Scénarios éducatifs et de formation : Sélection et évaluation des ressources d'apprentissage par des groupes d'étudiants

Références

L'article cite 51 références connexes, incluant principalement :

Théories et méthodes classiques de la prise de décision collective
Applications de la logique floue dans la prise de décision
Techniques d'analyse sentimentale et de traitement du langage naturel
Recherches connexes sur la communication médiatisée par ordinateur
Progrès récents dans les mécanismes de réalisation du consensus

Évaluation globale : Cet article propose un cadre innovant de prise de décision collective, intégrant avec succès les techniques d'analyse sentimentale et de logique floue. Bien qu'il y ait de la place pour l'amélioration en termes d'ampleur et de profondeur de la vérification expérimentale, sa voie technologique est novatrice, sa valeur pratique est évidente, et elle apporte une contribution précieuse au développement du domaine PDC.