Efficient support ticket resolution using Knowledge Graphs
Varghese, Tian
A review of over 160,000 customer cases indicates that about 90% of time is spent by the product support for solving around 10% of subset of tickets where a trivial solution may not exist. Many of these challenging cases require the support of several engineers working together within a "swarm", and some also need to go to development support as bugs. These challenging customer issues represent a major opportunity for machine learning and knowledge graph that identifies the ideal engineer / group of engineers(swarm) that can best address the solution, reducing the wait times for the customer. The concrete ML task we consider here is a learning-to-rank(LTR) task that given an incident and a set of engineers currently assigned to the incident (which might be the empty set in the non-swarming context), produce a ranked list of engineers best fit to help resolve that incident. To calculate the rankings, we may consider a wide variety of input features including the incident description provided by the customer, the affected component(s), engineer ratings of their expertise, knowledge base article text written by engineers, response to customer text written by engineers, and historic swarming data. The central hypothesis test is that by including a holistic set of contextual data around which cases an engineer has solved, we can significantly improve the LTR algorithm over benchmark models. The article proposes a novel approach of modelling Knowledge Graph embeddings from multiple data sources, including the swarm information. The results obtained proves that by incorporating this additional context, we can improve the recommendations significantly over traditional machine learning methods like TF-IDF.
academic
Résolution efficace des tickets d'assistance à l'aide de graphes de connaissances
Une analyse basée sur plus de 160 000 cas clients montre que les équipes d'assistance aux produits consacrent environ 90 % de leur temps à résoudre environ 10 % des tickets complexes, qui n'ont souvent pas de solution évidente. De nombreux cas difficiles nécessitent la collaboration de plusieurs ingénieurs formant un « essaim » (swarm), certains nécessitant même le soutien de l'équipe de développement pour être traités comme des bogues. Cet article modélise ce problème comme une tâche d'apprentissage au classement (LTR), générant une liste d'ingénieurs classée optimale pour résoudre un incident donné, compte tenu de l'incident et de l'ensemble des ingénieurs actuellement assignés. L'article propose une approche novatrice utilisant des plongements de graphes de connaissances construits à partir de multiples sources de données, incluant les informations d'essaim. Les résultats expérimentaux démontrent des améliorations significatives par rapport aux méthodes d'apprentissage automatique traditionnelles telles que TF-IDF.
Problème fondamental: Faible efficacité de l'allocation des tickets d'assistance client, avec environ 90 % du temps consacré à 10 % des tickets complexes
Impact commercial: Les délais de traitement élevés affectent la satisfaction des clients et les résultats commerciaux
Défis techniques: Identifier l'ingénieur ou l'équipe d'ingénieurs idéale pour résoudre un problème technique spécifique
Méthodes ML traditionnelles: Les approches TF-IDF, forêts aléatoires, etc. sont relativement simples mais présentent une faible complexité de modèle
Modélisation insuffisante des relations: Incapacité à capturer les relations de collaboration entre ingénieurs et les modèles de résolution de problèmes en équipe
Contexte manquant: Manque de compréhension contextuelle complète des cas historiquement résolus par les ingénieurs
Limitations des systèmes de production: Les systèmes d'appariement d'experts existants utilisent des poids prédéfinis, manquant de capacité d'apprentissage
Basée sur les besoins commerciaux réels de plus de 160 000 cas clients internes chez SAP, utiliser l'apprentissage automatique et la technologie des graphes de connaissances pour optimiser l'appariement ingénieur-ticket, réduire les délais d'attente des clients et améliorer l'efficacité de la résolution de problèmes.
Approche novatrice de modélisation des graphes de connaissances: Propose une méthode de plongement de graphes de connaissances basée sur plusieurs sources de données, intégrant les informations de collaboration d'essaim
Cadre d'apprentissage au classement: Modélise le problème d'appariement d'experts comme une tâche LTR, optimisant directement l'objectif de classement
Fusion de données multimodales: Combine les données structurées (informations d'ingénieurs, composants) et non structurées (descriptions d'incidents, texte KBA)
Amélioration significative des performances: Réalise des améliorations substantielles par rapport aux méthodes traditionnelles sur plusieurs métriques d'évaluation
Application commerciale réelle: Solution de bout en bout basée sur les données réelles d'assistance client SAP
Fusion de données hétérogènes multi-sources: Première modélisation unifiée des descriptions d'incidents, KBA, collaborations d'essaim et informations de composants
Apprentissage de bout en bout: Optimise directement la tâche d'appariement d'experts plutôt que de dépendre de règles prédéfinies
Génération d'plongements dynamiques: Génère des représentations d'ingénieurs contextuellement pertinentes basées sur la structure graphique et les poids appris
Modélisation des relations d'essaim: Modélise explicitement les relations de collaboration entre ingénieurs, capturant les modèles de résolution de problèmes en équipe
Par rapport à TF-IDF: Amélioration de 33% (10K) et 100% (100K) en Top-50
Par rapport aux ML traditionnels: Amélioration supérieure à 10 fois
Coût d'entraînement: Les besoins en ressources GPU sont significativement plus élevés que les méthodes de référence, mais les gains de performance sont évidents
Efficacité de la méthode: La méthode de plongement de graphes de connaissances améliore significativement la précision de la recommandation d'experts
Valeur des données multi-sources: L'intégration des informations d'essaim, collaborations historiques et autres données contextuelles apporte des bénéfices substantiels
Avantages de l'apprentissage de bout en bout: L'optimisation directe de la tâche de recommandation est plus efficace que l'ingénierie de caractéristiques traditionnelle
Potentiel d'application réelle: Validé sur des données commerciales réelles, possédant une valeur de déploiement en production
Modèles transformateurs BERT, RoBERTa, ALBERT et autres
Méthodes de réseaux de neurones graphiques GraphSage, PinSage et autres
Références d'évaluation NLP GLUE, Super-GLUE et autres
Cadre d'apprentissage structuré neuronal
Évaluation globale: Ceci est un excellent travail appliquant des technologies d'IA de pointe à des problèmes commerciaux réels, avec une solution technique raisonnable, des résultats expérimentaux convaincants et une valeur académique et industrielle importante. Bien qu'il y ait encore de la place pour l'amélioration dans l'analyse théorique et la validation de la généralisation, sa méthode de modélisation innovante et ses améliorations de performance significatives en font une contribution importante au domaine de la recommandation d'experts.