2025-11-15T08:58:11.885290

Efficient support ticket resolution using Knowledge Graphs

Varghese, Tian

A review of over 160,000 customer cases indicates that about 90% of time is spent by the product support for solving around 10% of subset of tickets where a trivial solution may not exist. Many of these challenging cases require the support of several engineers working together within a "swarm", and some also need to go to development support as bugs. These challenging customer issues represent a major opportunity for machine learning and knowledge graph that identifies the ideal engineer / group of engineers(swarm) that can best address the solution, reducing the wait times for the customer. The concrete ML task we consider here is a learning-to-rank(LTR) task that given an incident and a set of engineers currently assigned to the incident (which might be the empty set in the non-swarming context), produce a ranked list of engineers best fit to help resolve that incident. To calculate the rankings, we may consider a wide variety of input features including the incident description provided by the customer, the affected component(s), engineer ratings of their expertise, knowledge base article text written by engineers, response to customer text written by engineers, and historic swarming data. The central hypothesis test is that by including a holistic set of contextual data around which cases an engineer has solved, we can significantly improve the LTR algorithm over benchmark models. The article proposes a novel approach of modelling Knowledge Graph embeddings from multiple data sources, including the swarm information. The results obtained proves that by incorporating this additional context, we can improve the recommendations significantly over traditional machine learning methods like TF-IDF.

academic

Effiziente Ticketlösung im Support mithilfe von Wissensgraphen

Grundinformationen

Paper-ID: 2501.00461
Titel: Efficient support ticket resolution using Knowledge Graphs
Autoren: Sherwin Varghese (SAP Labs India), James Tian (SAP Labs US)
Klassifizierung: cs.AI cs.LG cs.MA
Veröffentlichungsinstitution: SAP Labs
Paper-Link: https://arxiv.org/abs/2501.00461

Zusammenfassung

Eine Analyse von über 160.000 Kundenfall-Datensätzen zeigt, dass Produktsupport-Teams etwa 90% ihrer Zeit für die Lösung von etwa 10% der komplexen Tickets aufwenden, die häufig keine offensichtliche Lösung haben. Viele dieser schwierigen Fälle erfordern die Zusammenarbeit mehrerer Ingenieure in sogenannten „Schwärmen" (swarms), wobei einige sogar Unterstützung durch das Entwicklungsteam als Fehlerbehebung benötigen. Dieser Beitrag modelliert dieses Problem als Learning-to-Rank (LTR)-Aufgabe, die bei gegebenem Incident und aktuell zugewiesener Ingenieurgruppe eine optimale Rangliste von Ingenieuren zur Lösung des Incidents generiert. Der Artikel präsentiert einen neuartigen Ansatz durch die Modellierung von Wissensgraph-Embeddings aus mehreren Datenquellen, einschließlich Schwarm-Informationen. Experimentelle Ergebnisse zeigen signifikante Verbesserungen gegenüber traditionellen Machine-Learning-Methoden wie TF-IDF.

Forschungshintergrund und Motivation

Problemdefinition

Kernproblem: Ineffiziente Zuweisung von Kundensupport-Tickets; etwa 90% der Zeit wird für 10% der komplexen Tickets aufgewendet
Geschäftsauswirkungen: Lange Bearbeitungszeiten beeinflussen Kundenzufriedenheit und Geschäftsergebnisse
Technische Herausforderung: Identifikation idealer Ingenieure oder Ingenieurteams zur Lösung spezifischer technischer Probleme

Einschränkungen bestehender Methoden

Traditionelle ML-Methoden: TF-IDF-, Random-Forest-Verfahren sind relativ einfach, aber mit niedriger Modellkomplexität
Unzureichende Beziehungsmodellierung: Unfähigkeit, Zusammenarbeitsmuster zwischen Ingenieuren und Teamlösungsmuster zu erfassen
Fehlender Kontext: Mangelndes umfassendes Kontextverständnis der historischen Lösungsfälle von Ingenieuren
Produktionssystem-Einschränkungen: Bestehende Experten-Matching-Systeme verwenden vordefinierte Gewichte ohne Lernfähigkeit

Forschungsmotivation

Basierend auf tatsächlichen Geschäftsanforderungen aus über 160.000 internen Kundenfällen bei SAP werden Machine-Learning- und Wissensgraph-Technologien genutzt, um das Ingenieur-Ticket-Matching zu optimieren, Kundenwartezeiten zu reduzieren und die Problemlösungseffizienz zu verbessern.

Kernbeiträge

Neuartige Wissensgraph-Modellierungsmethode: Präsentation einer auf mehreren Datenquellen basierenden Wissensgraph-Embedding-Methode, die Schwarm-Kollaborationsinformationen integriert
Learning-to-Rank-Framework: Modellierung des Experten-Matching-Problems als LTR-Aufgabe mit direkter Optimierung des Ranking-Ziels
Multimodale Datenfusion: Kombination strukturierter Daten (Ingenieurinformationen, Komponenten) und unstrukturierter Daten (Incident-Beschreibungen, KBA-Text)
Signifikante Leistungssteigerung: Erhebliche Verbesserungen gegenüber traditionellen Methoden bei mehreren Bewertungsmetriken
Praktische Geschäftsanwendung: End-to-End-Lösung basierend auf echten SAP-Kundensupport-Daten

Methodische Details

Aufgabendefinition

Eingaben:

Incident-Beschreibung (vom Kunden bereitgestellt)
Betroffene Komponenten
Aktuell zugewiesene Ingenieurgruppe (möglicherweise leer)
Fachkompetenzbeurteilungen von Ingenieuren
Historische Schwarm-Daten

Ausgabe: Optimale Rangliste von Ingenieuren zur Lösung des Incidents

Einschränkungen: Berücksichtigung von Ingenieurverfügbarkeit, Fachkompetenzabgleich, historischen Zusammenarbeitsmuster usw.

Modellarchitektur

1. Wissensgraph-Konstruktion

Knotentypen:

Ingenieure (Engineers)
Wissensdatenbank-Artikel (KBAs)
Incidents (Incidents)
Komponenten (Components)

Kantenbeziehungen:

Ingenieur-Incident: Lösungsbeziehung
Ingenieur-KBA: Autorenschaft
Ingenieur-Ingenieur: Schwarm-Kollaborationsbeziehung
Incident-Komponente: Auswirkungsbeziehung

2. Datenverarbeitungs-Pipeline

Datenextraktion → Bereinigung und Vorverarbeitung → NLU-Embedding-Generierung → 
Graphstruktur-Transformation → GNN-Training

3. Kernkomponenten der Technologie

Natürlichsprachverarbeitung (NLU):

Verwendung von Transformer-Modellen wie BERT zur Verarbeitung von Textdaten
Generierung kontextbezogener Embeddings für Incident-Beschreibungen und KBA-Text
Leichtgewichtige NLP-Modelle für Vorverarbeitung zur Kontrolle der Rechenkomplexität

Graphische Neuronale Netze (GNN):

Implementierung des PinSage-Algorithmus
Dynamische Generierung von Ingenieur-Knoten-Embeddings
Berücksichtigung der Graphstruktur bei der Regularisierung der Verlustfunktion

Ranking-Modul:

Verwendung von Triplet-Loss-Funktion
Berechnung der Ähnlichkeit zwischen Incident-Vektor und Ingenieur-Vektor
Generierung der endgültigen Rangliste

4. Algorithmus-Ablauf

def generateGNN():
    # 1. Daten-ETL-Verarbeitung
    ETL_process(KBA, Communication, Component, User, Swarm)
    
    # 2. NLU-Transformation
    embeddings = NLU_transform(KBA, Communication, Components)
    
    # 3. Vektor-Normalisierung
    vectors = normalize_embeddings(embeddings)
    
    # 4. Wissensgraph-Konstruktion
    KG = build_networkx_graph(vectors)
    
    # 5. PinSage-Ranking
    rankings = PinSage_ranking(incident_vector, KG)
    
    # 6. Ranking basierend auf Triplet-Loss
    return rank_engineers(rankings, triplet_loss)

Technische Innovationen

Heterogene Datenfusion aus mehreren Quellen: Erstmalige einheitliche Modellierung von Incident-Beschreibungen, KBA, Schwarm-Kollaboration und Komponenteninformationen
End-to-End-Lernen: Direkte Optimierung der Experten-Matching-Aufgabe statt Abhängigkeit von vordefinierten Regeln
Dynamische Embedding-Generierung: Generierung kontextrelevanter Ingenieur-Darstellungen basierend auf Graphstruktur und gelernten Gewichten
Schwarm-Beziehungsmodellierung: Explizite Modellierung von Ingenieur-Zusammenarbeitsmuster zur Erfassung von Team-Problemlösungsmustern

Experimentelle Einrichtung

Datensatz

Datenquelle: SAP-interne Systeme

Infodocs: Incident-Beschreibungen, Ingenieur-Antworten, Bearbeitungsaufzeichnungen
Ingenieur-Komponenten-Fachkompetenz: Ingenieur-ID und Komponenten-Fachkompetenz-Bewertungen
KBA-Daten: Volltext von Wissensdatenbank-Artikeln, Autoren, Komponentenklassifizierung
Schwarm-Daten: Historische Zusammenarbeitsdatensätze, Schwarm-Anfrage-/Antwortbeziehungen

Datengröße:

2019: 781.083 Datensätze (678.047 mit Top-5k-Benutzern)
2020: 1.396.463 Datensätze (1.061.330 mit Top-5k-Benutzern)
Testsets: Zwei Größen mit 10K und 100K Stichproben

Bewertungsmetriken

Top-k-Hit-Rate: Ob der korrekte Ingenieur in den Top-k-Empfehlungen erscheint

Top-50-Hit-Rate
Top-100-Hit-Rate
Top-200-Hit-Rate

Vergleichsmethoden

Baseline-Modelle:

TF-IDF + Kosinus-Ähnlichkeit: Traditionelle textähnlichkeitsbasierte Methode
Random Forest: Traditionelle Machine-Learning-Methode
XGBoost: Gradient-Boosting-Tree-Methode

Implementierungsdetails

Graphmodellierung: Verwendung von NetworkX zur Wissensgraph-Konstruktion
NLU-Modell: Transformer-Architektur für Text-Embeddings
GNN-Implementierung: Basierend auf PinSage-Algorithmus
Trainings-Strategie: Negative-Sampling-Methode für End-to-End-Training
Zeitbereich: Beschränkung auf 2019-2020-Daten (Periode mit vollständigen Schwarm-Aufzeichnungen)

Experimentelle Ergebnisse

Hauptergebnisse

Ergebnisse bei 10K Stichproben:

Modell	Top-50	Top-100	Top-200
TF-IDF	0,48	0,58	0,68
Random Forest	0,0065	0,015	0,043
XGBoost	0,011	0,023	0,101
Wissensgraph+Embedding	0,64	0,77	0,85

Ergebnisse bei 100K Stichproben:

Modell	Top-50	Top-100	Top-200
TF-IDF	0,35	0,59	0,55
Random Forest	0,007	0,012	0,02
XGBoost	0,01	0,014	0,021
Wissensgraph+Embedding	0,70	0,65	0,78

Wichtigste Erkenntnisse

Signifikante Leistungssteigerung: Vorgeschlagene Methode übertrifft Baseline-Methoden bei allen Metriken erheblich
TF-IDF als starke Baseline: Traditionelle ML-Methoden (RF/XGBoost) schneiden deutlich schlechter ab als TF-IDF
Skalierungseffekt: Top-50-Leistung verbessert sich bei 100K-Stichproben weiter (0,64→0,70)
Konsistente Verbesserung: Überlegenheit bleibt über verschiedene Datengröße und Bewertungsmetriken hinweg erhalten

Leistungsanalyse

Relative Verbesserungsspanne:

Gegenüber TF-IDF: Top-50-Verbesserung um 33% (10K) und 100% (100K)
Gegenüber traditionellem ML: Verbesserung um über 10-fach
Trainingskosten: GPU-Ressourcenbedarf deutlich höher als Baseline-Methoden, aber Leistungsgewinn ist erheblich

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

Methodeneffektivität: Wissensgraph-Embedding-Methode verbessert Experten-Empfehlungsgenauigkeit signifikant
Wert multipler Datenquellen: Integration von Schwarm-Informationen und historischen Zusammenarbeitsdaten bringt substantielle Vorteile
Vorteile des End-to-End-Lernens: Direkte Optimierung der Empfehlungsaufgabe ist effektiver als traditionelles Feature-Engineering
Praktisches Anwendungspotenzial: Validierung mit echten Geschäftsdaten mit Produktionsbereitschaftswert

Einschränkungen

Rechnerische Ressourcenbedarfe: GPU-Trainingskosten deutlich höher als traditionelle Methoden
Datenabhängigkeit: Erfordert umfangreiche historische Zusammenarbeit und Dokumentationsdaten
Zeitbereichsbeschränkung: Bewertung nur auf vollständigen Schwarm-Daten von 2019-2020
Kaltstart-Problem: Handhabungsfähigkeit für neue Ingenieure oder neue Problemtypen nicht vollständig validiert

Zukünftige Richtungen

Echtzeitfaktoren: Integration von Ingenieur-Zeitzonen und Kalender-Verfügbarkeitsinformationen
Dynamische Aktualisierung: Modell-Servicebereitstellung basierend auf neuen KBAs, Incidents und Benutzerinformationen
Datenerweiterung: Intranet-Crawler zur Etablierung von KBA-Verknüpfungen, Anreicherung der Graphstruktur
Erweiterte Anwendungen: Ausweitung auf andere Kundensupport- und Experten-Empfehlungsszenarien

Tiefgehende Bewertung

Stärken

Praktisches Problemverständnis: Basierend auf echten Geschäftsschmerzen mit klarem Anwendungswert
Technische Innovativität: Erstmalige einheitliche Modellierung von Wissensgraphen, Schwarm-Kollaboration und multimodalen Daten
Experimentelle Vollständigkeit: Mehrere Baseline-Vergleiche, Validierung über verschiedene Datengröße
Ergebnis-Überzeugungskraft: Konsistente und signifikante Leistungssteigerung mit klarer statistischer Bedeutung
Engineering-Vollständigkeit: End-to-End-Lösung von Datenverarbeitung bis Modellbereitstellung

Mängel

Fehlende theoretische Analyse: Mangelnde theoretische Erklärung für Methodeneffektivität
Unzureichende Ablationsstudien: Unvollständige Analyse der unabhängigen Beiträge einzelner Komponenten (NLU, GNN, Schwarm-Informationen)
Generalisierungsvalidierung: Nur auf SAP-Daten validiert, Generalisierungsfähigkeit über Domänen hinweg unbekannt
Benutzererfahrungsanalyse: Fehlende Bewertung der Benutzerzufriedenheit nach tatsächlicher Bereitstellung
Fairness-Überlegungen: Keine Diskussion möglicher Verzerrungen im Empfehlungsalgorithmus

Einflussfaktor

Akademischer Beitrag: Bietet neues Modellierungsparadigma für Experten-Empfehlungsbereich
Industrieller Wert: Löst direkt Effizienzprobleme im Kundensupport von Unternehmen
Reproduzierbarkeit: Algorithmusbeschreibung relativ klar, aber fehlende Open-Source-Implementierung
Ausbreitungspotenzial: Methode erweiterbar auf andere Szenarien mit Experten-Matching-Anforderungen

Anwendbare Szenarien

Unternehmens-Kundensupport: Technischer Support, After-Sales-Service und ähnliche Szenarien
Wissensmanagementsysteme: Experten-Entdeckung, Wissensempfehlungsanwendungen
Kollaborationsplattformen: Teambildung, Projektverteilung und ähnliche Szenarien
Bildungs- und Trainingsbereich: Mentor-Matching, Lernressourcen-Empfehlung und verwandte Bereiche

Literaturverzeichnis

Das Paper zitiert folgende Schlüsselliteratur:

Transformer-Modelle: BERT, RoBERTa, ALBERT und ähnliche
Graphische neuronale Netze: GraphSage, PinSage und ähnliche
NLP-Bewertungs-Benchmarks: GLUE, Super-GLUE und ähnliche
Neural Structured Learning Framework

Gesamtbewertung: Dies ist eine ausgezeichnete Arbeit, die fortschrittliche KI-Technologien auf praktische Geschäftsprobleme anwendet. Die technische Lösung ist angemessen, die experimentellen Ergebnisse überzeugend, und sie hat bedeutenden akademischen und industriellen Wert. Obwohl es Raum für Verbesserungen in theoretischer Analyse und Generalisierungsvalidierung gibt, machen die innovative Modellierungsmethode und die signifikante Leistungssteigerung dies zu einem wichtigen Beitrag im Bereich der Experten-Empfehlungssysteme.