2025-11-15T08:58:11.885290

Efficient support ticket resolution using Knowledge Graphs

Varghese, Tian

A review of over 160,000 customer cases indicates that about 90% of time is spent by the product support for solving around 10% of subset of tickets where a trivial solution may not exist. Many of these challenging cases require the support of several engineers working together within a "swarm", and some also need to go to development support as bugs. These challenging customer issues represent a major opportunity for machine learning and knowledge graph that identifies the ideal engineer / group of engineers(swarm) that can best address the solution, reducing the wait times for the customer. The concrete ML task we consider here is a learning-to-rank(LTR) task that given an incident and a set of engineers currently assigned to the incident (which might be the empty set in the non-swarming context), produce a ranked list of engineers best fit to help resolve that incident. To calculate the rankings, we may consider a wide variety of input features including the incident description provided by the customer, the affected component(s), engineer ratings of their expertise, knowledge base article text written by engineers, response to customer text written by engineers, and historic swarming data. The central hypothesis test is that by including a holistic set of contextual data around which cases an engineer has solved, we can significantly improve the LTR algorithm over benchmark models. The article proposes a novel approach of modelling Knowledge Graph embeddings from multiple data sources, including the swarm information. The results obtained proves that by incorporating this additional context, we can improve the recommendations significantly over traditional machine learning methods like TF-IDF.

academic

Risoluzione efficiente dei ticket di supporto utilizzando Knowledge Graphs

Informazioni Fondamentali

ID Articolo: 2501.00461
Titolo: Efficient support ticket resolution using Knowledge Graphs
Autori: Sherwin Varghese (SAP Labs India), James Tian (SAP Labs US)
Classificazione: cs.AI cs.LG cs.MA
Istituzione di Pubblicazione: SAP Labs
Link Articolo: https://arxiv.org/abs/2501.00461

Riassunto

L'analisi di oltre 160.000 casi clienti rivela che i team di supporto prodotto dedicano circa il 90% del tempo alla risoluzione di circa il 10% dei ticket complessi, che spesso non hanno soluzioni evidenti. Molti casi impegnativi richiedono la collaborazione di più ingegneri organizzati in "sciami" (swarm), e alcuni richiedono persino il supporto del team di sviluppo come correzione di bug. Questo articolo modella il problema come un compito di Learning to Rank (LTR), generando un elenco ordinato di ingegneri più idonei a risolvere un determinato incidente, dato l'evento e l'insieme di ingegneri attualmente assegnati. L'articolo propone un approccio innovativo attraverso la modellazione di embedding di knowledge graph da più fonti di dati, includendo informazioni sugli sciami, e i risultati sperimentali dimostrano miglioramenti significativi rispetto ai metodi tradizionali di machine learning come TF-IDF.

Contesto di Ricerca e Motivazione

Definizione del Problema

Problema Centrale: Inefficienza nell'assegnazione dei ticket di supporto clienti, con circa il 90% del tempo dedicato al 10% dei ticket complessi
Impatto Aziendale: Tempi di risoluzione elevati influenzano la soddisfazione dei clienti e i risultati aziendali
Sfide Tecniche: Identificazione dell'ingegnere o del team di ingegneri ideale per risolvere specifici problemi tecnici

Limitazioni dei Metodi Esistenti

Metodi ML Tradizionali: Approcci come TF-IDF e Random Forest sono relativamente semplici ma con bassa complessità del modello
Modellazione Relazionale Insufficiente: Incapacità di catturare le relazioni di collaborazione tra ingegneri e i modelli di risoluzione dei problemi in team
Mancanza di Contesto: Assenza di comprensione contestuale completa della storia di risoluzione dei casi degli ingegneri
Limitazioni dei Sistemi in Produzione: I sistemi di matching degli esperti esistenti utilizzano pesi predefiniti e mancano di capacità di apprendimento

Motivazione della Ricerca

Basata su esigenze aziendali reali derivanti da oltre 160.000 casi clienti interni di SAP, l'utilizzo di tecniche di machine learning e knowledge graph per ottimizzare l'abbinamento ingegnere-ticket, ridurre i tempi di attesa dei clienti e migliorare l'efficienza della risoluzione dei problemi.

Contributi Principali

Metodo Innovativo di Modellazione Knowledge Graph: Propone un metodo di embedding di knowledge graph basato su più fonti di dati, integrando informazioni di collaborazione in sciami
Framework di Learning to Rank: Modella il problema di matching degli esperti come compito LTR, ottimizzando direttamente l'obiettivo di ranking
Fusione di Dati Multimodali: Combina dati strutturati (informazioni ingegneri, componenti) e non strutturati (descrizioni incidenti, testo KBA)
Miglioramento Significativo delle Prestazioni: Raggiunge miglioramenti sostanziali rispetto ai metodi tradizionali su più metriche di valutazione
Applicazione Aziendale Pratica: Soluzione end-to-end basata su dati reali di supporto clienti SAP

Spiegazione Dettagliata del Metodo

Definizione del Compito

Input:

Descrizione dell'incidente (fornita dal cliente)
Componenti interessati
Insieme di ingegneri attualmente assegnati (potrebbe essere vuoto)
Valutazioni di competenza professionale degli ingegneri
Dati storici degli sciami

Output: Elenco ordinato di ingegneri più idonei a risolvere l'incidente

Vincoli: Considerazione della disponibilità degli ingegneri, corrispondenza professionale, relazioni di collaborazione storica, ecc.

Architettura del Modello

1. Costruzione del Knowledge Graph

Tipi di Nodi:

Ingegneri (Engineers)
Articoli della Knowledge Base (KBAs)
Incidenti (Incidents)
Componenti (Components)

Relazioni di Bordo:

Ingegnere-Incidente: relazione di risoluzione
Ingegnere-KBA: relazione di creazione
Ingegnere-Ingegnere: relazione di collaborazione in sciami
Incidente-Componente: relazione di impatto

2. Pipeline di Elaborazione Dati

Estrazione Dati → Pulizia e Preprocessing → Generazione Embedding NLU → Trasformazione Struttura Grafo → Addestramento GNN

3. Componenti Tecnologici Principali

Comprensione del Linguaggio Naturale (NLU):

Utilizzo di modelli Transformer come BERT per l'elaborazione dei dati testuali
Generazione di embedding contestuali per descrizioni di incidenti e testo KBA
Modelli NLP leggeri per il preprocessing al fine di controllare la complessità computazionale

Reti Neurali Grafiche (GNN):

Implementazione dell'algoritmo PinSage
Generazione dinamica di embedding dei nodi ingegneri
Considerazione della struttura del grafo per la regolarizzazione della funzione di perdita

Modulo di Ranking:

Utilizzo della funzione di perdita Triplet Loss
Calcolo della similarità tra il vettore dell'incidente e i vettori degli ingegneri
Generazione dell'elenco di ranking finale

4. Flusso Algoritmico

def generateGNN():
    # 1. Elaborazione ETL dati
    ETL_process(KBA, Communication, Component, User, Swarm)
    
    # 2. Trasformazione NLU
    embeddings = NLU_transform(KBA, Communication, Components)
    
    # 3. Normalizzazione vettori
    vectors = normalize_embeddings(embeddings)
    
    # 4. Costruzione knowledge graph
    KG = build_networkx_graph(vectors)
    
    # 5. Ranking PinSage
    rankings = PinSage_ranking(incident_vector, KG)
    
    # 6. Ranking basato su triplet loss
    return rank_engineers(rankings, triplet_loss)

Punti di Innovazione Tecnica

Fusione di Dati Eterogenei da Più Fonti: Prima volta che descrizioni di incidenti, KBA, collaborazioni in sciami e informazioni su componenti vengono modellate unitamente
Apprendimento End-to-End: Ottimizzazione diretta del compito di matching degli esperti, piuttosto che dipendenza da regole predefinite
Generazione Dinamica di Embedding: Generazione di rappresentazioni degli ingegneri contestualmente rilevanti basate sulla struttura del grafo e sui pesi appresi
Modellazione delle Relazioni di Sciame: Modellazione esplicita delle relazioni di collaborazione tra ingegneri, catturando i modelli di risoluzione dei problemi in team

Configurazione Sperimentale

Dataset

Fonte Dati: Sistema interno SAP

Infodocs: Descrizioni incidenti, risposte ingegneri, record di elaborazione
Competenza Ingegneri-Componenti: ID ingegneri e valutazioni di competenza per componenti
Dati KBA: Testo completo articoli knowledge base, autori, classificazione componenti
Dati Sciami: Record di collaborazione storica, relazioni di richiesta/risposta degli sciami

Scala Dati:

2019: 781.083 record (678.047 contenenti i top 5k utenti)
2020: 1.396.463 record (1.061.330 contenenti i top 5k utenti)
Set di Test: Due scale di 10K e 100K campioni

Metriche di Valutazione

Hit Rate Top-k: Se l'ingegnere corretto appare nei primi k consigli

Hit Rate Top-50
Hit Rate Top-100
Hit Rate Top-200

Metodi di Confronto

Modelli di Base:

TF-IDF + Similarità del Coseno: Metodo tradizionale basato sulla similarità testuale
Random Forest: Metodo tradizionale di machine learning
XGBoost: Metodo di gradient boosting

Dettagli di Implementazione

Modellazione Grafo: Utilizzo di NetworkX per la costruzione del knowledge graph
Modello NLU: Architettura Transformer per l'embedding testuale
Implementazione GNN: Basata sull'algoritmo PinSage
Strategia di Addestramento: Metodo di negative sampling per l'addestramento end-to-end
Intervallo Temporale: Limitazione ai dati 2019-2020 (periodo con record di sciami completi)

Risultati Sperimentali

Risultati Principali

Risultati su 10K Campioni:

Modello	Top-50	Top-100	Top-200
TF-IDF	0.48	0.58	0.68
Random Forest	0.0065	0.015	0.043
XGBoost	0.011	0.023	0.101
Knowledge Graph + Embedding	0.64	0.77	0.85

Risultati su 100K Campioni:

Modello	Top-50	Top-100	Top-200
TF-IDF	0.35	0.59	0.55
Random Forest	0.007	0.012	0.02
XGBoost	0.01	0.014	0.021
Knowledge Graph + Embedding	0.70	0.65	0.78

Scoperte Chiave

Miglioramento Significativo delle Prestazioni: Il metodo proposto supera significativamente i metodi di base su tutte le metriche
TF-IDF come Base Forte: I metodi tradizionali di ML (RF/XGBoost) mostrano prestazioni molto inferiori a TF-IDF
Effetto di Scala: Le prestazioni Top-50 su 100K campioni migliorano ulteriormente (0.64→0.70)
Miglioramento Coerente: Mantiene vantaggi su diverse scale di dati e metriche di valutazione

Analisi delle Prestazioni

Entità dei Miglioramenti Relativi:

Rispetto a TF-IDF: Miglioramento Top-50 del 33% (10K) e 100% (100K)
Rispetto a ML tradizionale: Miglioramento superiore a 10 volte
Costo di Addestramento: Requisiti di risorse GPU significativamente superiori ai metodi di base, ma con benefici di prestazioni evidenti

Lavori Correlati

Campo NLP

Modelli Transformer: BERT, RoBERTa, ALBERT, GPT-3 e altri VLLM
Sfide Applicative: Dimensione del modello grande, costo computazionale elevato per il fine-tuning end-to-end
Strategie di Ottimizzazione: Preprocessing testuale, estrazione di frammenti importanti, ecc.

Reti Neurali Grafiche

Metodi Tradizionali: Similarità Jaccard, PageRank, chiusura triangolare e altre misure statiche
Metodi Moderni: GraphSage, PinSage, Neural Structured Learning (NSL)
Vantaggi: Embedding dinamici, ottimizzazione basata su compiti, analogia tra CNN profonde e ingegneria delle caratteristiche tradizionale

Sistemi di Raccomandazione degli Esperti

Sistemi in Produzione Esistenti: Basati su pesi predefiniti, considerando numero di incidenti risolti, numero di articoli KBA creati, ecc.
Limitazioni: Non basati su apprendimento, mancanza di struttura grafo e caratteristiche NLP ricche

Conclusioni e Discussione

Conclusioni Principali

Efficacia del Metodo: Il metodo di embedding del knowledge graph migliora significativamente l'accuratezza della raccomandazione degli esperti
Valore dei Dati Multisorgente: L'integrazione di informazioni su sciami, collaborazioni storiche e altri dati contestuali porta benefici sostanziali
Vantaggi dell'Apprendimento End-to-End: L'ottimizzazione diretta del compito di raccomandazione è più efficace dell'ingegneria delle caratteristiche tradizionale
Potenziale di Applicazione Pratica: Validato su dati aziendali reali, possiede valore per la distribuzione in produzione

Limitazioni

Requisiti di Risorse Computazionali: Il costo di addestramento su GPU è significativamente superiore ai metodi tradizionali
Dipendenza dai Dati: Richiede dati storici ricchi di collaborazione e documentazione
Limitazione dell'Intervallo Temporale: La valutazione è limitata ai dati completi degli sciami 2019-2020
Problema del Cold Start: La capacità di gestione di ingegneri nuovi o nuovi tipi di problemi non è stata sufficientemente verificata

Direzioni Future

Fattori in Tempo Reale: Integrazione di informazioni su fusi orari degli ingegneri e disponibilità del calendario
Aggiornamento Dinamico: Distribuzione del servizio del modello basata su nuovi KBA, incidenti e informazioni utente
Aumento dei Dati: Utilizzo di web crawler interni per stabilire collegamenti tra articoli KBA, arricchendo la struttura del grafo
Estensione dell'Applicazione: Promozione ad altri scenari di supporto clienti e raccomandazione di esperti

Valutazione Approfondita

Punti di Forza

Guidato da Problemi Pratici: Basato su esigenze aziendali reali, con valore di applicazione chiaro
Innovazione Tecnica: Prima volta che knowledge graph, collaborazione in sciami e dati multimodali vengono modellati unitamente
Completezza Sperimentale: Confronti con più baseline, validazione su diverse scale di dati
Convincenza dei Risultati: Miglioramenti coerenti e significativi, significato statistico chiaro
Completezza Ingegneristica: Soluzione end-to-end dall'elaborazione dei dati alla distribuzione del modello

Insufficienze

Mancanza di Analisi Teorica: Assenza di spiegazioni teoriche sull'efficacia del metodo
Esperimenti di Ablazione Insufficienti: Analisi incompleta del contributo indipendente di ciascun componente (NLU, GNN, informazioni su sciami)
Verifica della Generalizzabilità: Validazione solo su dati SAP, capacità di generalizzazione cross-domain sconosciuta
Analisi dell'Esperienza Utente: Mancanza di valutazione della soddisfazione dell'utente dopo la distribuzione effettiva
Considerazioni di Equità: Mancanza di discussione su possibili pregiudizi dell'algoritmo di raccomandazione

Impatto

Contributo Accademico: Fornisce un nuovo paradigma di modellazione per il campo della raccomandazione di esperti
Valore Industriale: Risolve direttamente il problema di efficienza del supporto clienti aziendale
Riproducibilità: La descrizione dell'algoritmo è relativamente chiara, ma manca l'implementazione open source
Potenziale di Diffusione: Il metodo è estendibile ad altri scenari che richiedono matching di esperti

Scenari Applicabili

Supporto Clienti Aziendale: Supporto tecnico, servizi post-vendita e altri scenari
Sistemi di Gestione della Conoscenza: Scoperta di esperti, raccomandazione di risorse conoscitive e altre applicazioni
Piattaforme di Collaborazione: Composizione di team, assegnazione di progetti e altri scenari
Istruzione e Formazione: Matching di mentori, raccomandazione di risorse di apprendimento e altri campi

Bibliografia

L'articolo cita i seguenti riferimenti chiave:

Modelli Transformer come BERT, RoBERTa, ALBERT
Metodi di reti neurali grafiche come GraphSage, PinSage
Benchmark di valutazione NLP come GLUE, Super-GLUE
Framework Neural Structured Learning

Valutazione Complessiva: Questo è un lavoro eccellente che applica tecnologie AI all'avanguardia a problemi aziendali reali, con una soluzione tecnica ragionevole e risultati sperimentali convincenti, possedendo importante valore accademico e industriale. Sebbene vi sia spazio per miglioramenti nell'analisi teorica e nella verifica della generalizzabilità, il metodo di modellazione innovativo e i miglioramenti significativi delle prestazioni lo rendono un contributo importante nel campo della raccomandazione di esperti.