Efficient support ticket resolution using Knowledge Graphs
Varghese, Tian
A review of over 160,000 customer cases indicates that about 90% of time is spent by the product support for solving around 10% of subset of tickets where a trivial solution may not exist. Many of these challenging cases require the support of several engineers working together within a "swarm", and some also need to go to development support as bugs. These challenging customer issues represent a major opportunity for machine learning and knowledge graph that identifies the ideal engineer / group of engineers(swarm) that can best address the solution, reducing the wait times for the customer. The concrete ML task we consider here is a learning-to-rank(LTR) task that given an incident and a set of engineers currently assigned to the incident (which might be the empty set in the non-swarming context), produce a ranked list of engineers best fit to help resolve that incident. To calculate the rankings, we may consider a wide variety of input features including the incident description provided by the customer, the affected component(s), engineer ratings of their expertise, knowledge base article text written by engineers, response to customer text written by engineers, and historic swarming data. The central hypothesis test is that by including a holistic set of contextual data around which cases an engineer has solved, we can significantly improve the LTR algorithm over benchmark models. The article proposes a novel approach of modelling Knowledge Graph embeddings from multiple data sources, including the swarm information. The results obtained proves that by incorporating this additional context, we can improve the recommendations significantly over traditional machine learning methods like TF-IDF.
academic
Resolución eficiente de tickets de soporte utilizando Gráficos de Conocimiento
El análisis basado en más de 160,000 casos de clientes demuestra que los equipos de soporte de productos dedican aproximadamente el 90% de su tiempo a resolver aproximadamente el 10% de los tickets complejos, que a menudo carecen de soluciones evidentes. Muchos casos desafiantes requieren la colaboración de múltiples ingenieros formando un "enjambre" (swarm), y algunos incluso requieren apoyo del equipo de desarrollo como tratamiento de errores. Este artículo modela este problema como una tarea de aprendizaje de clasificación (LTR), generando una lista ordenada de ingenieros más adecuados para resolver un incidente, dado el evento y el conjunto de ingenieros actualmente asignados. El artículo propone un método novedoso mediante la modelización de incrustaciones de gráficos de conocimiento de múltiples fuentes de datos, incluyendo información de enjambres, y los resultados experimentales demuestran mejoras significativas en comparación con métodos tradicionales de aprendizaje automático como TF-IDF.
Problema Central: Ineficiencia en la asignación de tickets de soporte al cliente, con aproximadamente el 90% del tiempo dedicado a resolver el 10% de los tickets complejos
Impacto Empresarial: Los tiempos de respuesta prolongados afectan la satisfacción del cliente y los resultados comerciales
Desafío Técnico: Identificar el ingeniero o equipo de ingenieros ideal para resolver problemas técnicos específicos
Métodos ML Tradicionales: TF-IDF, bosques aleatorios y otros métodos son relativamente simples pero con baja complejidad de modelo
Modelización Insuficiente de Relaciones: Incapacidad para capturar relaciones de colaboración entre ingenieros y patrones de resolución de problemas en equipo
Falta de Contexto: Carencia de comprensión contextual integral del historial de casos resueltos por ingenieros
Limitaciones del Sistema de Producción: Los sistemas de coincidencia de expertos existentes utilizan pesos predefinidos, careciendo de capacidad de aprendizaje
Basándose en necesidades comerciales reales de más de 160,000 casos de clientes internos de SAP, se utilizan técnicas de aprendizaje automático y gráficos de conocimiento para optimizar la coincidencia ingeniero-ticket, reducir tiempos de espera del cliente y mejorar la eficiencia de resolución de problemas.
Método Novedoso de Modelización de Gráficos de Conocimiento: Propone un método de incrustación de gráficos de conocimiento basado en múltiples fuentes de datos, integrando información de colaboración de enjambres
Marco de Aprendizaje de Clasificación: Modela el problema de coincidencia de expertos como una tarea LTR, optimizando directamente el objetivo de clasificación
Fusión de Datos Multimodales: Combina datos estructurados (información de ingenieros, componentes) y datos no estructurados (descripciones de incidentes, texto de KBA)
Mejora Significativa del Rendimiento: Logra mejoras sustanciales en múltiples métricas de evaluación en comparación con métodos tradicionales
Aplicación Empresarial Práctica: Solución integral basada en datos reales de soporte al cliente de SAP
Fusión de Datos Heterogéneos de Múltiples Fuentes: Primera vez que se modelan unificadamente descripciones de incidentes, KBA, colaboración de enjambres e información de componentes
Aprendizaje Integral: Optimiza directamente la tarea de coincidencia de expertos, en lugar de depender de reglas predefinidas
Generación de Incrustaciones Dinámicas: Genera representaciones de ingenieros contextuales basadas en estructura de gráfico y pesos aprendidos
Modelización de Relaciones de Enjambre: Modela explícitamente relaciones de colaboración de ingenieros, capturando patrones de resolución de problemas en equipo
Efectividad del Método: El método de incrustación de gráficos de conocimiento mejora significativamente la precisión de recomendación de expertos
Valor de Datos Multifuente: La integración de información de enjambres, colaboración histórica y otros datos contextuales proporciona beneficios sustanciales
Ventajas del Aprendizaje Integral: La optimización directa de la tarea de recomendación es más efectiva que la ingeniería de características tradicional
Potencial de Aplicación Práctica: Validado con datos comerciales reales, tiene valor para despliegue en producción
Falta de Análisis Teórico: Carencia de explicación teórica sobre la efectividad del método
Experimentos de Ablación Insuficientes: No analiza suficientemente la contribución independiente de cada componente (NLU, GNN, información de enjambre)
Verificación de Generalización: Validación solo en datos de SAP, capacidad de generalización entre dominios desconocida
Falta de Análisis de Experiencia del Usuario: Carencia de evaluación de satisfacción del usuario después del despliegue real
Consideraciones de Equidad: No discute posibles sesgos en algoritmos de recomendación
El artículo cita las siguientes referencias clave:
Modelos transformadores BERT, RoBERTa, ALBERT
Métodos de redes neuronales de gráficos GraphSage, PinSage
Puntos de referencia de evaluación de PNL GLUE, Super-GLUE
Marco de Aprendizaje de Estructura Neural
Evaluación General: Este es un trabajo excelente que aplica tecnología de IA de vanguardia a problemas comerciales reales, con solución técnica razonable, resultados experimentales convincentes y valor académico e industrial significativo. Aunque hay espacio para mejora en análisis teórico y verificación de generalización, su método de modelización innovador y mejora de rendimiento significativa lo convierten en una contribución importante en el campo de recomendación de expertos.