2025-11-15T08:58:11.885290

Efficient support ticket resolution using Knowledge Graphs

Varghese, Tian

A review of over 160,000 customer cases indicates that about 90% of time is spent by the product support for solving around 10% of subset of tickets where a trivial solution may not exist. Many of these challenging cases require the support of several engineers working together within a "swarm", and some also need to go to development support as bugs. These challenging customer issues represent a major opportunity for machine learning and knowledge graph that identifies the ideal engineer / group of engineers(swarm) that can best address the solution, reducing the wait times for the customer. The concrete ML task we consider here is a learning-to-rank(LTR) task that given an incident and a set of engineers currently assigned to the incident (which might be the empty set in the non-swarming context), produce a ranked list of engineers best fit to help resolve that incident. To calculate the rankings, we may consider a wide variety of input features including the incident description provided by the customer, the affected component(s), engineer ratings of their expertise, knowledge base article text written by engineers, response to customer text written by engineers, and historic swarming data. The central hypothesis test is that by including a holistic set of contextual data around which cases an engineer has solved, we can significantly improve the LTR algorithm over benchmark models. The article proposes a novel approach of modelling Knowledge Graph embeddings from multiple data sources, including the swarm information. The results obtained proves that by incorporating this additional context, we can improve the recommendations significantly over traditional machine learning methods like TF-IDF.

academic

知識グラフを用いた効率的なサポートチケット解決

基本情報

論文ID: 2501.00461
タイトル: Efficient support ticket resolution using Knowledge Graphs
著者: Sherwin Varghese (SAP Labs India)、James Tian (SAP Labs US)
分類: cs.AI cs.LG cs.MA
発表機関: SAP Labs
論文リンク: https://arxiv.org/abs/2501.00461

要旨

16万件以上の顧客ケース分析に基づいて、製品サポートチームの約90%の時間が全体の約10%の複雑なチケット解決に費やされていることが示されている。これらのチケットは明白な解決策がないことが多い。多くの困難なケースは複数のエンジニアによる協力「スウォーム」(swarm)を必要とし、中にはバグ対応として開発チームのサポートが必要なものもある。本論文はこの問題を学習順序付け(LTR)タスクとしてモデル化し、与えられたインシデントと現在割り当てられているエンジニアセットに対して、そのインシデント解決に最適なエンジニアの順序付きリストを生成する。本論文は、スウォーム情報を含む複数のデータソースからの知識グラフ埋め込みをモデル化する新規な手法を提案し、実験結果はTF-IDFなどの従来の機械学習手法と比較して顕著な改善を示している。

研究背景と動機

問題定義

中核的問題: 顧客サポートチケット割り当ての効率性の低さ。約90%の時間が全体の10%の複雑なチケット解決に費やされている
ビジネスへの影響: 高いターンアラウンドタイムが顧客満足度とビジネス成果に悪影響を及ぼす
技術的課題: 特定の技術問題を解決するのに理想的なエンジニアまたはエンジニアチームの特定

既存手法の限界

従来のML手法: TF-IDF、ランダムフォレストなどの手法は比較的シンプルだがモデルの複雑度が低い
関係モデリングの不足: エンジニア間の協力関係とチーム問題解決パターンをキャプチャできない
コンテキストの欠落: エンジニアの過去の解決事例に関する包括的なコンテキスト理解が不足している
本番システムの制限: 既存の専門家マッチングシステムは事前定義された重みを使用し、学習能力がない

研究動機

SAP内部の16万件以上の顧客ケースに基づく実際のビジネス要件から、機械学習と知識グラフ技術を活用してエンジニア-チケット間のマッチングを最適化し、顧客の待機時間を短縮し、問題解決効率を向上させる。

核心的貢献

新規な知識グラフモデリング手法: 複数のデータソースに基づく知識グラフ埋め込み手法を提案し、スウォーム協力情報を統合
学習順序付けフレームワーク: 専門家マッチング問題をLTRタスクとしてモデル化し、順序付け目標を直接最適化
マルチモーダルデータ融合: 構造化データ(エンジニア情報、コンポーネント)と非構造化データ(インシデント説明、KBAテキスト)を結合
顕著なパフォーマンス向上: 複数の評価指標で従来の手法と比較して大幅な改善を達成
実際のビジネス応用: 実際のSAPカスタマーサポートデータに基づくエンドツーエンドソリューション

方法の詳細

タスク定義

入力:

インシデント説明(顧客提供)
影響を受けるコンポーネント
現在割り当てられているエンジニアセット(空の場合もある)
エンジニアの専門評価
過去のスウォームデータ

出力: そのインシデント解決に最適なエンジニアの順序付きリスト

制約: エンジニアの可用性、専門知識のマッチング度、過去の協力関係などを考慮

モデルアーキテクチャ

1. 知識グラフ構築

ノードタイプ:

エンジニア(Engineers)
ナレッジベース記事(KBAs)
インシデント(Incidents)
コンポーネント(Components)

エッジ関係:

エンジニア-インシデント: 解決関係
エンジニア-KBA: 作成関係
エンジニア-エンジニア: スウォーム協力関係
インシデント-コンポーネント: 影響関係

2. データ処理パイプライン

データ抽出 → クリーニング前処理 → NLU埋め込み生成 → グラフ構造変換 → GNN訓練

3. 核心的技術コンポーネント

自然言語理解(NLU):

BERTなどのトランスフォーマーモデルを使用してテキストデータを処理
インシデント説明とKBAテキストのコンテキスト埋め込みを生成
計算複雑度を制御するための軽量NLPモデルで前処理を実施

グラフニューラルネットワーク(GNN):

PinSageアルゴリズムを実装として採用
エンジニアノード埋め込みを動的に生成
グラフ構造を考慮した損失関数の正則化

順序付けモジュール:

トリプレット損失関数(Triplet Loss)を使用
インシデントベクトルとエンジニアベクトル間の類似度を計算
最終的な順序付きリストを生成

4. アルゴリズムフロー

def generateGNN():
    # 1. データETL処理
    ETL_process(KBA, Communication, Component, User, Swarm)
    
    # 2. NLU変換
    embeddings = NLU_transform(KBA, Communication, Components)
    
    # 3. ベクトル正規化
    vectors = normalize_embeddings(embeddings)
    
    # 4. 知識グラフ構築
    KG = build_networkx_graph(vectors)
    
    # 5. PinSage順序付け
    rankings = PinSage_ranking(incident_vector, KG)
    
    # 6. トリプレット損失に基づく順序付け
    return rank_engineers(rankings, triplet_loss)

技術的革新点

複数ソース異種データ融合: インシデント説明、KBA、スウォーム協力、コンポーネント情報を初めて統一的にモデル化
エンドツーエンド学習: 事前定義ルールに依存せず、専門家マッチングタスクを直接最適化
動的埋め込み生成: グラフ構造と学習重みに基づいてコンテキスト関連のエンジニア表現を生成
スウォーム関係モデリング: エンジニア協力関係を明示的にモデル化し、チーム問題解決パターンをキャプチャ

実験設定

データセット

データソース: SAP内部システム

Infodocs: インシデント説明、エンジニア応答、処理記録
エンジニアコンポーネント専門度: エンジニアIDとコンポーネント専門評価
KBAデータ: ナレッジベース記事全文、著者、コンポーネント分類
スウォームデータ: 過去の協力記録、スウォーム要求/応答関係

データ規模:

2019年: 781,083件(トップ5kユーザーを含む678,047件)
2020年: 1,396,463件(トップ5kユーザーを含む1,061,330件)
テストセット: 10Kおよび100Kサンプルの2つの規模

評価指標

Top-k命中率: 正しいエンジニアが上位k件の推奨に含まれているかどうか

Top-50命中率
Top-100命中率
Top-200命中率

比較手法

ベースラインモデル:

TF-IDF + コサイン類似度: テキスト類似度に基づく従来の手法
ランダムフォレスト: 従来の機械学習手法
XGBoost: 勾配ブースティング木手法

実装詳細

グラフモデリング: NetworkXを使用して知識グラフを構築
NLUモデル: テキスト埋め込みにトランスフォーマーアーキテクチャを使用
GNN実装: PinSageアルゴリズムに基づく
訓練戦略: ネガティブサンプリング手法によるエンドツーエンド訓練
時間範囲: スウォーム記録が完全な2019-2020年データに限定

実験結果

主要結果

10Kサンプル結果:

モデル	Top-50	Top-100	Top-200
TF-IDF	0.48	0.58	0.68
ランダムフォレスト	0.0065	0.015	0.043
XGBoost	0.011	0.023	0.101
知識グラフ+埋め込み	0.64	0.77	0.85

100Kサンプル結果:

モデル	Top-50	Top-100	Top-200
TF-IDF	0.35	0.59	0.55
ランダムフォレスト	0.007	0.012	0.02
XGBoost	0.01	0.014	0.021
知識グラフ+埋め込み	0.70	0.65	0.78

主要な発見

顕著なパフォーマンス向上: 提案手法はすべての指標でベースライン手法を大幅に上回る
TF-IDFの強力なベースライン: 従来のML手法(RF/XGBoost)はTF-IDFをはるかに下回る性能を示す
スケール効果: 100Kサンプルでは、Top-50パフォーマンスがさらに向上(0.64→0.70)
一貫した改善: 異なるデータ規模と評価指標全体で優位性を維持

パフォーマンス分析

相対的改善幅:

TF-IDFと比較: Top-50で33%(10K)および100%(100K)の改善
従来のMLと比較: 10倍以上の改善
訓練コスト: ベースライン手法と比較してGPUリソース要件が大幅に高いが、パフォーマンス利益は明確

結論と考察

主要な結論

手法の有効性: 知識グラフ埋め込み手法は専門家推奨の精度を大幅に向上させる
複数ソースデータの価値: スウォーム情報と過去の協力などのコンテキストデータの統合は実質的な利益をもたらす
エンドツーエンド学習の利点: 推奨タスクを直接最適化することは従来の特徴工学より効果的
実際の応用可能性: 実際のビジネスデータに基づいて検証され、本番環境への展開価値がある

限界

計算リソース要件: GPU訓練コストは従来の手法よりも大幅に高い
データ依存性: 豊富な過去の協力と文書データが必要
時間範囲の制限: 評価は2019-2020年の完全なスウォームデータに限定
コールドスタート問題: 新しいエンジニアまたは新しいタイプの問題の処理能力は十分に検証されていない

今後の方向性

リアルタイム要因: エンジニアのタイムゾーン、カレンダー可用性情報の統合
動的更新: 新しいKBA、インシデント、ユーザー情報に基づくモデルサービス化展開
データ拡張: 内部ネットワークスクレイピングによるKBA間リンク構築、グラフ構造の充実
応用拡張: 他のカスタマーサポートと専門家推奨シナリオへの推進

深層的評価

強み

実際の問題駆動: 実際のビジネス上の課題に基づき、明確な応用価値がある
技術的革新性: 知識グラフ、スウォーム協力、マルチモーダルデータを初めて統一的にモデル化
実験の十分性: 複数のベースライン比較、異なるデータ規模での検証
結果の説得力: 一貫した顕著なパフォーマンス向上、統計的意義が明確
工学的完全性: データ処理からモデル展開までのエンドツーエンドソリューション

不足

理論的分析の欠落: 手法の有効性に関する理論的説明が不足している
アブレーション実験の不足: 各コンポーネント(NLU、GNN、スウォーム情報)の独立的貢献が十分に分析されていない
汎化性の検証: SAPデータのみで検証され、領域横断的な汎化能力は不明
ユーザー体験分析: 実際の展開後のユーザー満足度評価が不足している
公平性の考慮: 推奨アルゴリズムの潜在的なバイアスについて議論されていない

影響力

学術的貢献: 専門家推奨分野に新しいモデリングパラダイムを提供
産業的価値: 企業のカスタマーサポート効率問題を直接解決
再現性: アルゴリズム説明は比較的明確だが、オープンソース実装が不足している
推進可能性: 方法は他の専門家マッチングが必要なシナリオに拡張可能

適用シナリオ

企業カスタマーサポート: 技術サポート、アフターサービスなどのシナリオ
知識管理システム: 専門家発見、知識推奨などの応用
協力プラットフォーム: チーム構成、プロジェクト割り当てなどのシナリオ
教育訓練: メンターマッチング、学習リソース推奨などの分野

参考文献

論文は以下の主要文献を引用している:

BERT、RoBERTa、ALBERTなどのトランスフォーマーモデル
GraphSage、PinSageなどのグラフニューラルネットワーク手法
GLUE、Super-GLUEなどのNLP評価ベンチマーク
ニューラル構造学習フレームワーク

総合評価: これは最先端のAI技術を実際のビジネス問題に応用した優秀な研究である。技術ソリューションは合理的で、実験結果は説得力があり、学術的および産業的価値が重要である。理論的分析と汎化性検証の面でまだ改善の余地があるが、革新的なモデリング手法と顕著なパフォーマンス向上により、専門家推奨分野への重要な貢献となっている。