2025-11-22T08:49:16.236324

VIDEE: Visual and Interactive Decomposition, Execution, and Evaluation of Text Analytics with Intelligent Agents

Lee, Ji, Wen et al.

Text analytics has traditionally required specialized knowledge in Natural Language Processing (NLP) or text analysis, which presents a barrier for entry-level analysts. Recent advances in large language models (LLMs) have changed the landscape of NLP by enabling more accessible and automated text analysis (e.g., topic detection, summarization, information extraction, etc.). We introduce VIDEE, a system that supports entry-level data analysts to conduct advanced text analytics with intelligent agents. VIDEE instantiates a human-agent collaroration workflow consisting of three stages: (1) Decomposition, which incorporates a human-in-the-loop Monte-Carlo Tree Search algorithm to support generative reasoning with human feedback, (2) Execution, which generates an executable text analytics pipeline, and (3) Evaluation, which integrates LLM-based evaluation and visualizations to support user validation of execution results. We conduct two quantitative experiments to evaluate VIDEE's effectiveness and analyze common agent errors. A user study involving participants with varying levels of NLP and text analytics experience -- from none to expert -- demonstrates the system's usability and reveals distinct user behavior patterns. The findings identify design implications for human-agent collaboration, validate the practical utility of VIDEE for non-expert users, and inform future improvements to intelligent text analytics systems.

academic

VIDEE: Visual and Interactive Decomposition, Execution, and Evaluation of Text Analytics with Intelligent Agents

基本情報

論文ID: 2506.21582
タイトル: VIDEE: Visual and Interactive Decomposition, Execution, and Evaluation of Text Analytics with Intelligent Agents
著者: Sam Yu-Te Lee, Chenyang Ji, Shicheng Wen, Lifu Huang, Dongyu Liu, Kwan-Liu Ma
分類: cs.CL cs.AI cs.HC
発表日時: 2025年10月13日 (arXiv v4)
論文リンク: https://arxiv.org/abs/2506.21582

要約

テキスト分析は従来、自然言語処理(NLP)またはテキスト分析の専門知識を必要とし、初級レベルのアナリストにとって技術的な障壁となっていました。大規模言語モデル(LLMs)の最近の進展は、トピック検出、要約、情報抽出など、より利用しやすく自動化されたテキスト分析をサポートすることで、NLPの状況を変えました。本論文では、初級レベルのデータアナリストがインテリジェントエージェントと協力して高度なテキスト分析を実行できるVIDEEシステムを紹介します。VIDEEは、3段階の人機協働ワークフローを実装しています：(1)分解段階では、人間がループ内にあるモンテカルロ木探索アルゴリズムと組み合わせて、人間のフィードバックを伴う生成推論をサポートします；(2)実行段階では、実行可能なテキスト分析パイプラインを生成します；(3)評価段階では、LLMベースの評価と可視化を統合し、ユーザーが実行結果を検証できるようにします。

研究背景と動機

問題定義

従来のテキスト分析は4つの主要な課題に直面しています：

大規模な分解空間の問題：プロンプトの柔軟性により、異なるサブタスクの組み合わせを通じて目標を達成する複数の分解方法が可能になり、アナリストはサブタスクの難易度とパイプライン全体のロバスト性のバランスを取る必要があります。
技術知識の障壁：アナリストは異なるレベルの技術知識、特にLLMに関する知識を持っています。LLM関連分野は急速に発展しており、アナリストは最新技術に追いつけない可能性があります。
実装と実験の困難さ：テキスト分析パイプラインの構築と実装には、入出力形式の処理、中間データ変換、パラメータ分析など、多大なエンジニアリング努力が必要です。
評価の課題：LLMベースのテキスト分析パイプラインの評価には、まだ広く普及していない独特の評価方法が必要です。

研究動機

これらの課題により、テキスト分析者をサポートするエージェントシステムの必要性が生じました。ユーザーの目標とデータセットが与えられた場合、十分な技術知識を持つエージェントは、目標を自動的に分解し、大規模な分解空間を探索してテキスト分析計画を生成し、その後パイプラインを実装・実行し、最後に結果を評価することができます。

核心的貢献

3段階の人機協働ワークフローの提案：分解(Decomposition)、実行(Execution)、評価(Evaluation)の完全なワークフロープロセスを設計し、複雑なテキスト分析目標を実現します。
VIDEEシステムの開発：可視化インターフェースを備えたエージェントシステムを実装し、データアナリストがコードなし環境でテキスト分析を実行できるようにします。
技術的革新：
- モンテカルロ木探索(MCTS)に基づく人間がループ内にある分解アルゴリズム
- データ構造の変化に対処するための分析単位の概念フレームワーク
- LLム評判者と可視化を統合した評価メカニズム
実証的研究知見：システム評価とユーザー研究を通じて、エージェントシステムと人機協働に関する新しい洞察を提供します。

方法の詳細

タスク定義

入力：ユーザーの目標(自然言語記述)とテキストデータセット出力：完全なテキスト分析パイプラインとその実行結果制約：コードなし環境をサポートし、異なる技術レベルのユーザーに適応

3段階ワークフロー構造

1. 分解段階(Decomposition)

目標：ユーザーの目標をセマンティックタスク列に分解する
コアアルゴリズム：改良されたモンテカルロ木探索(MCTS)
人機協働：人間が探索プロセスを監視し、エージェントが可能なパイプラインオプションを探索

MCTSアルゴリズムの改良：

LLM評判者を報酬関数として使用
3つの評価基準を定義：複雑性、一貫性、重要性
人間のフィードバックで探索方向を調整
ランダム展開を包括的な報酬計算に置き換え

2. 実行段階(Execution)

変換プロセス：セマンティックタスク→プリミティブタスク→実行可能パイプライン
コンパイルプロセス：入出力パターン、アルゴリズム選択、ハイパーパラメータを生成
技術サポート：LangGraphベースの実行グラフ構築

分析単位の概念フレームワーク：

各プリミティブタスクの入力単位を定義
MapReduceパラダイムを採用してデータ構造の変化に対処
新しい分析単位を自動作成

3. 評価段階(Evaluation)

評価方法：真実ラベルなしのLLM評判者ベースの評価
可視化：棒グラフと拡張トピック放射状グラフ
自動推奨：システムが各タスクに対して3つの評価基準を推奨

技術的革新点

生成推論とMCTSの組み合わせ：ビーム探索の貪欲戦略と比較して、MCTSの逆伝播はより後方フィードバックを提供し、テキスト分析パイプライン計画に適しています。
分析単位フレームワーク：MapReduceパラダイムを通じてデータ構造の変化を自動的に処理し、多様なプリミティブタスク組み合わせをサポートします。
人機協働ダイナミクス：ユーザーがマネージャーとして、LLM評判者がアドバイザーとして機能し、LLM整列の必要性を減らします。

実験設定

データセット

分解器評価：
- LLooMシナリオ：HCI論文要約データセット
- TnT-LLMシナリオ：マイクロソフトBing Copilotユーザー会話データセット
実行器評価：
- Wikipediaデータセット(n=210)、真実ラベルとしてのトピックを含む
ユーザー研究：
- HCI論文要約データセット(100論文)
- 概念帰納タスク