本論文ではeye2vecを提案する。これはソフトウェア開発者がソースコードを読む際の眼球運動行動を分析するためのインフラストラクチャである。従来のプログラム理解眼球運動追跡研究では、研究者は事前に分析対象(制御フローや構文要素など)を選択し、その後ソースコードの注視点から適切なメトリクスを抽出する分析方法を開発する必要があった。研究者は異なるレベルの関心領域(AOI)を定義できる(単語、行、またはコードブロック)が、これらの違いは異なる結果をもたらす。さらに、単語/行の注視点の解釈は分析目的によって異なる。したがって、眼球運動追跡分析は困難なタスクであり、研究者による時間のかかる手作業に依存している。eye2vecは分散表現を使用して、連続する2つの注視点を構文要素間の遷移として表現する。分散表現は、豊かな意味解釈を備えた多様なデータ分析方法の採用を促進する。
従来の眼球運動追跡分析は、プログラム理解研究においていくつかの重要な課題に直面している:
開発者の眼球運動パターンの理解は以下の点で重要である:
例えば、メソッド要約タスクでは、専門家開発者は最も頻繁に読まれるコード行に基づいて要約を生成する傾向がある。
入力:開発者がソースコードを読む際の眼球運動座標データと対応するソースコード 出力:眼球運動特徴を表す分散ベクトル(eye vector) 目標:座標ベースの眼球運動データを意味のある分散表現に変換する
eye2vecは以下のコアモジュールを含む:
総合評価:これは眼球運動データとコード意味表現を組み合わせた新しい方法を提案する革新的なインフラストラクチャ論文である。実験検証の面ではさらなる強化が必要であるが、その技術的革新と応用可能性は注目に値する。この方法はプログラム理解の眼球運動分析研究に新しい技術的パスを提供し、関連分野の発展を推進する可能性がある。