本論文は、認識論的訴求識別という新規タスクを提案しており、事実陳述が外部ソースまたは証拠によってどのように支持されているかを識別することを目的としている。このタスク研究を推進するため、著者らは3,226個の英語ニュース文の人手注釈を含むFactAppealデータセットを構築した。従来の声明検出と検証のみに焦点を当てたリソースとは異なり、FactAppealは、これらの声明を支持する細粒度の認識論的構造と証拠基盤を識別する。このデータセットは、事実陳述とそれが依存するソース言及を識別するスパンレベルの注釈を含む。さらに、注釈には、ソースタイプ(積極的参加者、目撃者、専門家、直接証拠など)、名前付き言及の有無、ソース役割と認識論的資格の言及、直接引用または間接引用を通じたソースへの帰属など、事実訴求の細粒度特性が含まれている。著者らは、2B~9Bパラメータ範囲のエンコーダモデルと生成型デコーダモデルを使用してこのタスクをモデル化し、最良性能モデルはGemma 2 9Bに基づいており、マクロ平均F1スコア0.73を達成した。
情報の誤伝播と媒体報道に対する懐疑主義が蔓延する時代において、事実陳述がどのように提示されるかを理解することは、かつてないほど重要になっている。事実陳述の信頼性は、その内容だけでなく、専門家の証言、公式声明、または直接的な経験的証拠を通じて、外部知識ソースにどのように訴えかけるかにも依存している。
声明検出と検証研究において実質的な進展があったにもかかわらず、既存の手法は主に孤立した陳述内容に焦点を当てており、これらの声明に信頼性と説得力を与える認識論的構造を無視している。従来の事実性検出フレームワークは、ニュースメディアにおいて声明がどのように構築され支持されるかについての深い理解を欠いている。
認識論的訴求識別タスクは以下を要求する:
2つの次元に基づいて構築された分類法:
内部ソース(直接接触に基づく):
外部ソース(専門知識に基づく):
エンコーダモデル(トークンレベル多ラベル分類):
生成型デコーダモデル(シーケンス・ツー・シーケンス):
| モデル | 精度 | 再現率 | F1 |
|---|---|---|---|
| Gemma 2 9B | 0.76 | 0.73 | 0.73 |
| RoBERTa(base) | 0.75 | 0.67 | 0.70 |
| Mistral v0.3 7B | 0.73 | 0.68 | 0.70 |
| DeBERTa v3(base) | 0.73 | 0.67 | 0.69 |
| Llama 3.1 8B | 0.75 | 0.65 | 0.68 |
本論文は、認識論的訴求識別という新興タスクにおいて開拓的な貢献をしており、高品質の注釈付きデータセットを提供するだけでなく、体系的な理論的枠組みと実験的ベースラインを確立している。データ規模とモデル性能の面でなお改善の余地があるが、その学際的研究価値と実用的応用可能性により、本分野の重要な研究となっている。