2025-11-18T22:34:14.672296

FactAppeal: Identifying Epistemic Factual Appeals in News Media

Mor-Lan, Sheafer, Shenhav

How is a factual claim made credible? We propose the novel task of Epistemic Appeal Identification, which identifies whether and how factual statements have been anchored by external sources or evidence. To advance research on this task, we present FactAppeal, a manually annotated dataset of 3,226 English-language news sentences. Unlike prior resources that focus solely on claim detection and verification, FactAppeal identifies the nuanced epistemic structures and evidentiary basis underlying these claims and used to support them. FactAppeal contains span-level annotations which identify factual statements and mentions of sources on which they rely. Moreover, the annotations include fine-grained characteristics of factual appeals such as the type of source (e.g. Active Participant, Witness, Expert, Direct Evidence), whether it is mentioned by name, mentions of the source's role and epistemic credentials, attribution to the source via direct or indirect quotation, and other features. We model the task with a range of encoder models and generative decoder models in the 2B-9B parameter range. Our best performing model, based on Gemma 2 9B, achieves a macro-F1 score of 0.73.

academic

FactAppeal: Identificación de Apelaciones Epistémicas Factuales en Medios de Comunicación

Información Básica

ID del Artículo: 2510.10627
Título: FactAppeal: Identifying Epistemic Factual Appeals in News Media
Autores: Guy Mor-Lan, Tamir Sheafer, Shaul R. Shenhav (Universidad Hebrea de Jerusalén)
Clasificación: cs.CL (Lingüística Computacional)
Fecha de Publicación: 12 de octubre de 2025 (preimpresión en arXiv)
Enlace del Artículo: https://arxiv.org/abs/2510.10627

Resumen

Este artículo propone una tarea novedosa: la identificación de apelaciones epistémicas, cuyo objetivo es identificar si las afirmaciones factuales están respaldadas por fuentes externas o evidencia, y cómo lo están. Para avanzar en la investigación de esta tarea, los autores construyeron el conjunto de datos FactAppeal, que contiene anotaciones manuales de 3,226 oraciones de noticias en inglés. A diferencia de recursos anteriores que se enfocaban únicamente en la detección y verificación de afirmaciones, FactAppeal identifica estructuras epistémicas refinadas y bases de evidencia que respaldan estas afirmaciones. El conjunto de datos incluye anotaciones a nivel de fragmento que identifican afirmaciones factuales y las menciones de fuentes de las que dependen. Además, las anotaciones incluyen características granulares de apelaciones factuales, como tipo de fuente (por ejemplo, participante activo, testigo, experto, evidencia directa), si se menciona nominalmente, rol de la fuente y menciones de credenciales epistémicas, atribución a fuentes mediante citas directas o indirectas, entre otras características. Los autores modelaron esta tarea utilizando modelos codificadores y decodificadores generativos en el rango de 2B-9B parámetros, logrando el mejor modelo de desempeño basado en Gemma 2 9B una puntuación F1 de macro-promedio de 0.73.

Contexto de Investigación y Motivación

Definición del Problema

En una era de proliferación de desinformación y escepticismo generalizado hacia la cobertura mediática, comprender cómo se presentan las afirmaciones factuales es más importante que nunca. La credibilidad de una afirmación factual no depende solo de su contenido, sino también de cómo apela a fuentes de conocimiento externas—ya sea a través de testimonios de expertos, declaraciones oficiales o evidencia de experiencia directa.

Limitaciones de Métodos Existentes

Aunque se ha logrado un progreso sustancial en la investigación de detección y verificación de afirmaciones, los métodos existentes se enfocaban principalmente en contenido de afirmaciones aisladas, ignorando las estructuras epistémicas que otorgan credibilidad y poder persuasivo a estas afirmaciones. Los marcos tradicionales de detección de facticidad carecen de una comprensión profunda de cómo se construyen y respaldan las afirmaciones en los medios de comunicación.

Motivación de la Investigación

Necesidad de análisis de estructuras epistémicas: Comprender cómo las afirmaciones factuales obtienen respaldo de fuentes de autoridad externa
Investigación de credibilidad mediática: Analizar el flujo de conocimiento y mecanismos de verificación en medios de comunicación
Mejora de verificación de hechos automática: Proporcionar base para verificación de hechos más consciente del contexto
Aplicaciones en ciencias sociales: Proporcionar herramientas para investigación en filosofía política, epistemología social y comunicación

Contribuciones Principales

Propuesta de nueva tarea: Primera definición formal de la tarea de identificación de apelaciones epistémicas, que va más allá de la detección de facticidad tradicional, introduciendo una capa rica de razonamiento epistémico
Construcción de conjunto de datos anotado: Creación del conjunto de datos FactAppeal con anotaciones granulares a nivel de fragmento de 3,226 oraciones de noticias
Establecimiento de taxonomía de clasificación: Desarrollo de una taxonomía sistemática de apelaciones epistémicas basada en proximidad de fuente a evento (interna vs. externa) y tipo de fuente (humana vs. no humana)
Implementación de modelos de base de referencia: Establecimiento de líneas base de tareas utilizando modelos codificadores y decodificadores generativos, con el mejor modelo alcanzando una puntuación F1 de macro-promedio de 0.73
Valor interdisciplinario: Proporciona herramienta importante para lingüística computacional, ciencias sociales e investigación mediática

Explicación Detallada de Métodos

Definición de la Tarea

La tarea de identificación de apelaciones epistémicas requiere:

Determinar si una oración presenta una afirmación factual
Si es así, identificar cómo invoca fuentes externas o evidencia para respaldar esa afirmación
Identificar las fuentes de autoridad epistémica
Clasificar el tipo y método de la apelación

Sistema de Anotación

Tipos de Etiquetas Principales

Fact Without Appeal: Afirmación factual sin apelación epistémica
Fact With Appeal: Afirmación factual con apelación epistémica
- Modificadores: Direct quote (cita directa) / Indirect quote (cita indirecta)
Source: Fuente epistémica a la que se atribuye la afirmación
- Estado nominal: Named (nombrada) / Unnamed (sin nombre)
- Tipo de fuente: Clasificación de 7 tipos
Source Attribute: Atributos epistémicos relevantes de la fuente
Recipient: Objeto que recibe la información
Appeal Time: Tiempo en que ocurre la apelación
Appeal Location: Ubicación donde ocurre la apelación

Sistema de Clasificación de Tipos de Fuente

Taxonomía construida en dos dimensiones:

Proximidad al evento: Interna (contacto directo) vs. Externa (conocimiento profesional general)
Naturaleza de la fuente: Humana vs. No humana

Fuentes Internas (basadas en contacto directo):

Active Participant: Participante activo en el evento
Witness: Observador que proporciona testimonio de primera mano
Official: Participante con autoridad legal, política o burocrática
Direct Evidence: Evidencia directa encontrada en el lugar

Fuentes Externas (basadas en conocimiento profesional):

Expert: Científico o experto con conocimiento especializado
Expert Document: Documentos de investigación, reportes científicos e institucionales
News Report: Referencias a reportajes de noticias anteriores

Puntos de Innovación Técnica

Anotación a nivel de fragmento: Permite distinguir entre apelaciones factuales, hechos sin apelación y componentes no factuales dentro de un texto único
Soporte de etiquetas anidadas: Diferentes tipos de etiquetas pueden anidarse, soportando estructuras epistémicas complejas
Características granulares: Captura información multidimensional incluyendo tipo de fuente, estado nominal, método de cita, etc.
Clasificación de autoridad epistémica: Sistema de clasificación de fuentes estructurado basado en teoría cognitiva

Configuración Experimental

Conjunto de Datos

Escala: 3,226 oraciones de artículos de noticias en inglés de 2020-2022
Anotadores: Dos anotadores (uno de los autores y un asistente de investigación)
División de datos: Conjunto de entrenamiento 70%, conjunto de desarrollo 15%, conjunto de prueba 15%
Consistencia de anotación: IoU general de 0.74, Kappa de Cohen de 0.82

Métricas de Evaluación

Precisión, recuperación y puntuación F1 de macro-promedio a nivel de palabra
Evaluación de clasificación binaria multietiqueta para 18 categorías de etiquetas

Métodos de Comparación

Modelos Codificadores (clasificación multietiqueta a nivel de token):

RoBERTa (base, 125M)
DeBERTa v3 (base, 184M)
ModernBERT (base, 150M)

Modelos Decodificadores Generativos (secuencia a secuencia):

Gemma 2 (2B, 9B)
Llama 3.1 (8B)
Mistral v0.3 (7B)

Detalles de Implementación

Modelos codificadores: Entrenamiento con focal loss hasta 12 épocas
Modelos decodificadores: Ajuste fino de 4-bit con QLORA, entrenamiento de 3 épocas
Hardware: GPU A100 único (40GB VRAM)
Tasa de aprendizaje: 1e-5

Resultados Experimentales

Resultados Principales

Modelo	Precisión	Recuperación	F1
Gemma 2 9B	0.76	0.73	0.73
RoBERTa (base)	0.75	0.67	0.70
Mistral v0.3 7B	0.73	0.68	0.70
DeBERTa v3 (base)	0.73	0.67	0.69
Llama 3.1 8B	0.75	0.65	0.68

Hallazgos Clave

Ventaja de modelos generativos: El modelo decodificador más grande, Gemma 2 9B, alcanza el mejor desempeño
Limitaciones de modelos codificadores: Los modelos codificadores muestran mayor variabilidad de desempeño entre categorías
Impacto de frecuencia de etiqueta: El desempeño de modelos codificadores muestra correlación más fuerte con conteo de etiquetas (ρs = 0.72 vs 0.66)
Detección de tipo de fuente: El desempeño de anotación de tipo de fuente muestra correlación más baja con popularidad de etiqueta

Análisis de Desempeño por Categoría

Detección de facticidad: Fact w/o Appeal (0.89), Fact with Appeal (0.85)
Detección de fuente: Source (0.84), Source Attribute (0.79)
Tipo de cita: Indirect Quote (0.83), Direct Quote (0.80)
Tipo de fuente: Variabilidad mayor en desempeño, Active Participant (0.54), News Report (0.68)

Estadísticas del Conjunto de Datos

Proporción de oraciones factuales: Más del 80% de oraciones anotadas como factuales
Distribución de tipos de apelación: Hechos sin apelación aproximadamente el doble de hechos con apelación
Método de cita: 66% usa paráfrasis, 34% usa cita directa
Estado nominal: 64% de fuentes mencionadas nominalmente

Trabajo Relacionado

Investigación en Verificación de Afirmaciones

Trabajo temprano: Enfoque en determinación de eventos verificables (Sauri and Pustejovsky, 2009)
Puntos de referencia a gran escala: Conjuntos de datos FEVER, SciFact, FactRel
Limitaciones: Enfoque principalmente en detección de afirmaciones y relaciones entre afirmaciones, falta descripción completa de patrones epistémicos

Modalidades Epistémicas y Minería de Argumentos

Modalidades epistémicas: Captura marcas lingüísticas de certeza y creencia
Minería de argumentos: Exploración de cómo se construyen y respaldan afirmaciones en el discurso
Detección de postura epistémica: Modelado del grado de compromiso de la fuente con la afirmación

Atribución de Fuentes y Análisis de Citas

Detección de citas: Detección de citas y atribución a entidades
Limitaciones: Típicamente no clasifican fuentes por tipo o capturan si la apelación se invoca mediante lenguaje directo o paráfrasis

Conclusiones y Discusión

Conclusiones Principales

Viabilidad de la tarea: La tarea de identificación de apelaciones epistémicas es viable pero aún desafiante
Ventaja de modelos generativos: Los modelos generativos muestran mejor desempeño en manejo de estructuras epistémicas complejas
Valor del análisis granular: Las anotaciones a nivel de fragmento revelan estructuras epistémicas complejas en medios de comunicación

Limitaciones

Restricción a nivel de oración: Uso únicamente de anotaciones a nivel de oración, limitando información contextual capturada
Vinculación fuente-afirmación: Las anotaciones actuales no vinculan explícitamente cada fuente con su afirmación correspondiente
Rango de idioma y tiempo: Limitado a artículos de noticias en inglés de 2020-2022
Escala de anotación: Conjunto de datos relativamente pequeño, potencialmente afectando capacidad de generalización del modelo

Direcciones Futuras

Extensión a nivel de párrafo/artículo: Modelado de estructuras de discurso complejas en unidades de texto más grandes
Extensión multilingüe: Aplicación a otros idiomas y contextos culturales
Modelado de relaciones fuente-afirmación: Modelado explícito de correspondencias entre fuentes y afirmaciones
Aplicación en redes sociales: Extensión a otros tipos de discurso como redes sociales
Análisis de dinámicas temporales: Investigación de cambios temporales en patrones de apelaciones epistémicas

Evaluación Profunda

Fortalezas

Innovación de tarea: Primera definición y estudio sistemático de la tarea de identificación de apelaciones epistémicas, llenando un vacío de investigación importante
Base teórica sólida: Taxonomía de clasificación construida sobre teoría cognitiva y lingüística, con base teórica firme
Calidad de anotación alta: Anotaciones granulares a nivel de fragmento, buena consistencia entre anotadores (Kappa=0.82)
Valor interdisciplinario: Proporciona recurso valioso para lingüística computacional, ciencia política, comunicación y otros campos
Experimentación exhaustiva: Comparación de múltiples arquitecturas de modelos, análisis de desempeño detallado

Deficiencias

Limitación de escala de datos: Escala de 3,226 oraciones relativamente pequeña, potencialmente limitando desempeño del modelo y capacidad de generalización
Complejidad de anotación: Algunas categorías de etiqueta con muestras escasas, afectando efectividad de aprendizaje del modelo
Métricas de evaluación únicas: Uso principalmente de puntuación F1, falta de métricas de evaluación específicas de tarea
Análisis de errores insuficiente: Falta análisis profundo de tipos de errores del modelo
Validación de aplicación práctica: Falta verificación de efectividad en tareas reales de verificación de hechos o análisis mediático

Impacto

Contribución académica: Abre nueva dirección de investigación en campo de procesamiento de lenguaje natural
Valor práctico: Aplicable a verificación automática de hechos, detección de sesgo mediático, construcción de gráficos de conocimiento y otras tareas
Significado social: Ayuda a comprender y analizar mecanismos de transmisión de información y verificación en medios
Reproducibilidad: Datos y código publicados públicamente, facilitando investigación posterior

Escenarios de Aplicación

Análisis de medios de comunicación: Análisis de patrones de uso de evidencia en reportajes de noticias
Asistencia en verificación de hechos: Proporciona información contextual más rica para sistemas automáticos de verificación de hechos
Educación en alfabetización mediática: Ayuda a identificar y analizar estrategias de apelación epistémica en medios
Análisis de discurso político: Investigación de patrones de apelación a autoridad en comunicación política
Construcción de gráficos de conocimiento: Proporciona base para construcción de gráficos de conocimiento que incluyen relaciones de evidencia

Referencias

Thorne et al. (2018): Conjunto de datos FEVER, extracción y verificación de hechos a gran escala
Sauri and Pustejovsky (2009): Trabajo temprano en detección de facticidad
Da San Martino et al. (2019): Análisis granular de técnicas de propaganda
Collins and Evans (2002): Tercera ola de investigación en conocimiento experto y experiencia
Anderson (2021): Burbujas epistémicas y política autoritaria

Este artículo realiza contribuciones pioneras en la tarea emergente de identificación de apelaciones epistémicas, no solo proporcionando un conjunto de datos anotado de alta calidad, sino también estableciendo un marco teórico sistemático y líneas base experimentales. Aunque hay espacio para mejora en escala de datos y desempeño del modelo, su valor de investigación interdisciplinario y potencial de aplicación práctica lo convierten en un trabajo importante en el campo.