2025-11-21T15:34:16.184333

Formalizing Style in Personal Narratives

Cortal, Finkel
Personal narratives are stories authors construct to make meaning of their experiences. Style, the distinctive way authors use language to express themselves, is fundamental to how these narratives convey subjective experiences. Yet there is a lack of a formal framework for systematically analyzing these stylistic choices. We present a novel approach that formalizes style in personal narratives as patterns in the linguistic choices authors make when communicating subjective experiences. Our framework integrates three domains: functional linguistics establishes language as a system of meaningful choices, computer science provides methods for automatically extracting and analyzing sequential patterns, and these patterns are linked to psychological observations. Using language models, we automatically extract linguistic features such as processes, participants, and circumstances. We apply our framework to hundreds of dream narratives, including a case study on a war veteran with post-traumatic stress disorder. Analysis of his narratives uncovers distinctive patterns, particularly how verbal processes dominate over mental ones, illustrating the relationship between linguistic choices and psychological states.
academic

Formalizando el Estilo en Narrativas Personales

Información Básica

  • ID del Artículo: 2510.08649
  • Título: Formalizing Style in Personal Narratives
  • Autores: Gustave Cortal, Alain Finkel (Université Paris-Saclay, CNRS)
  • Clasificación: cs.CL (Lingüística Computacional), cs.AI
  • Fecha de Publicación: 13 de octubre de 2025 (arXiv v2)
  • Enlace del Artículo: https://arxiv.org/abs/2510.08649

Resumen

Las narrativas personales son historias construidas por los autores para comprender sus experiencias. El estilo, es decir, la manera única en que los autores utilizan el lenguaje para expresarse, es fundamental para que estas narrativas transmitan experiencias subjetivas. Sin embargo, carece de un marco formal sistemático para analizar estas elecciones estilísticas. Este artículo propone un enfoque novedoso que formaliza el estilo en narrativas personales como patrones de elecciones lingüísticas realizadas por los autores al transmitir experiencias subjetivas. El marco integra tres disciplinas: la lingüística funcional establece el lenguaje como un sistema de elecciones significativas, la informática proporciona métodos para extraer y analizar automáticamente patrones de secuencias, que se asocian con observaciones psicológicas. Utilizando modelos de lenguaje, se extraen automáticamente características lingüísticas como procesos, participantes y circunstancias. El marco se aplica a cientos de narrativas de sueños, incluyendo un estudio de caso de un veterano de guerra con trastorno de estrés postraumático. El análisis de sus narrativas revela patrones únicos, particularmente cómo los procesos verbales dominan los procesos mentales, ilustrando la relación entre las elecciones lingüísticas y el estado psicológico.

Antecedentes de Investigación y Motivación

Definición del Problema

  1. Problema Central: Carencia de un marco formal sistemático para analizar las elecciones estilísticas en narrativas personales. Aunque la investigación en estilística y estilometría es abundante, carecen de herramientas operacionales para capturar cómo los patrones de pensamiento individual se manifiestan en formas lingüísticas.
  2. Importancia del Problema:
    • Las narrativas personales son una forma crucial en que los humanos comprenden el mundo y moldean su identidad
    • En entornos terapéuticos, la reconstrucción narrativa puede facilitar la recuperación, y un marco formalizado permite identificar con mayor precisión patrones lingüísticos asociados con estados psicológicos
    • Apoya intervenciones dirigidas y aplicaciones terapéuticas
  3. Limitaciones de Métodos Existentes:
    • Los marcos cualitativos tradicionales (como la fenomenología husserliana, el análisis de procesos cognitivos de Adamard) aunque descriptivamente ricos, no proporcionan herramientas operacionales para capturar cómo el estilo se manifiesta en formas lingüísticas
    • Los analizadores existentes de lingüística funcional sistémica son "experimentales, sensibles al dominio y requieren adaptación laboriosa"
    • Carencia de métodos automatizados para análisis a gran escala
  4. Motivación de la Investigación: Basándose en el trabajo de Tellier y Finkel (1995), que define el estilo lingüístico como patrones léxicos y sintácticos para expresar intenciones, se desarrolla un marco basado en secuencias para analizar cómo las narrativas personales transmiten experiencias subjetivas.

Contribuciones Principales

  1. Contribución Teórica: Propone un marco de secuencias basado en lingüística funcional sistémica, definiendo el estilo como patrones en secuencias de elecciones lingüísticas
  2. Innovación Metodológica: Desarrolla una metodología que utiliza análisis de secuencias para identificar automáticamente patrones
  3. Investigación Empírica: Demuestra mediante estudios de caso de narrativas de sueños cómo el análisis de patrones revela perspectivas psicológicas y apoya aplicaciones terapéuticas
  4. Implementación Técnica: Primer intento de automatizar el análisis de lingüística funcional sistémica utilizando modelos de lenguaje grandes

Explicación Detallada de la Metodología

Definición de la Tarea

Entrada: Texto de narrativa personal Salida: Patrones de secuencias de elecciones lingüísticas que revelan características estilísticas de cómo el autor codifica experiencias subjetivas Restricciones: Basadas en el sistema de transitividad de la lingüística funcional sistémica (procesos, participantes, circunstancias)

Arquitectura del Modelo

1. Sistema de Clasificación de Características Lingüísticas

Basado en la lingüística funcional sistémica de Halliday, particularmente el sistema de transitividad:

Tipos de Procesos (Processes):

  • Procesos de Acción (Action): Acciones y eventos en el mundo físico
  • Procesos Mentales (Mental): Experiencias internas como pensamientos, percepciones y emociones
  • Procesos Verbales (Verbal): Comportamientos comunicativos
  • Procesos de Estado (State): Existencia, posesión o estado

Participantes (Participants): Realizados a través de sintagmas nominales Circunstancias (Circumstances): Realizadas a través de sintagmas adverbiales o preposicionales

2. Marco de Representación de Secuencias

Cada sistema de características lingüísticas se representa como un conjunto finito Σ (alfabeto):

Σprocess = {action, mental, verbal, state}

Se combinan múltiples alfabetos mediante producto cartesiano:

Σ = Σprocess × Σtense × Σaspect

3. Métodos de Análisis de Secuencias

Análisis de Subcadenas: Identifica patrones repetidos de bloques de símbolos consecutivos Análisis de Subsecuencias: Identifica patrones que mantienen orden relativo pero no requieren continuidad

Medida de Similitud: Utiliza similitud de coseno

cos(s1, s2) = (Σi xiyi) / (√(Σi xi²) × √(Σi yi²))

Método de Agrupamiento: Agrupamiento jerárquico aglomerativo (enlace de Ward)

Puntos de Innovación Técnica

  1. Extracción Automatizada: Utiliza el modelo Llama 3.1 8B ajustado por instrucciones, extrayendo características lingüísticas mediante aprendizaje en contexto, evitando reglas manuales y anotación de expertos
  2. Representación Secuencial: Mapea narrativas a secuencias simbólicas, apoyando análisis de patrones inspirados en biología computacional
  3. Análisis Multiescala: Reconocimiento de patrones multinivel desde símbolos individuales hasta subcadenas complejas
  4. Asociación Psicológica: Establece conexiones entre patrones lingüísticos y estados psicológicos

Configuración Experimental

Conjunto de Datos

Corpus DreamBank:

  • Miles de narrativas de sueños recopiladas en Estados Unidos
  • Análisis de cinco series: blind (soñadores con ceguera a largo plazo, n=361), ed (viudo, n=139), izzy (adolescente, n=1091), merri (artista, n=202), viet (veterano de guerra de Vietnam, TEPT, n=566)
  • Construcción de referencia: muestreo aleatorio de 10 narrativas por serie, total de 720 narrativas de sueños

Métricas de Evaluación

  • Odds Ratio: Mide la probabilidad relativa de que una subcadena específica aparezca en diferentes series
  • Prueba Exacta de Fisher (corrección de Holm-Bonferroni): Prueba de significancia estadística
  • Coeficiente de Silueta (Silhouette Score): Evaluación de calidad del agrupamiento
  • Similitud de Coseno: Medida de similitud de secuencias

Métodos de Comparación

  • Análisis comparativo con referencia (norm)
  • Comparación de patrones entre diferentes series

Detalles de Implementación

  • Modelo: Llama 3.1 8B Instruct
  • Hardware: Tesla V100 32GB, 80 horas de ejecución
  • Preprocesamiento: Segmentación de oraciones con SpaCy, segmentación con modelo de lenguaje
  • Validación: Validación cuantitativa en 50 oraciones de estándar de oro, precisión de predicción del 100%

Resultados Experimentales

Resultados Principales

Análisis de Caso: Veterano de Guerra de Vietnam (viet):

Hallazgos de Distribución de Subcadenas:

  • Procesos verbales 40% más altos que la referencia (OR=1.4, p<0.05)
  • Procesos mentales 40% más bajos que la referencia (OR=0.6, p<0.05)
  • Patrón de procesos verbales consecutivos significativo: verbal.verbal (OR=2.00), verbal.verbal.verbal (OR=1.75)

Análisis de Agrupamiento:

  • Agrupamiento óptimo: 2 clusters, coeficiente de silueta máximo
  • Secuencia Representativa del Cluster 1: Altamente orientada a la acción (procesos de acción 23 veces, procesos mentales 2 veces), cubre 274 secuencias
  • Secuencia Representativa del Cluster 2: Equilibrio acción-estado (procesos de acción 13 veces, procesos de estado 16 veces, procesos mentales 4 veces), cubre 179 secuencias

Análisis de Casos

Ejemplo de Transformación de Secuencia:

"I wake in a dark room. I feel a cold wind. I tell myself to move."
→ Análisis de Cláusula → Extracción de Características → Secuencia: amv
→ Subcadenas: {am, mv}

Hallazgos Experimentales

  1. Asociación de Estado Psicológico: viet construye experiencias principalmente a través de procesos de acción y verbales en lugar de procesos mentales, posiblemente relacionado con cómo el trauma afecta el procesamiento cognitivo y emocional
  2. Consistencia de Patrones: Los veteranos siguen dos plantillas: estructura altamente orientada a la acción o estructura de alternancia estado-acción
  3. Validez de Automatización: El modelo de lenguaje logra precisión del 100% en el conjunto de prueba estándar

Trabajo Relacionado

Análisis de Lingüística Funcional Sistémica

  • Métodos tempranos basados en reglas: cobertura limitada, sensibles al dominio
  • Tuberías basadas en gráficos: convierten árboles de dependencia en redes SFL
  • Métodos supervisados: requieren datos anotados por expertos
  • Innovación de este Artículo: Enfoque de modelo de lenguaje con pocos ejemplos, sin necesidad de gramática manual o diccionarios de verbos

Análisis Computacional de Narrativas de Sueños

  • Métodos tradicionales: sistemas de codificación manual basados en diccionarios
  • Métodos distribuidos: incrustaciones de espacio semántico y agrupamiento temático
  • Sistemas híbridos: puntuación de diccionarios + clasificadores
  • Enfoque de modelos de lenguaje: detección de sentimientos y predicción de caracteres
  • Distinción de este Artículo: Se enfoca en "cómo se dice" en lugar de "qué se dice"

Conclusiones y Discusión

Conclusiones Principales

  1. Contribución Teórica: Formalización exitosa del estilo como patrones de secuencias de elecciones lingüísticas basadas en lingüística funcional sistémica
  2. Validez Metodológica: El marco automatizado puede revelar patrones con significancia psicológica
  3. Potencial de Aplicación: Apoya reconstrucción narrativa e intervenciones dirigidas en entornos terapéuticos

Limitaciones

  1. Errores de Extracción Automatizada: Los modelos de lenguaje pueden clasificar erróneamente procesos o participantes, afectando la confiabilidad de patrones
  2. Interpretación Psicológica: La asociación entre elecciones lingüísticas y estado psicológico sigue siendo correlacional y descriptiva, requiere validación mediante evaluación clínica
  3. Rango de Características: El análisis actual se enfoca solo en tipos de procesos, futuras extensiones necesitan características lingüísticas más granulares

Direcciones Futuras

  1. Perfilado de Autores: Inferencia de características de autores basada en patrones de experiencia subjetiva
  2. Generación Condicional de Estilo: Generación de narrativas a partir de secuencias de elecciones, apoyando intervenciones terapéuticas
  3. Métodos de Ciencia de la Complejidad: Aplicación de medidas como complejidad de Lempel-Ziv para cuantificar redundancia de secuencias
  4. Validación Clínica: Combinación con evaluaciones clínicas para validar interpretaciones psicológicas

Evaluación Profunda

Fortalezas

  1. Innovación Interdisciplinaria: Integración exitosa de lingüística funcional, informática y psicología
  2. Avance Metodológico: Primer uso de modelos de lenguaje grandes para automatizar análisis SFL
  3. Valor Práctico: Proporciona herramientas operacionales para aplicaciones terapéuticas
  4. Rigor Teórico: Basado en teoría de lingüística funcional sistémica establecida
  5. Escalabilidad: El marco es adaptable a diferentes características lingüísticas y escenarios de aplicación

Deficiencias

  1. Validación Limitada: Validación solo en 50 muestras estándar, requiere validación de expertos a mayor escala
  2. Asociación Psicológica: Carencia de validación directa con diagnósticos clínicos
  3. Cobertura Lingüística: Solo pruebas en narrativas de sueños en inglés, aplicabilidad multilingüe desconocida
  4. Simplificación de Características: Análisis actual relativamente simple, no aprovecha plenamente la riqueza de SFL

Impacto

  1. Contribución Académica: Proporciona nuevo paradigma de investigación para el campo interdisciplinario de lingüística computacional y psicología
  2. Perspectivas de Aplicación: Amplias perspectivas de aplicación en terapia digital, análisis de autoría, generación de estilo y otros campos
  3. Reproducibilidad: Los autores proporcionan prompts completos, hiperparámetros y secuencias extraídas, apoyando reproducción de investigación

Escenarios Aplicables

  1. Psicología Clínica: Asistencia a terapeutas en el análisis de patrones narrativos de pacientes
  2. Lingüística Forense: Identificación de autoría y análisis de características
  3. Investigación Literaria: Análisis cuantitativo del estilo de escritores
  4. Salud Digital: Monitoreo de salud mental en diarios personales y narrativas
  5. Aplicaciones Educativas: Orientación de estilo de escritura y retroalimentación personalizada

Referencias

El artículo cita una rica literatura interdisciplinaria, incluyendo:

  • Halliday et al. (2014): Fundamentos teóricos de lingüística funcional sistémica
  • Tellier and Finkel (1995): Trabajo temprano en formalización de estilo lingüístico
  • Banks (2019): Guía práctica de SFL
  • Domhoff and Schneider (2008): Métodos de análisis cuantitativo de sueños
  • Y abundante literatura relacionada en lingüística computacional, psicología y ciencia cognitiva

Este artículo demuestra excelencia en innovación teórica, avance metodológico y perspectivas de aplicación, abriendo nuevas direcciones de investigación para el análisis computacional de narrativas personales, con importante valor académico y significancia práctica.