2025-11-21T15:34:16.184333

Formalizing Style in Personal Narratives

Cortal, Finkel
Personal narratives are stories authors construct to make meaning of their experiences. Style, the distinctive way authors use language to express themselves, is fundamental to how these narratives convey subjective experiences. Yet there is a lack of a formal framework for systematically analyzing these stylistic choices. We present a novel approach that formalizes style in personal narratives as patterns in the linguistic choices authors make when communicating subjective experiences. Our framework integrates three domains: functional linguistics establishes language as a system of meaningful choices, computer science provides methods for automatically extracting and analyzing sequential patterns, and these patterns are linked to psychological observations. Using language models, we automatically extract linguistic features such as processes, participants, and circumstances. We apply our framework to hundreds of dream narratives, including a case study on a war veteran with post-traumatic stress disorder. Analysis of his narratives uncovers distinctive patterns, particularly how verbal processes dominate over mental ones, illustrating the relationship between linguistic choices and psychological states.
academic

Formalizzazione dello Stile nelle Narrazioni Personali

Informazioni Fondamentali

  • ID Articolo: 2510.08649
  • Titolo: Formalizing Style in Personal Narratives
  • Autori: Gustave Cortal, Alain Finkel (Université Paris-Saclay, CNRS)
  • Classificazione: cs.CL (Computational Linguistics), cs.AI
  • Data di Pubblicazione: 13 ottobre 2025 (arXiv v2)
  • Link Articolo: https://arxiv.org/abs/2510.08649

Riassunto

Le narrazioni personali sono storie costruite dagli autori per comprendere le loro esperienze. Lo stile, ovvero il modo unico in cui gli autori utilizzano il linguaggio per esprimersi, costituisce il fondamento attraverso il quale queste narrazioni trasmettono esperienze soggettive. Tuttavia, manca un quadro formale sistematico per analizzare queste scelte stilistiche. Questo articolo propone un approccio innovativo che formalizza lo stile nelle narrazioni personali come modelli di scelte linguistiche compiute dagli autori nel trasmettere esperienze soggettive. Il quadro integra tre ambiti disciplinari: la linguistica funzionale che stabilisce il linguaggio come sistema di scelte significative, l'informatica che fornisce metodi per l'estrazione automatica e l'analisi di modelli sequenziali, e questi modelli vengono correlati con osservazioni psicologiche. Utilizzando modelli linguistici, il processo di estrazione automatica identifica caratteristiche linguistiche quali processi, partecipanti e circostanze. Il quadro viene applicato a centinaia di narrazioni di sogni, incluso uno studio di caso di un veterano affetto da disturbo da stress post-traumatico. L'analisi della sua narrazione rivela modelli unici, in particolare come i processi verbali dominino i processi mentali, illustrando la relazione tra le scelte linguistiche e lo stato psicologico.

Contesto di Ricerca e Motivazione

Definizione del Problema

  1. Problema Centrale: Mancanza di un quadro formale sistematico per analizzare le scelte stilistiche nelle narrazioni personali. Sebbene la ricerca in stilistica e stilometria sia ricca, mancano strumenti operativi per catturare come i modelli di pensiero personali si manifestino nelle forme linguistiche.
  2. Importanza del Problema:
    • Le narrazioni personali rappresentano un modo fondamentale attraverso il quale gli esseri umani comprendono il mondo e plasmano l'identità
    • Negli ambienti terapeutici, la ricostruzione narrativa può facilitare il recupero; un quadro formalizzato consente l'identificazione più precisa dei modelli linguistici correlati agli stati psicologici
    • Supporta interventi mirati e applicazioni terapeutiche
  3. Limitazioni degli Approcci Esistenti:
    • I quadri qualitativi tradizionali (come la fenomenologia husserliana e l'analisi dei processi cognitivi di Adamard), sebbene ricchi nella descrizione, non forniscono strumenti operativi per catturare come lo stile si manifesti nelle forme linguistiche
    • I parser di linguistica funzionale sistemica esistenti sono "sperimentali, sensibili al dominio e richiedono un lavoro intensivo di adattamento"
    • Mancano metodi di analisi automatizzati su larga scala
  4. Motivazione della Ricerca: Basandosi sul lavoro di Tellier e Finkel (1995), che definiscono lo stile linguistico come modelli lessicali e sintattici di espressione dell'intenzione, sviluppare un quadro basato su sequenze per analizzare come le narrazioni personali trasmettono esperienze soggettive.

Contributi Principali

  1. Contributo Teorico: Propone un quadro sequenziale basato sulla linguistica funzionale sistemica, definendo lo stile come modelli nelle sequenze di scelte linguistiche
  2. Innovazione Metodologica: Sviluppa una metodologia che utilizza l'analisi sequenziale per identificare automaticamente i modelli
  3. Ricerca Empirica: Dimostra attraverso uno studio di caso su narrazioni di sogni come l'analisi dei modelli riveli intuizioni psicologiche e supporti applicazioni terapeutiche
  4. Implementazione Tecnica: Primo tentativo di automatizzare l'analisi della linguistica funzionale sistemica utilizzando modelli linguistici di grandi dimensioni

Dettagli Metodologici

Definizione del Compito

Input: Testo di narrazione personale Output: Modelli sequenziali di scelte linguistiche che rivelano caratteristiche stilistiche di come l'autore codifica l'esperienza soggettiva Vincoli: Basati sul sistema di transitività della linguistica funzionale sistemica (processi, partecipanti, circostanze)

Architettura del Modello

1. Sistema di Classificazione delle Caratteristiche Linguistiche

Basato sulla linguistica funzionale sistemica di Halliday, in particolare sul sistema di transitività:

Tipi di Processi (Processes):

  • Processi d'Azione (Action): Azioni ed eventi nel mondo fisico
  • Processi Mentali (Mental): Esperienze interne quali pensieri, percezioni e sentimenti
  • Processi Verbali (Verbal): Comportamenti comunicativi
  • Processi di Stato (State): Esistenza, possesso o condizione

Partecipanti (Participants): Realizzati attraverso sintagmi nominali Circostanze (Circumstances): Realizzate attraverso sintagmi avverbiali o sintagmi preposizionali

2. Quadro di Rappresentazione Sequenziale

Ogni sistema di caratteristiche linguistiche è rappresentato come un insieme finito Σ (alfabeto):

Σprocess = {action, mental, verbal, state}

Combinazione di alfabeti multipli attraverso il prodotto cartesiano:

Σ = Σprocess × Σtense × Σaspect

3. Metodi di Analisi Sequenziale

Analisi di Sottostringhe: Identifica modelli ripetuti di blocchi di simboli consecutivi Analisi di Sottosequenze: Identifica modelli che mantengono l'ordine relativo ma non richiedono continuità

Misure di Similarità: Utilizza la similarità del coseno

cos(s1, s2) = (Σi xiyi) / (√(Σi xi²) × √(Σi yi²))

Metodi di Clustering: Clustering gerarchico agglomerativo (collegamento di Ward)

Punti di Innovazione Tecnica

  1. Estrazione Automatizzata: Utilizza il modello Llama 3.1 8B con istruzioni ottimizzate, estraendo caratteristiche linguistiche attraverso apprendimento in contesto, evitando regole manuali e annotazioni di esperti
  2. Rappresentazione Sequenziale: Mappa le narrazioni in sequenze simboliche, supportando l'analisi dei modelli ispirata dalla biologia computazionale
  3. Analisi Multi-scala: Riconoscimento di modelli a più livelli, dai singoli simboli alle sottostringhe complesse
  4. Correlazione Psicologica: Stabilisce connessioni tra modelli linguistici e stati psicologici

Configurazione Sperimentale

Dataset

Corpus DreamBank:

  • Migliaia di narrazioni di sogni raccolte negli Stati Uniti
  • Analisi di cinque serie: blind (sognatori ciechi a lungo termine, n=361), ed (vedovi, n=139), izzy (adolescenti, n=1091), merri (artisti, n=202), viet (veterani della guerra del Vietnam, PTSD, n=566)
  • Benchmark costruito: campionamento casuale di 10 narrazioni per serie, totale 720 narrazioni di sogni

Metriche di Valutazione

  • Odds Ratio: Misura la probabilità relativa che una sottostringa specifica appaia in serie diverse
  • Test Esatto di Fisher (correzione Holm-Bonferroni): Test di significatività statistica
  • Coefficiente di Silhouette (Silhouette Score): Valutazione della qualità del clustering
  • Similarità del Coseno: Misura di similarità sequenziale

Metodi di Confronto

  • Analisi comparativa con il benchmark (norm)
  • Confronto di modelli tra serie diverse

Dettagli di Implementazione

  • Modello: Llama 3.1 8B Instruct
  • Hardware: Tesla V100 32GB, esecuzione di 80 ore
  • Preprocessing: Segmentazione di frasi con SpaCy, segmentazione di frasi con modello linguistico
  • Validazione: Validazione quantitativa su 50 frasi gold standard, accuratezza predittiva del 100%

Risultati Sperimentali

Risultati Principali

Analisi del Caso dei Veterani della Guerra del Vietnam (viet):

Scoperte sulla Distribuzione di Sottostringhe:

  • Processi verbali superiori del 40% rispetto al benchmark (OR=1.4, p<0.05)
  • Processi mentali inferiori del 40% rispetto al benchmark (OR=0.6, p<0.05)
  • Modelli di processi verbali consecutivi significativi: verbal.verbal (OR=2.00), verbal.verbal.verbal (OR=1.75)

Analisi di Clustering:

  • Clustering ottimale: 2 cluster, coefficiente di silhouette massimo
  • Sequenza Rappresentativa del Cluster 1: Altamente orientata all'azione (processi d'azione 23 volte, processi mentali 2 volte), copre 274 sequenze
  • Sequenza Rappresentativa del Cluster 2: Equilibrio azione-stato (processi d'azione 13 volte, processi di stato 16 volte, processi mentali 4 volte), copre 179 sequenze

Analisi di Caso

Esempio di Trasformazione Sequenziale:

"I wake in a dark room. I feel a cold wind. I tell myself to move."
→ Analisi di Clausola → Estrazione di Caratteristiche → Sequenza: amv
→ Sottostringhe: {am, mv}

Scoperte Sperimentali

  1. Correlazione dello Stato Psicologico: I veterani (viet) costruiscono l'esperienza principalmente attraverso processi d'azione e verbali piuttosto che processi mentali, probabilmente correlato a come il trauma influenzi l'elaborazione cognitiva ed emotiva
  2. Coerenza dei Modelli: I veterani seguono due modelli: strutture altamente orientate all'azione o strutture di alternanza stato-azione
  3. Validità dell'Automatizzazione: Il modello linguistico raggiunge un'accuratezza del 100% sul set di test standard

Lavori Correlati

Parsing della Linguistica Funzionale Sistemica

  • Metodi basati su regole iniziali: copertura limitata, sensibili al dominio
  • Pipeline basate su grafi: conversione di alberi di dipendenza in reti SFL
  • Metodi supervisionati: richiedono dati annotati da esperti
  • Innovazione di questo articolo: Approccio con modelli linguistici a pochi esempi, senza grammatiche manuali o dizionari di verbi

Analisi Computazionale di Narrazioni di Sogni

  • Metodi tradizionali: sistemi di codifica manuale basati su dizionari
  • Metodi distribuiti: embedding dello spazio semantico e clustering di argomenti
  • Sistemi ibridi: scoring di dizionari + classificatori
  • Approcci con modelli linguistici: rilevamento del sentimento e predizione di caratteri
  • Distinzione di questo articolo: Focus su "come si dice" piuttosto che "cosa si dice"

Conclusioni e Discussione

Conclusioni Principali

  1. Contributo Teorico: Formalizzazione riuscita dello stile come modelli sequenziali di scelte linguistiche basati sulla linguistica funzionale sistemica
  2. Validità Metodologica: Il quadro automatizzato è in grado di rivelare modelli di significato psicologico
  3. Potenziale Applicativo: Supporta la ricostruzione narrativa e gli interventi mirati negli ambienti terapeutici

Limitazioni

  1. Errori di Estrazione Automatica: I modelli linguistici potrebbero misclassificare processi o partecipanti, influenzando l'affidabilità dei modelli
  2. Interpretazione Psicologica: L'associazione tra scelte linguistiche e stati psicologici rimane correlazionale e descrittiva, richiedendo validazione mediante valutazione clinica
  3. Portata delle Caratteristiche: L'analisi attuale si concentra solo sui tipi di processi; future estensioni dovranno includere caratteristiche linguistiche più granulari

Direzioni Future

  1. Profilo dell'Autore: Inferenza delle caratteristiche dell'autore basata su modelli di esperienza soggettiva
  2. Generazione Condizionata dallo Stile: Generazione di narrazioni da sequenze di scelte, supportando interventi terapeutici
  3. Metodi della Scienza della Complessità: Applicazione di misure come la complessità di Lempel-Ziv per quantificare la ridondanza sequenziale
  4. Validazione Clinica: Combinazione con valutazioni cliniche per validare le interpretazioni psicologiche

Valutazione Approfondita

Punti di Forza

  1. Innovazione Interdisciplinare: Integrazione riuscita di linguistica funzionale, informatica e psicologia
  2. Avanzamento Metodologico: Primo utilizzo di modelli linguistici di grandi dimensioni per automatizzare l'analisi SFL
  3. Valore Pratico: Fornisce strumenti operativi per applicazioni terapeutiche
  4. Rigore Teorico: Basato sulla teoria matura della linguistica funzionale sistemica
  5. Scalabilità: Il quadro è adattabile a diverse caratteristiche linguistiche e scenari applicativi

Insufficienze

  1. Validazione Limitata: Validazione su soli 50 campioni standard, richiedendo validazione di annotazione di esperti su scala più ampia
  2. Correlazione Psicologica: Mancanza di validazione diretta con diagnosi cliniche
  3. Copertura Linguistica: Test solo su narrazioni di sogni in inglese, applicabilità cross-linguistica sconosciuta
  4. Semplificazione delle Caratteristiche: L'analisi attuale è relativamente semplice, non sfrutta pienamente la ricchezza della SFL

Impatto

  1. Contributo Accademico: Fornisce un nuovo paradigma di ricerca per il campo interdisciplinare della linguistica computazionale e della psicologia
  2. Prospettive Applicative: Ampie prospettive di applicazione in terapia digitale, analisi dell'autore, generazione di stile e altri campi
  3. Riproducibilità: Gli autori forniscono prompt completi, iperparametri e sequenze estratte, supportando la riproduzione della ricerca

Scenari Applicabili

  1. Psicologia Clinica: Assistenza ai terapeuti nell'analisi dei modelli narrativi dei pazienti
  2. Linguistica Forense: Identificazione dell'autore e analisi delle caratteristiche
  3. Ricerca Letteraria: Analisi quantitativa dello stile degli scrittori
  4. Salute Digitale: Monitoraggio della salute mentale attraverso diari personali e narrazioni
  5. Applicazioni Educative: Guida dello stile di scrittura e feedback personalizzato

Bibliografia

L'articolo cita una ricca letteratura interdisciplinare, inclusa:

  • Halliday et al. (2014): Fondamenti teorici della linguistica funzionale sistemica
  • Tellier e Finkel (1995): Lavori iniziali sulla formalizzazione dello stile linguistico
  • Banks (2019): Guida pratica alla SFL
  • Domhoff e Schneider (2008): Metodi di analisi quantitativa dei sogni
  • E una vasta letteratura correlata in linguistica computazionale, psicologia e scienze cognitive

Questo articolo dimostra eccellenza nell'innovazione teorica, nell'avanzamento metodologico e nelle prospettive applicative, aprendo nuove direzioni di ricerca per l'analisi computazionale delle narrazioni personali, con significativo valore accademico e pratico.