2025-11-21T15:34:16.184333

Formalizing Style in Personal Narratives

Cortal, Finkel
Personal narratives are stories authors construct to make meaning of their experiences. Style, the distinctive way authors use language to express themselves, is fundamental to how these narratives convey subjective experiences. Yet there is a lack of a formal framework for systematically analyzing these stylistic choices. We present a novel approach that formalizes style in personal narratives as patterns in the linguistic choices authors make when communicating subjective experiences. Our framework integrates three domains: functional linguistics establishes language as a system of meaningful choices, computer science provides methods for automatically extracting and analyzing sequential patterns, and these patterns are linked to psychological observations. Using language models, we automatically extract linguistic features such as processes, participants, and circumstances. We apply our framework to hundreds of dream narratives, including a case study on a war veteran with post-traumatic stress disorder. Analysis of his narratives uncovers distinctive patterns, particularly how verbal processes dominate over mental ones, illustrating the relationship between linguistic choices and psychological states.
academic

Formalisierung von Stil in persönlichen Narrativen

Grundinformationen

  • Paper-ID: 2510.08649
  • Titel: Formalizing Style in Personal Narratives
  • Autoren: Gustave Cortal, Alain Finkel (Université Paris-Saclay, CNRS)
  • Klassifizierung: cs.CL (Computerlinguistik), cs.AI
  • Veröffentlichungsdatum: 13. Oktober 2025 (arXiv v2)
  • Paper-Link: https://arxiv.org/abs/2510.08649

Zusammenfassung

Persönliche Narrative sind Geschichten, die Autoren konstruieren, um ihre Erfahrungen zu verstehen. Stil – die einzigartige Art und Weise, wie Autoren Sprache verwenden, um sich auszudrücken – ist grundlegend dafür, wie diese Narrative subjektive Erfahrungen vermitteln. Es fehlt jedoch ein systematischer Rahmen zur Analyse dieser Stilwahl. Dieser Artikel schlägt einen neuartigen Ansatz vor, der Stil in persönlichen Narrativen als Muster sprachlicher Wahlmöglichkeiten formalisiert, die Autoren bei der Vermittlung subjektiver Erfahrungen treffen. Der Rahmen integriert drei Disziplinen: Funktionale Linguistik etabliert Sprache als System bedeutungsvoller Wahlmöglichkeiten, Informatik bietet Methoden zur automatischen Extraktion und Analyse von Sequenzmustern, die mit psychologischen Beobachtungen verknüpft sind. Unter Verwendung von Sprachmodellen werden automatisch sprachliche Merkmale wie Prozesse, Partizipanten und Umstände extrahiert. Der Rahmen wird auf Hunderte von Traumerzählungen angewendet, einschließlich einer Fallstudie eines Kriegsveteranen mit posttraumatischer Belastungsstörung. Die Analyse seiner Narrative offenbart einzigartige Muster, insbesondere wie verbale Prozesse psychische Prozesse dominieren, was die Beziehung zwischen sprachlichen Wahlmöglichkeiten und psychischem Zustand verdeutlicht.

Forschungshintergrund und Motivation

Problemdefinition

  1. Kernproblem: Es fehlt ein systematischer formaler Rahmen zur Analyse von Stilwahlmöglichkeiten in persönlichen Narrativen. Obwohl die Stilistik und Stilometrie umfangreich erforscht sind, mangelt es an operativen Werkzeugen zur Erfassung, wie persönliche Denkmuster in sprachlichen Formen verkörpert werden.
  2. Problemrelevanz:
    • Persönliche Narrative sind ein wichtiger Weg für Menschen, die Welt zu verstehen und ihre Identität zu prägen
    • In therapeutischen Umgebungen kann die Neukonstruktion von Narrativen die Genesung fördern; ein formalisierter Rahmen ermöglicht die präzisere Identifizierung sprachlicher Muster, die mit psychischen Zuständen verbunden sind
    • Unterstützung gezielter Interventionen und therapeutischer Anwendungen
  3. Einschränkungen bestehender Ansätze:
    • Traditionelle qualitative Rahmen (wie husserlsche Phänomenologie, Adamards Analyse kognitiver Prozesse) bieten zwar reichhaltige Beschreibungen, stellen aber keine operativen Werkzeuge zur Verfügung, um zu erfassen, wie Stil in sprachlichen Formen verkörpert wird
    • Bestehende Parser der systemisch-funktionalen Linguistik sind „experimentell, domänenempfindlich und arbeitsintensiv in der Anpassung"
    • Mangel an automatisierten Methoden für großflächige Analysen
  4. Forschungsmotivation: Basierend auf der Arbeit von Tellier und Finkel (1995), die sprachlichen Stil als lexikalische und syntaktische Muster zur Ausdrucksabsicht definieren, wird ein sequenzbasierter Rahmen entwickelt, um zu analysieren, wie persönliche Narrative subjektive Erfahrungen vermitteln.

Kernbeiträge

  1. Theoretischer Beitrag: Vorschlag eines auf systemisch-funktionaler Linguistik basierenden Sequenzrahmens, der Stil als Muster in Sequenzen sprachlicher Wahlmöglichkeiten definiert
  2. Methodische Innovation: Entwicklung einer Methodik zur automatischen Identifizierung von Mustern mittels Sequenzanalyse
  3. Empirische Forschung: Demonstration durch Fallstudie von Traumerzählungen, wie Musteranalyse psychologische Einsichten offenbaren und therapeutische Anwendungen unterstützen kann
  4. Technische Implementierung: Erster Versuch, die Analyse der systemisch-funktionalen Linguistik mit großen Sprachmodellen zu automatisieren

Methodische Details

Aufgabendefinition

Eingabe: Persönlicher Narrativtext Ausgabe: Sequenzmuster sprachlicher Wahlmöglichkeiten, die Stilmerkmale offenbaren, wie der Autor subjektive Erfahrungen kodiert Einschränkungen: Basierend auf dem Transitivitätssystem der systemisch-funktionalen Linguistik (Prozesse, Partizipanten, Umstände)

Modellarchitektur

1. Klassifizierungssystem für sprachliche Merkmale

Basierend auf Hallidays systemisch-funktionaler Linguistik, insbesondere dem Transitivitätssystem:

Prozesstypen (Processes):

  • Handlungsprozesse (Action): Handlungen und Ereignisse in der physischen Welt
  • Mentale Prozesse (Mental): Innere Erfahrungen wie Gedanken, Wahrnehmung und Gefühle
  • Verbale Prozesse (Verbal): Kommunikationsverhalten
  • Zustandsprozesse (State): Existenz, Besitz oder Zustände

Partizipanten (Participants): Realisiert durch Nominalphrasen Umstände (Circumstances): Realisiert durch Adverbialgruppen oder Präpositionalphrasen

2. Sequenzdarstellungsrahmen

Jedes sprachliche Merkmalssystem wird als endliche Menge Σ (Alphabet) dargestellt:

Σprocess = {action, mental, verbal, state}

Mehrere Alphabete werden durch kartesisches Produkt kombiniert:

Σ = Σprocess × Σtense × Σaspect

3. Sequenzanalysemethoden

Substring-Analyse: Identifizierung wiederholter Muster kontinuierlicher Symbolblöcke Subsequenz-Analyse: Identifizierung von Mustern, die relative Ordnung bewahren, aber keine Kontinuität erfordern

Ähnlichkeitsmaß: Verwendung von Kosinusähnlichkeit

cos(s1, s2) = (Σi xiyi) / (√(Σi xi²) × √(Σi yi²))

Clustering-Methode: Hierarchisches agglomeratives Clustering (Ward-Verknüpfung)

Technische Innovationen

  1. Automatisierte Extraktion: Verwendung des Llama 3.1 8B Instruct-Modells mit kontextuellem Lernen zur Extraktion sprachlicher Merkmale, ohne manuelle Regeln und Expertenmarkierungen
  2. Sequenzialisierte Darstellung: Abbildung von Narrativen auf Symbolsequenzen, unterstützend für von der Computerbiolgie inspirierte Musteranalyse
  3. Mehrskalenanalyse: Mehrschichtige Mustererkennung von einzelnen Symbolen bis zu komplexen Substrings
  4. Psychologische Verknüpfung: Verknüpfung sprachlicher Muster mit psychischen Zuständen

Experimentelle Einrichtung

Datensatz

DreamBank-Korpus:

  • Tausende von in den USA gesammelten Traumerzählungen
  • Analyse von fünf Serien: blind (Träumer mit Langzeitblindheit, n=361), ed (verwitweter Mann, n=139), izzy (Jugendlicher, n=1091), merri (Künstler, n=202), viet (Vietnamkriegsveteran mit PTBS, n=566)
  • Benchmark-Konstruktion: Zufällige Stichprobe von 10 Erzählungen pro Serie, insgesamt 720 Traumerzählungen

Evaluierungsmetriken

  • Odds Ratio: Messung der relativen Wahrscheinlichkeit, dass spezifische Substrings in verschiedenen Serien auftreten
  • Fishers exakter Test (Holm-Bonferroni-Korrektur): Signifikanztestung
  • Silhouette-Koeffizient: Bewertung der Clustering-Qualität
  • Kosinusähnlichkeit: Sequenzähnlichkeitsmessung

Vergleichsmethoden

  • Vergleichende Analyse mit Baseline (norm)
  • Mustervergleich zwischen verschiedenen Serien

Implementierungsdetails

  • Modell: Llama 3.1 8B Instruct
  • Hardware: Tesla V100 32GB, Laufzeit 80 Stunden
  • Vorverarbeitung: SpaCy-Satzaufteilung, Sprachmodell-Satzaufteilung
  • Validierung: Quantitative Validierung mit 50 Gold-Standard-Sätzen, Vorhersagegenauigkeit 100%

Experimentelle Ergebnisse

Hauptergebnisse

Fallanalyse Vietnamkriegsveteran (viet):

Substring-Verteilungsfunde:

  • Verbale Prozesse 40% höher als Baseline (OR=1,4, p<0,05)
  • Mentale Prozesse 40% niedriger als Baseline (OR=0,6, p<0,05)
  • Signifikante Muster kontinuierlicher verbaler Prozesse: verbal.verbal (OR=2,00), verbal.verbal.verbal (OR=1,75)

Clustering-Analyse:

  • Optimales Clustering: 2 Cluster mit maximalem Silhouette-Koeffizient
  • Cluster 1 Repräsentativsequenz: Hochgradig handlungsorientiert (23 Handlungsprozesse, 2 mentale Prozesse), umfasst 274 Sequenzen
  • Cluster 2 Repräsentativsequenz: Handlungs-Zustands-Ausgleich (13 Handlungsprozesse, 16 Zustandsprozesse, 4 mentale Prozesse), umfasst 179 Sequenzen

Fallanalyse

Beispiel-Sequenztransformation:

"I wake in a dark room. I feel a cold wind. I tell myself to move."
→ Klauselanalyse → Merkmalsextraktion → Sequenz: amv
→ Substrings: {am, mv}

Experimentelle Befunde

  1. Psychische Zustandsverknüpfung: Veteranen konstruieren Erfahrungen primär durch Handlungs- und Verbalprozesse statt mentale Prozesse, möglicherweise verbunden damit, wie Trauma die kognitive und emotionale Verarbeitung beeinflusst
  2. Musterkonsistenz: Veteranen folgen zwei Vorlagen: hochgradig handlungsorientierte Struktur oder Zustands-Handlungs-Wechselstruktur
  3. Automatisierungseffektivität: Sprachmodell erreicht 100% Genauigkeit auf Standard-Testset

Verwandte Arbeiten

Analyse der systemisch-funktionalen Linguistik

  • Frühe regelbasierte Methoden: Begrenzte Abdeckung, domänenempfindlich
  • Graphenbasierte Pipelines: Umwandlung von Abhängigkeitsbäumen in SFL-Netzwerke
  • Überwachte Methoden: Erfordern Expertenmarkierungsdaten
  • Innovation dieses Papiers: Few-Shot-Sprachmodell-Ansatz ohne manuelle Grammatiken oder Verbwörterbücher

Computergestützte Analyse von Traumerzählungen

  • Traditionelle Methoden: Wörterbuchbasierte manuelle Kodierungssysteme
  • Distributive Methoden: Semantische Raum-Embeddings und Topic-Clustering
  • Hybride Systeme: Wörterbuch-Scoring + Klassifizierer
  • Sprachmodell-Methoden: Sentimentanalyse und Zeichenvorhersage
  • Unterschied dieses Papiers: Fokus auf „wie gesagt" statt „was gesagt"

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Theoretischer Beitrag: Erfolgreiche Formalisierung von Stil als Sequenzmuster sprachlicher Wahlmöglichkeiten basierend auf systemisch-funktionaler Linguistik
  2. Methodische Effektivität: Automatisierter Rahmen kann psychologisch bedeutsame Muster offenbaren
  3. Anwendungspotenzial: Unterstützung von Narrativ-Neukonstruktion und gezielten Interventionen in therapeutischen Umgebungen

Einschränkungen

  1. Fehler bei automatisierter Extraktion: Sprachmodelle können Prozesse oder Partizipanten fehlklassifizieren, was die Zuverlässigkeit von Mustern beeinflusst
  2. Psychologische Interpretation: Die Verknüpfung zwischen sprachlichen Wahlmöglichkeiten und psychischem Zustand bleibt korrelativ und deskriptiv; klinische Bewertungsvalidierung erforderlich
  3. Merkmalsbereich: Gegenwärtig konzentriert sich nur auf Prozesstypen; zukünftig erforderlich Erweiterung auf feinkörnigere sprachliche Merkmale

Zukünftige Richtungen

  1. Autorenprofiling: Autorenmerkmalsinferenz basierend auf Mustern subjektiver Erfahrung
  2. Stilbedingte Generierung: Narrativ-Generierung aus Wahlsequenzen zur Unterstützung therapeutischer Interventionen
  3. Komplexitätswissenschaftliche Methoden: Anwendung von Lempel-Ziv-Komplexität und ähnlichen Metriken zur Quantifizierung von Sequenzredundanz
  4. Klinische Validierung: Kombination mit klinischen Bewertungen zur Validierung psychologischer Interpretationen

Tiefgreifende Bewertung

Stärken

  1. Interdisziplinäre Innovation: Erfolgreiche Integration von funktionaler Linguistik, Informatik und Psychologie
  2. Methodische Fortgeschrittenheit: Erster Einsatz großer Sprachmodelle zur Automatisierung der SFL-Analyse
  3. Praktischer Wert: Bereitstellung operativer Werkzeuge für therapeutische Anwendungen
  4. Theoretische Strenge: Basierend auf etablierter systemisch-funktionaler Linguistik-Theorie
  5. Skalierbarkeit: Rahmen adaptierbar auf verschiedene sprachliche Merkmale und Anwendungsszenarien

Mängel

  1. Begrenzte Validierung: Validierung nur auf 50 Standard-Stichproben, größere Expertenmarkierungsvalidierung erforderlich
  2. Psychologische Verknüpfung: Mangel an direkter Validierung mit klinischen Diagnosen
  3. Sprachliche Abdeckung: Nur englische Traumerzählungen getestet, sprachübergreifende Anwendbarkeit unbekannt
  4. Merkmalsvereinfachung: Gegenwärtige Analyse relativ einfach, nutzt nicht vollständig die Reichhaltigkeit der SFL

Auswirkungen

  1. Akademischer Beitrag: Neues Forschungsparadigma für das Schnittstellenfeld von Computerlinguistik und Psychologie
  2. Anwendungsaussichten: Breite Anwendungsperspektiven in digitaler Therapie, Autorschaftsanalyse, Stilgenerierung und anderen Bereichen
  3. Reproduzierbarkeit: Autoren stellen vollständige Prompts, Hyperparameter und extrahierte Sequenzen zur Verfügung, unterstützen Forschungsreproduzierbarkeit

Anwendungsszenarien

  1. Klinische Psychologie: Unterstützung von Therapeuten bei der Analyse von Patientenerzählungsmustern
  2. Forensische Linguistik: Autorschaftsidentifikation und Merkmalsanalyse
  3. Literaturwissenschaft: Quantitative Analyse von Schriftstellerstil
  4. Digitale Gesundheit: Psychische Gesundheitsüberwachung persönlicher Tagebücher und Narrative
  5. Bildungsanwendungen: Schreibstil-Anleitung und personalisiertes Feedback

Literaturverzeichnis

Das Papier zitiert umfangreiche interdisziplinäre Literatur, einschließlich:

  • Halliday et al. (2014): Theoretische Grundlagen der systemisch-funktionalen Linguistik
  • Tellier und Finkel (1995): Frühe Arbeiten zur Formalisierung von Sprachstil
  • Banks (2019): SFL-Praxisanleitung
  • Domhoff und Schneider (2008): Methoden zur quantitativen Traumanalyse
  • Sowie umfangreiche Literatur aus Computerlinguistik, Psychologie und Kognitionswissenschaft

Dieses Papier zeigt hervorragende Leistungen in theoretischer Innovation, methodischer Fortgeschrittenheit und Anwendungsperspektiven und eröffnet neue Forschungsrichtungen für die computergestützte Analyse persönlicher Narrative mit wichtigem akademischem Wert und praktischer Bedeutung.