Personal narratives are stories authors construct to make meaning of their experiences. Style, the distinctive way authors use language to express themselves, is fundamental to how these narratives convey subjective experiences. Yet there is a lack of a formal framework for systematically analyzing these stylistic choices. We present a novel approach that formalizes style in personal narratives as patterns in the linguistic choices authors make when communicating subjective experiences. Our framework integrates three domains: functional linguistics establishes language as a system of meaningful choices, computer science provides methods for automatically extracting and analyzing sequential patterns, and these patterns are linked to psychological observations. Using language models, we automatically extract linguistic features such as processes, participants, and circumstances. We apply our framework to hundreds of dream narratives, including a case study on a war veteran with post-traumatic stress disorder. Analysis of his narratives uncovers distinctive patterns, particularly how verbal processes dominate over mental ones, illustrating the relationship between linguistic choices and psychological states.
Les récits personnels sont des histoires construites par les auteurs pour comprendre leurs expériences. Le style, c'est-à-dire la manière unique dont l'auteur utilise le langage pour s'exprimer, constitue le fondement de la transmission des expériences subjectives dans ces récits. Cependant, il existe une absence de cadre formel systématique pour analyser ces choix stylistiques. Cet article propose une approche novatrice qui formalise le style dans les récits personnels comme des modèles de choix linguistiques effectués par l'auteur lors de la transmission d'expériences subjectives. Le cadre intègre trois domaines : la linguistique fonctionnelle établit le langage comme un système de choix significatifs, l'informatique fournit des méthodes pour l'extraction et l'analyse automatiques de modèles de séquences, lesquels sont associés à des observations psychologiques. Utilisant des modèles de langage, le processus d'extraction automatique identifie des caractéristiques linguistiques telles que les processus, les participants et les circonstances. Le cadre est appliqué à des centaines de récits de rêves, incluant une étude de cas d'un vétéran souffrant de trouble de stress post-traumatique. L'analyse de ses récits révèle des modèles uniques, notamment comment les processus verbaux dominent les processus mentaux, illustrant la relation entre les choix linguistiques et l'état psychologique.
Problème central : Absence de cadre formel systématique pour analyser les choix stylistiques dans les récits personnels. Bien que la recherche en stylistique et stylométrie soit riche, elle manque d'outils opérationnels pour capturer la manifestation des modèles de pensée personnels dans les formes linguistiques.
Importance du problème :
Les récits personnels constituent un moyen important pour les humains de comprendre le monde et de façonner leur identité
Dans les environnements thérapeutiques, la reconstruction narrative peut faciliter la guérison, et un cadre formalisé permet d'identifier plus précisément les modèles linguistiques associés aux états psychologiques
Soutient les interventions ciblées et les applications thérapeutiques
Limitations des approches existantes :
Les cadres qualitatifs traditionnels (tels que la phénoménologie husserlienne, l'analyse des processus cognitifs d'Hadamard) offrent une description riche mais ne fournissent pas d'outils opérationnels pour capturer la manifestation du style dans les formes linguistiques
Les analyseurs existants de linguistique fonctionnelle systémique sont « expérimentaux, sensibles au domaine et exigent un travail d'adaptation intensif »
Absence de méthodes d'analyse automatisées à grande échelle
Motivation de la recherche : S'appuyant sur les travaux de Tellier et Finkel (1995), qui définissent le style linguistique comme des modèles lexicaux et syntaxiques d'expression d'intentions, développer un cadre basé sur les séquences pour analyser comment les récits personnels transmettent les expériences subjectives.
Contribution théorique : Proposition d'un cadre séquentiel basé sur la linguistique fonctionnelle systémique, définissant le style comme des modèles dans les séquences de choix linguistiques
Innovation méthodologique : Développement d'une méthodologie utilisant l'analyse de séquences pour identifier automatiquement les modèles
Recherche empirique : Démonstration par étude de cas de récits de rêves comment l'analyse de modèles révèle des perspectives psychologiques et soutient les applications thérapeutiques
Implémentation technique : Première tentative d'utilisation de grands modèles de langage pour automatiser l'analyse de la linguistique fonctionnelle systémique
Entrée : Texte de récit personnel
Sortie : Modèles de séquences de choix linguistiques, révélant les caractéristiques stylistiques de la manière dont l'auteur encode les expériences subjectives
Contraintes : Basées sur le système de transitivité de la linguistique fonctionnelle systémique (processus, participants, circonstances)
Basé sur la linguistique fonctionnelle systémique de Halliday, en particulier le système de transitivité :
Types de processus (Processes) :
Processus d'action (Action) : Actions et événements dans le monde physique
Processus mentaux (Mental) : Expériences internes telles que pensées, perceptions et émotions
Processus verbaux (Verbal) : Comportements de communication
Processus d'état (State) : Existence, possession ou états
Participants (Participants) : Réalisés par des syntagmes nominaux
Circonstances (Circumstances) : Réalisées par des groupes adverbiaux ou des syntagmes prépositionnels
Analyse de sous-chaînes : Identification de modèles répétés de blocs de symboles consécutifs
Analyse de sous-séquences : Identification de modèles maintenant l'ordre relatif mais ne nécessitant pas la contiguïté
Mesure de similarité : Utilisation de la similarité cosinus
cos(s1, s2) = (Σi xiyi) / (√(Σi xi²) × √(Σi yi²))
Méthode de clustering : Clustering hiérarchique agglomératif (liaison de Ward)
Extraction automatisée : Utilisation du modèle Llama 3.1 8B à instruction fine, extraction de caractéristiques linguistiques par apprentissage en contexte, évitant les règles manuelles et l'annotation d'experts
Représentation séquentialisée : Mappage des récits en séquences de symboles, soutenant l'analyse de modèles inspirée par la biologie computationnelle
Analyse multi-échelle : Reconnaissance de modèles à plusieurs niveaux, des symboles individuels aux sous-chaînes complexes
Association psychologique : Établissement de liens entre les modèles linguistiques et les états psychologiques
Des milliers de récits de rêves collectés aux États-Unis
Analyse de cinq séries : blind (rêveurs aveugles de longue durée, n=361), ed (veuf, n=139), izzy (adolescent, n=1091), merri (artiste, n=202), viet (vétéran de la Guerre du Vietnam, PTSD, n=566)
Construction de l'ensemble de référence : échantillonnage aléatoire de 10 récits par série, total de 720 récits de rêves
"I wake in a dark room. I feel a cold wind. I tell myself to move."
→ Analyse de clauses → Extraction de caractéristiques → Séquence : amv
→ Sous-chaînes : {am, mv}
Association à l'état psychologique : Les viet construisent principalement l'expérience par l'action et la parole plutôt que par les processus mentaux, ce qui pourrait être lié à la manière dont le trauma affecte le traitement cognitif et émotionnel
Cohérence des modèles : Les vétérans suivent deux modèles : structure hautement orientée vers l'action ou alternance état-action
Validité de l'automatisation : Le modèle de langage atteint une précision de 100% sur l'ensemble de test standard
Contribution théorique : Formalisation réussie du style comme modèles de séquences de choix linguistiques basés sur la linguistique fonctionnelle systémique
Efficacité méthodologique : Le cadre automatisé peut révéler des modèles ayant une signification psychologique
Potentiel d'application : Soutien de la reconstruction narrative et des interventions ciblées dans les environnements thérapeutiques
Erreurs d'extraction automatisée : Les modèles de langage peuvent mal classer les processus ou les participants, affectant la fiabilité des modèles
Interprétation psychologique : L'association entre les choix linguistiques et l'état psychologique reste corrélative et descriptive, nécessitant une validation par évaluation clinique
Portée des caractéristiques : L'analyse actuelle se concentre uniquement sur les types de processus, nécessitant une extension future à des caractéristiques linguistiques plus granulaires
Contribution académique : Fourniture d'un nouveau paradigme de recherche pour le domaine interdisciplinaire de la linguistique computationnelle et de la psychologie
Perspectives d'application : Larges perspectives d'application dans la thérapie numérique, l'analyse d'auteur, la génération de style, etc.
Reproductibilité : Les auteurs fournissent les invites complètes, hyperparamètres et séquences extraites, soutenant la reproduction de la recherche
L'article cite une riche littérature interdisciplinaire, incluant :
Halliday et al. (2014) : Fondements théoriques de la linguistique fonctionnelle systémique
Tellier et Finkel (1995) : Travaux précoces sur la formalisation du style linguistique
Banks (2019) : Guide pratique de SFL
Domhoff et Schneider (2008) : Méthodes d'analyse quantitative des rêves
Ainsi qu'une abondante littérature connexe en linguistique computationnelle, psychologie et sciences cognitives
Cet article démontre une excellence en innovation théorique, avancée méthodologique et perspectives d'application, ouvrant une nouvelle direction de recherche pour l'analyse computationnelle des récits personnels, avec une valeur académique et pratique importante.