2025-11-21T15:34:16.184333

Formalizing Style in Personal Narratives

Cortal, Finkel

Personal narratives are stories authors construct to make meaning of their experiences. Style, the distinctive way authors use language to express themselves, is fundamental to how these narratives convey subjective experiences. Yet there is a lack of a formal framework for systematically analyzing these stylistic choices. We present a novel approach that formalizes style in personal narratives as patterns in the linguistic choices authors make when communicating subjective experiences. Our framework integrates three domains: functional linguistics establishes language as a system of meaningful choices, computer science provides methods for automatically extracting and analyzing sequential patterns, and these patterns are linked to psychological observations. Using language models, we automatically extract linguistic features such as processes, participants, and circumstances. We apply our framework to hundreds of dream narratives, including a case study on a war veteran with post-traumatic stress disorder. Analysis of his narratives uncovers distinctive patterns, particularly how verbal processes dominate over mental ones, illustrating the relationship between linguistic choices and psychological states.

academic

個人叙述におけるスタイルの形式化

基本情報

論文ID: 2510.08649
タイトル: Formalizing Style in Personal Narratives（個人叙述におけるスタイルの形式化）
著者: Gustave Cortal, Alain Finkel（パリ・サクレー大学、CNRS）
分類: cs.CL（計算言語学）、cs.AI
発表日時: 2025年10月13日（arXiv v2）
論文リンク: https://arxiv.org/abs/2510.08649

要旨

個人叙述は、著者が自らの経験を理解するために構築する物語である。スタイル、すなわち著者が言語を使用して自分自身を表現する独特な方法は、これらの叙述が主観的経験を伝える基盤となっている。しかし、これらのスタイル選択を体系的に分析するための正式な枠組みが欠けている。本論文は、個人叙述におけるスタイルを、著者が主観的経験を伝える際に行う言語選択パターンとして形式化する新規なアプローチを提案する。本枠組みは3つの領域を統合している：機能言語学は言語を意味のある選択のシステムとして確立し、計算機科学は自動抽出と配列パターンの分析方法を提供し、これらは心理学的観察と関連付けられている。言語モデルを使用して、プロセス、参与者、環境などの言語特徴を自動抽出する。本枠組みを数百の夢物語叙述に適用し、心的外傷後ストレス障害（PTSD）を患う退役軍人のケーススタディを含む。その叙述の分析は独特なパターンを明らかにし、特に言語プロセスがいかに心理プロセスを支配するかを示し、言語選択と心理状態の間の関係を説明している。

研究背景と動機

問題定義

中核的問題：個人叙述におけるスタイル選択を体系的に分析するための正式な枠組みが欠けている。既存の文体論と文体計量学の研究は豊富であるが、個人の思考パターンが言語形式にいかに体現されるかを捉えるための操作的ツールが不足している。
問題の重要性：
- 個人叙述は、人間が世界を理解し、アイデンティティを形成する重要な方法である
- 治療環境では、叙述の再構成が回復を促進でき、形式化された枠組みは心理状態に関連する言語パターンをより正確に識別できる
- 標的化された介入と治療応用をサポートする
既存方法の限界：
- 従来の定性的枠組み（フッサール現象学、アダマール認知プロセス分析など）は豊かな記述を提供するが、スタイルが言語形式にいかに体現されるかを捉えるための操作的ツールを提供しない
- 既存のシステム機能言語学パーサーは「実験的で、領域に敏感で、適応に労働集約的である」
- 自動化された大規模分析方法が欠けている
研究動機：Tellier and Finkel（1995）の研究に基づき、言語スタイルを意図を表現する語彙および統語パターンとして定義し、個人叙述がいかに主観的経験を伝えるかを分析するための配列ベースの枠組みを開発する。

中核的貢献

理論的貢献：システム機能言語学に基づく配列枠組みを提案し、スタイルを言語選択配列のパターンとして定義する
方法論的革新：配列分析を使用してパターンを自動識別する方法論を開発する
実証的研究：夢物語叙述のケーススタディを通じて、パターン分析がいかに心理学的洞察を明らかにし、治療応用をサポートするかを実証する
技術実装：システム機能言語学分析を自動化するための大規模言語モデルの初めての試み

行為プロセス（Action）：物理世界における行為と事象
心理プロセス（Mental）：思考、知覚、感情などの内的経験
言語プロセス（Verbal）：コミュニケーション行為
状態プロセス（State）：存在、所有、または状態

参与者（Participants）：名詞句を通じて実現される 環境（Circumstances）：副詞句または前置詞句を通じて実現される

2. 配列表現枠組み

各言語特徴システムを有限集合Σ（アルファベット）として表現する：

Σprocess = {action, mental, verbal, state}

複数のアルファベットをデカルト積で組み合わせる：

Σ = Σprocess × Σtense × Σaspect

3. 配列分析方法

部分文字列分析：連続シンボルブロックの反復パターンを識別する 部分配列分析：相対的順序を保持するが連続性を要求しないパターンを識別する

類似度メトリクス：コサイン類似度を使用

cos(s1, s2) = (Σi xiyi) / (√(Σi xi²) × √(Σi yi²))

クラスタリング方法：階層的凝集クラスタリング（Ward連結）

技術的革新点

自動抽出：Llama 3.1 8B命令調整モデルを使用し、文脈内学習を通じて言語特徴を抽出。手作りルールと専門家注釈を回避する
配列化表現：叙述をシンボル配列にマッピングし、計算生物学に着想を得たパターン分析をサポートする
多スケール分析：単一シンボルから複雑な部分文字列への多層的パターン認識
心理学的関連付け：言語パターンと心理状態の関連付け

実験設定

データセット

DreamBankコーパス：

米国で収集された数千の夢物語叙述
5つのシリーズを分析：blind（長期失明の夢見者、n=361）、ed（未亡人、n=139）、izzy（青少年、n=1091）、merri（芸術家、n=202）、viet（ベトナム戦争退役軍人、PTSD、n=566）
ベンチマーク構築：各シリーズから無作為に10個の叙述を抽出。合計720個の夢物語叙述

評価指標

オッズ比（Odds Ratio）：異なるシリーズ間での特定の部分文字列の出現相対可能性を測定
Fisherの正確検定（Holm-Bonferroni補正）：統計的有意性検定
シルエット係数（Silhouette Score）：クラスタリング品質評価
コサイン類似度：配列類似性メトリクス

比較方法

ベンチマーク（norm）との比較分析
異なるシリーズ間のパターン比較

実装詳細

モデル：Llama 3.1 8B Instruct
ハードウェア：Tesla V100 32GB、80時間の実行
前処理：SpaCy文分割、言語モデル文分割
検証：50個のゴールドスタンダード文の定量的検証。予測精度100%

言語プロセスはベンチマークより40%高い（OR=1.4、p<0.05）
心理プロセスはベンチマークより40%低い（OR=0.6、p<0.05）
連続言語プロセスパターンが顕著：verbal.verbal（OR=2.00）、verbal.verbal.verbal（OR=1.75）

クラスタリング分析：

最適クラスタリング：2つのクラスタ、シルエット係数が最大
クラスタ1代表配列：高度に行為指向（行為プロセス23回、心理プロセス2回）。274個の配列をカバー
クラスタ2代表配列：行為-状態バランス（行為プロセス13回、状態プロセス16回、心理プロセス4回）。179個の配列をカバー

ケース分析

配列変換例：

"I wake in a dark room. I feel a cold wind. I tell myself to move."
→ 節分析 → 特徴抽出 → 配列：amv
→ 部分文字列：{am, mv}

実験的発見

心理状態の関連付け：vietは主に行為と言語を通じて経験を構築し、心理プロセスではなく。これは外傷が認知と感情処理にいかに影響するかに関連する可能性がある
パターン一貫性：退役軍人は2つのテンプレートに従う：高度に行為指向の構造または状態-行為交替構造
自動化の有効性：言語モデルは標準テストセットで100%の精度を達成