2025-11-21T15:34:16.184333

Formalizing Style in Personal Narratives

Cortal, Finkel
Personal narratives are stories authors construct to make meaning of their experiences. Style, the distinctive way authors use language to express themselves, is fundamental to how these narratives convey subjective experiences. Yet there is a lack of a formal framework for systematically analyzing these stylistic choices. We present a novel approach that formalizes style in personal narratives as patterns in the linguistic choices authors make when communicating subjective experiences. Our framework integrates three domains: functional linguistics establishes language as a system of meaningful choices, computer science provides methods for automatically extracting and analyzing sequential patterns, and these patterns are linked to psychological observations. Using language models, we automatically extract linguistic features such as processes, participants, and circumstances. We apply our framework to hundreds of dream narratives, including a case study on a war veteran with post-traumatic stress disorder. Analysis of his narratives uncovers distinctive patterns, particularly how verbal processes dominate over mental ones, illustrating the relationship between linguistic choices and psychological states.
academic

個人叙述におけるスタイルの形式化

基本情報

  • 論文ID: 2510.08649
  • タイトル: Formalizing Style in Personal Narratives(個人叙述におけるスタイルの形式化)
  • 著者: Gustave Cortal, Alain Finkel(パリ・サクレー大学、CNRS)
  • 分類: cs.CL(計算言語学)、cs.AI
  • 発表日時: 2025年10月13日(arXiv v2)
  • 論文リンク: https://arxiv.org/abs/2510.08649

要旨

個人叙述は、著者が自らの経験を理解するために構築する物語である。スタイル、すなわち著者が言語を使用して自分自身を表現する独特な方法は、これらの叙述が主観的経験を伝える基盤となっている。しかし、これらのスタイル選択を体系的に分析するための正式な枠組みが欠けている。本論文は、個人叙述におけるスタイルを、著者が主観的経験を伝える際に行う言語選択パターンとして形式化する新規なアプローチを提案する。本枠組みは3つの領域を統合している:機能言語学は言語を意味のある選択のシステムとして確立し、計算機科学は自動抽出と配列パターンの分析方法を提供し、これらは心理学的観察と関連付けられている。言語モデルを使用して、プロセス、参与者、環境などの言語特徴を自動抽出する。本枠組みを数百の夢物語叙述に適用し、心的外傷後ストレス障害(PTSD)を患う退役軍人のケーススタディを含む。その叙述の分析は独特なパターンを明らかにし、特に言語プロセスがいかに心理プロセスを支配するかを示し、言語選択と心理状態の間の関係を説明している。

研究背景と動機

問題定義

  1. 中核的問題:個人叙述におけるスタイル選択を体系的に分析するための正式な枠組みが欠けている。既存の文体論と文体計量学の研究は豊富であるが、個人の思考パターンが言語形式にいかに体現されるかを捉えるための操作的ツールが不足している。
  2. 問題の重要性
    • 個人叙述は、人間が世界を理解し、アイデンティティを形成する重要な方法である
    • 治療環境では、叙述の再構成が回復を促進でき、形式化された枠組みは心理状態に関連する言語パターンをより正確に識別できる
    • 標的化された介入と治療応用をサポートする
  3. 既存方法の限界
    • 従来の定性的枠組み(フッサール現象学、アダマール認知プロセス分析など)は豊かな記述を提供するが、スタイルが言語形式にいかに体現されるかを捉えるための操作的ツールを提供しない
    • 既存のシステム機能言語学パーサーは「実験的で、領域に敏感で、適応に労働集約的である」
    • 自動化された大規模分析方法が欠けている
  4. 研究動機:Tellier and Finkel(1995)の研究に基づき、言語スタイルを意図を表現する語彙および統語パターンとして定義し、個人叙述がいかに主観的経験を伝えるかを分析するための配列ベースの枠組みを開発する。

中核的貢献

  1. 理論的貢献:システム機能言語学に基づく配列枠組みを提案し、スタイルを言語選択配列のパターンとして定義する
  2. 方法論的革新:配列分析を使用してパターンを自動識別する方法論を開発する
  3. 実証的研究:夢物語叙述のケーススタディを通じて、パターン分析がいかに心理学的洞察を明らかにし、治療応用をサポートするかを実証する
  4. 技術実装:システム機能言語学分析を自動化するための大規模言語モデルの初めての試み

方法の詳細

タスク定義

入力:個人叙述テキスト 出力:言語選択の配列パターン。著者が主観的経験をコード化するスタイル特性を明らかにする 制約:システム機能言語学の及物性システム(プロセス、参与者、環境)に基づく

モデルアーキテクチャ

1. 言語特徴分類システム

Hallidayのシステム機能言語学に基づき、特に及物性システム:

プロセスタイプ(Processes)

  • 行為プロセス(Action):物理世界における行為と事象
  • 心理プロセス(Mental):思考、知覚、感情などの内的経験
  • 言語プロセス(Verbal):コミュニケーション行為
  • 状態プロセス(State):存在、所有、または状態

参与者(Participants):名詞句を通じて実現される 環境(Circumstances):副詞句または前置詞句を通じて実現される

2. 配列表現枠組み

各言語特徴システムを有限集合Σ(アルファベット)として表現する:

Σprocess = {action, mental, verbal, state}

複数のアルファベットをデカルト積で組み合わせる:

Σ = Σprocess × Σtense × Σaspect

3. 配列分析方法

部分文字列分析:連続シンボルブロックの反復パターンを識別する 部分配列分析:相対的順序を保持するが連続性を要求しないパターンを識別する

類似度メトリクス:コサイン類似度を使用

cos(s1, s2) = (Σi xiyi) / (√(Σi xi²) × √(Σi yi²))

クラスタリング方法:階層的凝集クラスタリング(Ward連結)

技術的革新点

  1. 自動抽出:Llama 3.1 8B命令調整モデルを使用し、文脈内学習を通じて言語特徴を抽出。手作りルールと専門家注釈を回避する
  2. 配列化表現:叙述をシンボル配列にマッピングし、計算生物学に着想を得たパターン分析をサポートする
  3. 多スケール分析:単一シンボルから複雑な部分文字列への多層的パターン認識
  4. 心理学的関連付け:言語パターンと心理状態の関連付け

実験設定

データセット

DreamBankコーパス

  • 米国で収集された数千の夢物語叙述
  • 5つのシリーズを分析:blind(長期失明の夢見者、n=361)、ed(未亡人、n=139)、izzy(青少年、n=1091)、merri(芸術家、n=202)、viet(ベトナム戦争退役軍人、PTSD、n=566)
  • ベンチマーク構築:各シリーズから無作為に10個の叙述を抽出。合計720個の夢物語叙述

評価指標

  • オッズ比(Odds Ratio):異なるシリーズ間での特定の部分文字列の出現相対可能性を測定
  • Fisherの正確検定(Holm-Bonferroni補正):統計的有意性検定
  • シルエット係数(Silhouette Score):クラスタリング品質評価
  • コサイン類似度:配列類似性メトリクス

比較方法

  • ベンチマーク(norm)との比較分析
  • 異なるシリーズ間のパターン比較

実装詳細

  • モデル:Llama 3.1 8B Instruct
  • ハードウェア:Tesla V100 32GB、80時間の実行
  • 前処理:SpaCy文分割、言語モデル文分割
  • 検証:50個のゴールドスタンダード文の定量的検証。予測精度100%

実験結果

主要結果

ベトナム戦争退役軍人(viet)ケース分析:

部分文字列分布の発見

  • 言語プロセスはベンチマークより40%高い(OR=1.4、p<0.05)
  • 心理プロセスはベンチマークより40%低い(OR=0.6、p<0.05)
  • 連続言語プロセスパターンが顕著:verbal.verbal(OR=2.00)、verbal.verbal.verbal(OR=1.75)

クラスタリング分析

  • 最適クラスタリング:2つのクラスタ、シルエット係数が最大
  • クラスタ1代表配列:高度に行為指向(行為プロセス23回、心理プロセス2回)。274個の配列をカバー
  • クラスタ2代表配列:行為-状態バランス(行為プロセス13回、状態プロセス16回、心理プロセス4回)。179個の配列をカバー

ケース分析

配列変換例

"I wake in a dark room. I feel a cold wind. I tell myself to move."
→ 節分析 → 特徴抽出 → 配列:amv
→ 部分文字列:{am, mv}

実験的発見

  1. 心理状態の関連付け:vietは主に行為と言語を通じて経験を構築し、心理プロセスではなく。これは外傷が認知と感情処理にいかに影響するかに関連する可能性がある
  2. パターン一貫性:退役軍人は2つのテンプレートに従う:高度に行為指向の構造または状態-行為交替構造
  3. 自動化の有効性:言語モデルは標準テストセットで100%の精度を達成

関連研究

システム機能言語学解析

  • 初期ルールベース方法:カバレッジが限定的で領域に敏感
  • グラフベースパイプライン:依存木をSFLネットワークに変換
  • 教師あり方法:専門家注釈データが必要
  • 本論文の革新:少数ショット言語モデル方法。手作り文法または動詞辞書が不要

夢物語叙述の計算分析

  • 従来の方法:辞書ベースの手作り符号化システム
  • 分布的方法:意味空間埋め込みとトピッククラスタリング
  • ハイブリッドシステム:辞書スコアリング+分類器
  • 言語モデル方法:感情検出と文字予測
  • 本論文の相違点:「何を言うか」ではなく「どのように言うか」に焦点

結論と議論

主要な結論

  1. 理論的貢献:スタイルをシステム機能言語学に基づく言語選択配列パターンとして形式化することに成功した
  2. 方法の有効性:自動化枠組みは心理学的意義のあるパターンを明らかにできる
  3. 応用の可能性:治療環境での叙述再構成と標的化された介入をサポート

限界

  1. 自動抽出エラー:言語モデルはプロセスまたは参与者を誤分類する可能性があり、パターン信頼性に影響する
  2. 心理学的解釈:言語選択と心理状態の関連付けは依然として相関的で記述的であり、臨床評価による検証が必要
  3. 特徴範囲:現在はプロセスタイプのみに焦点を当てており、将来はより細粒度の言語特徴への拡張が必要

将来の方向性

  1. 著者プロファイリング:主観的経験パターンに基づく著者特性推論
  2. スタイル条件付き生成:選択配列から叙述を生成し、治療介入をサポート
  3. 複雑性科学方法:Lempel-Ziv複雑度などのメトリクスを適用して配列冗長性を定量化
  4. 臨床検証:臨床評価と組み合わせて心理学的解釈を検証

深層的評価

利点

  1. 学際的革新:機能言語学、計算機科学、心理学の統合に成功
  2. 方法の先進性:SFL分析を自動化するための大規模言語モデルの初めての使用
  3. 実用的価値:治療応用のための操作的ツールを提供
  4. 理論的厳密性:成熟したシステム機能言語学理論に基づく
  5. 拡張性:異なる言語特徴と応用シナリオに適応可能な枠組み

不足

  1. 検証の限定性:50個の標準サンプルでのみ検証。より大規模な専門家注釈検証が必要
  2. 心理学的関連付け:臨床診断との直接的検証が欠けている
  3. 言語カバレッジ:英語の夢物語叙述のみでテスト。言語間適用可能性は未知
  4. 特徴の単純化:現在の分析は相対的に単純で、SFLの豊かさを十分に活用していない

影響力

  1. 学術的貢献:計算言語学と心理学の交差領域に新しい研究パラダイムを提供
  2. 応用前景:デジタル治療、著者分析、スタイル生成などの領域で広範な応用前景を有する
  3. 再現性:著者は完全なプロンプト、ハイパーパラメータ、抽出配列を提供し、研究の再現をサポート

適用シーン

  1. 臨床心理学:治療士による患者叙述パターン分析の補助
  2. 法医言語学:著者身元識別と特性分析
  3. 文学研究:作家スタイルの定量分析
  4. デジタルヘルス:個人日記と叙述の心理健康モニタリング
  5. 教育応用:執筆スタイル指導と個別化フィードバック

参考文献

論文は豊富な学際的文献を引用しており、以下を含む:

  • Halliday et al.(2014):システム機能言語学理論の基礎
  • Tellier and Finkel(1995):言語スタイル形式化の初期研究
  • Banks(2019):SFL実践ガイド
  • Domhoff and Schneider(2008):夢物語の定量分析方法
  • および計算言語学、心理学、認知科学に関連する豊富な文献

本論文は、理論的革新、方法の先進性、応用前景の観点から優れた成果を示しており、個人叙述の計算分析のための新しい研究方向を切り開き、重要な学術的価値と実用的意義を有している。