Personal narratives are stories authors construct to make meaning of their experiences. Style, the distinctive way authors use language to express themselves, is fundamental to how these narratives convey subjective experiences. Yet there is a lack of a formal framework for systematically analyzing these stylistic choices. We present a novel approach that formalizes style in personal narratives as patterns in the linguistic choices authors make when communicating subjective experiences. Our framework integrates three domains: functional linguistics establishes language as a system of meaningful choices, computer science provides methods for automatically extracting and analyzing sequential patterns, and these patterns are linked to psychological observations. Using language models, we automatically extract linguistic features such as processes, participants, and circumstances. We apply our framework to hundreds of dream narratives, including a case study on a war veteran with post-traumatic stress disorder. Analysis of his narratives uncovers distinctive patterns, particularly how verbal processes dominate over mental ones, illustrating the relationship between linguistic choices and psychological states.
Личные нарративы — это истории, которые авторы конструируют для понимания своего опыта. Стиль, то есть уникальный способ, которым автор использует язык для самовыражения, является основой передачи субъективного опыта в этих нарративах. Однако отсутствует систематическая формальная база для анализа этих стилистических выборов. В данной статье предлагается новый подход к формализации стиля в личных нарративах как совокупности языковых выборов, которые авторы делают при передаче субъективного опыта. Предложенная структура интегрирует три области: функциональная лингвистика устанавливает язык как систему осмысленных выборов, компьютерная наука предоставляет методы автоматического извлечения и анализа паттернов последовательностей, которые связаны с психологическими наблюдениями. С использованием языковых моделей автоматически извлекаются языковые признаки, такие как процессы, участники и обстоятельства. Структура применяется к сотням нарративов о снах, включая тематическое исследование ветерана войны во Вьетнаме с посттравматическим стрессовым расстройством. Анализ его нарративов выявляет уникальные паттерны, особенно то, как речевые процессы доминируют над психическими процессами, что иллюстрирует связь между языковыми выборами и психическим состоянием.
Основная проблема: Отсутствие систематической формальной базы для анализа стилистических выборов в личных нарративах. Хотя существующие исследования в области стилометрии и стилистики обширны, им не хватает операциональных инструментов для захвата проявления личных мыслительных паттернов в языковых формах.
Значимость проблемы:
Личные нарративы — это важный способ, которым люди понимают мир и формируют свою идентичность
В терапевтической среде реконструкция нарративов может способствовать восстановлению, а формализованная структура позволяет более точно выявлять языковые паттерны, связанные с психическим состоянием
Поддержка целевых вмешательств и терапевтических приложений
Ограничения существующих подходов:
Традиционные качественные структуры (такие как феноменология Гуссерля, анализ когнитивных процессов Адамара), хотя и богаты описанием, не предоставляют операциональных инструментов для захвата проявления стиля в языковых формах
Существующие парсеры системной функциональной лингвистики «экспериментальны, чувствительны к предметной области и требуют трудоёмкой адаптации»
Отсутствие автоматизированных методов крупномасштабного анализа
Исследовательская мотивация: На основе работы Tellier и Finkel (1995), которые определяют языковой стиль как лексические и синтаксические паттерны выражения намерения, разработать последовательностную структуру для анализа того, как личные нарративы передают субъективный опыт.
Теоретический вклад: Предложена последовательностная структура на основе системной функциональной лингвистики, определяющая стиль как паттерны в последовательностях языковых выборов
Методологическое инновация: Разработана методология для автоматического выявления паттернов с использованием анализа последовательностей
Эмпирическое исследование: Демонстрация того, как анализ паттернов через тематическое исследование нарративов о снах выявляет психологические инсайты и поддерживает терапевтические приложения
Техническая реализация: Первая попытка использования больших языковых моделей для автоматизации анализа системной функциональной лингвистики
Входные данные: Текст личного нарратива
Выходные данные: Последовательностные паттерны языковых выборов, выявляющие стилистические характеристики того, как автор кодирует субъективный опыт
Ограничения: На основе системы переходности системной функциональной лингвистики (процессы, участники, обстоятельства)
Анализ подстрок: Выявление повторяющихся паттернов непрерывных блоков символов
Анализ подпоследовательностей: Выявление паттернов, сохраняющих относительный порядок, но не требующих непрерывности
Метрика сходства: Использование косинусного сходства
cos(s1, s2) = (Σi xiyi) / (√(Σi xi²) × √(Σi yi²))
Метод кластеризации: Иерархическая агломеративная кластеризация (связь Уорда)
Автоматизированное извлечение: Использование модели Llama 3.1 8B с инструкциями, извлечение языковых признаков через контекстное обучение, избегая ручных правил и экспертной аннотации
Представление в виде последовательностей: Отображение нарративов в символические последовательности, поддерживающие анализ паттернов, вдохновленный вычислительной биологией
Многомасштабный анализ: Многоуровневое выявление паттернов от отдельных символов до сложных подстрок
Психологическая связь: Установление связи между языковыми паттернами и психическим состоянием
Анализ пяти серий: blind (люди с длительной слепотой, n=361), ed (вдовцы, n=139), izzy (подростки, n=1091), merri (художники, n=202), viet (ветераны войны во Вьетнаме с ПТСР, n=566)
Построение эталона: случайная выборка 10 нарративов из каждой серии, всего 720 нарративов о снах
Оптимальная кластеризация: 2 кластера с максимальным коэффициентом силуэта
Репрезентативная последовательность кластера 1: Высокая ориентация на действие (действие 23 раза, психический процесс 2 раза), охватывает 274 последовательности
Репрезентативная последовательность кластера 2: Баланс действия и состояния (действие 13 раз, состояние 16 раз, психический процесс 4 раза), охватывает 179 последовательностей
"I wake in a dark room. I feel a cold wind. I tell myself to move."
→ Анализ предложений → Извлечение признаков → Последовательность: amv
→ Подстроки: {am, mv}
Связь с психическим состоянием: Серия viet конструирует опыт в основном через действие и речь, а не через психические процессы, что может быть связано с тем, как травма влияет на когнитивную и эмоциональную обработку
Согласованность паттернов: Ветераны следуют двум шаблонам: структуре с высокой ориентацией на действие или чередованию состояния и действия
Эффективность автоматизации: Языковая модель достигает 100% точности на стандартном тестовом наборе
Ошибки автоматизированного извлечения: Языковая модель может неправильно классифицировать процессы или участников, влияя на надёжность паттернов
Психологическая интерпретация: Связь между языковыми выборами и психическим состоянием остаётся корреляционной и описательной, требуя клинической валидации
Диапазон признаков: Текущий анализ сосредоточен только на типах процессов, будущие работы должны расширить охват более детальными языковыми признаками
Статья цитирует обширную междисциплинарную литературу, включая:
Halliday et al. (2014): Теоретическая основа системной функциональной лингвистики
Tellier and Finkel (1995): Ранние работы по формализации языкового стиля
Banks (2019): Практическое руководство по SFL
Domhoff and Schneider (2008): Методы количественного анализа снов
А также обширную литературу по вычислительной лингвистике, психологии и когнитивной науке
Данная статья демонстрирует превосходные результаты в теоретических инновациях, методологической передовости и перспективах приложений, открывая новые направления исследований в области вычислительного анализа личных нарративов и обладает значительной академической ценностью и практической значимостью.