2025-11-21T15:34:16.184333

Formalizing Style in Personal Narratives

Cortal, Finkel
Personal narratives are stories authors construct to make meaning of their experiences. Style, the distinctive way authors use language to express themselves, is fundamental to how these narratives convey subjective experiences. Yet there is a lack of a formal framework for systematically analyzing these stylistic choices. We present a novel approach that formalizes style in personal narratives as patterns in the linguistic choices authors make when communicating subjective experiences. Our framework integrates three domains: functional linguistics establishes language as a system of meaningful choices, computer science provides methods for automatically extracting and analyzing sequential patterns, and these patterns are linked to psychological observations. Using language models, we automatically extract linguistic features such as processes, participants, and circumstances. We apply our framework to hundreds of dream narratives, including a case study on a war veteran with post-traumatic stress disorder. Analysis of his narratives uncovers distinctive patterns, particularly how verbal processes dominate over mental ones, illustrating the relationship between linguistic choices and psychological states.
academic

व्यक्तिगत आख्यानों में शैली का औपचारिकीकरण

मूल जानकारी

  • पेपर ID: 2510.08649
  • शीर्षक: व्यक्तिगत आख्यानों में शैली का औपचारिकीकरण
  • लेखक: गुस्टेव कोर्टल, एलेन फिंकेल (विश्वविद्यालय पेरिस-सैक्ले, CNRS)
  • वर्गीकरण: cs.CL (कम्प्यूटेशनल भाषाविज्ञान), cs.AI
  • प्रकाशन समय: 13 अक्टूबर 2025 (arXiv v2)
  • पेपर लिंक: https://arxiv.org/abs/2510.08649

सारांश

व्यक्तिगत आख्यान वे कहानियाँ हैं जो लेखक अपने अनुभवों को समझने के लिए निर्मित करते हैं। शैली, अर्थात् लेखक द्वारा स्वयं को व्यक्त करने का अद्वितीय तरीका, इन आख्यानों के लिए व्यक्तिपरक अनुभवों को संप्रेषित करने का आधार है। हालांकि, इन शैली विकल्पों का व्यवस्थित विश्लेषण करने के लिए एक औपचारिक ढांचे की कमी है। यह पेपर एक नवीन दृष्टिकोण प्रस्तावित करता है जो व्यक्तिगत आख्यानों में शैली को व्यक्तिपरक अनुभवों को संप्रेषित करते समय लेखक द्वारा किए गए भाषाई विकल्पों के पैटर्न के रूप में औपचारिक बनाता है। यह ढांचा तीन क्षेत्रों को एकीकृत करता है: कार्यात्मक भाषाविज्ञान भाषा को अर्थपूर्ण विकल्पों की प्रणाली के रूप में स्थापित करता है, कंप्यूटर विज्ञान अनुक्रम पैटर्न को स्वचालित रूप से निकालने और विश्लेषण करने की विधियाँ प्रदान करता है, जो मनोविज्ञान अवलोकनों से संबंधित हैं। भाषा मॉडल का उपयोग करके, प्रक्रियाएं, प्रतिभागी और परिवेश जैसी भाषाई विशेषताओं को स्वचालित रूप से निकाला जाता है। ढांचे को सैकड़ों स्वप्न आख्यानों पर लागू किया जाता है, जिसमें एक आघात-पश्चात् तनाव विकार से पीड़ित दिग्गज का केस अध्ययन भी शामिल है। उसके आख्यान का विश्लेषण अद्वितीय पैटर्न को प्रकट करता है, विशेष रूप से यह कि कैसे मौखिक प्रक्रियाएं मानसिक प्रक्रियाओं पर हावी होती हैं, जो भाषाई विकल्पों और मानसिक स्थिति के बीच संबंध को दर्शाता है।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या परिभाषा

  1. मूल समस्या: व्यक्तिगत आख्यानों में शैली विकल्पों का व्यवस्थित विश्लेषण करने के लिए एक औपचारिक ढांचे की कमी। यद्यपि शैलीविज्ञान और शैली मापन अनुसंधान समृद्ध हैं, लेकिन व्यक्तिगत सोच पैटर्न को भाषाई रूपों में प्रकट करने के लिए परिचालन उपकरणों की कमी है।
  2. समस्या की महत्ता:
    • व्यक्तिगत आख्यान मानव द्वारा दुनिया को समझने और पहचान को आकार देने का एक महत्वपूर्ण तरीका है
    • चिकित्सा वातावरण में, आख्यान पुनर्निर्माण पुनरुद्धार को बढ़ावा दे सकता है, और औपचारिक ढांचा मानसिक स्थिति से संबंधित भाषाई पैटर्न को अधिक सटीकता से पहचान सकता है
    • लक्षित हस्तक्षेप और चिकित्सीय अनुप्रयोगों का समर्थन करता है
  3. मौजूदा विधियों की सीमाएं:
    • पारंपरिक गुणात्मक ढांचे (जैसे हुसर्ल घटना विज्ञान, अदामार्ड की संज्ञानात्मक प्रक्रिया विश्लेषण) यद्यपि विवरण में समृद्ध हैं, लेकिन शैली को भाषाई रूपों में प्रकट करने के लिए परिचालन उपकरण प्रदान नहीं करते हैं
    • मौजूदा प्रणालीगत कार्यात्मक भाषाविज्ञान पार्सर "प्रायोगिक, डोमेन-संवेदनशील और अनुकूलन श्रम-गहन" हैं
    • स्वचालित बड़े पैमाने पर विश्लेषण विधियों की कमी है
  4. अनुसंधान प्रेरणा: Tellier और Finkel (1995) के काम के आधार पर, भाषाई शैली को इरादे व्यक्त करने के शब्दावली और वाक्य रचना पैटर्न के रूप में परिभाषित करते हुए, व्यक्तिगत आख्यानों का विश्लेषण करने के लिए एक अनुक्रम-आधारित ढांचा विकसित करना कि कैसे वे व्यक्तिपरक अनुभवों को संप्रेषित करते हैं।

मुख्य योगदान

  1. सैद्धांतिक योगदान: प्रणालीगत कार्यात्मक भाषाविज्ञान पर आधारित एक अनुक्रम ढांचा प्रस्तावित करता है, जो शैली को भाषाई विकल्पों के अनुक्रम में पैटर्न के रूप में परिभाषित करता है
  2. विधि नवाचार: अनुक्रम विश्लेषण का उपयोग करके पैटर्न को स्वचालित रूप से पहचानने के लिए पद्धति विकसित करता है
  3. अनुभवजन्य अनुसंधान: स्वप्न आख्यान केस अध्ययन के माध्यम से प्रदर्शित करता है कि कैसे पैटर्न विश्लेषण मनोवैज्ञानिक अंतर्दृष्टि प्रकट करता है और चिकित्सीय अनुप्रयोगों का समर्थन करता है
  4. तकनीकी कार्यान्वयन: प्रणालीगत कार्यात्मक भाषाविज्ञान विश्लेषण को स्वचालित करने के लिए बड़े भाषा मॉडल का उपयोग करने का पहला प्रयास

विधि विवरण

कार्य परिभाषा

इनपुट: व्यक्तिगत आख्यान पाठ आउटपुट: भाषाई विकल्पों के अनुक्रम पैटर्न, जो लेखक द्वारा व्यक्तिपरक अनुभवों को कोडित करने के तरीके को प्रकट करते हैं बाधाएं: प्रणालीगत कार्यात्मक भाषाविज्ञान की सकर्मकता प्रणाली (प्रक्रियाएं, प्रतिभागी, परिवेश) पर आधारित

मॉडल आर्किटेक्चर

1. भाषाई विशेषता वर्गीकरण प्रणाली

Halliday की प्रणालीगत कार्यात्मक भाषाविज्ञान पर आधारित, विशेष रूप से सकर्मकता प्रणाली:

प्रक्रिया प्रकार (Processes):

  • कार्य प्रक्रिया (Action): भौतिक दुनिया में कार्य और घटनाएं
  • मानसिक प्रक्रिया (Mental): विचार, धारणा और भावनाएं जैसे आंतरिक अनुभव
  • मौखिक प्रक्रिया (Verbal): संचार व्यवहार
  • स्थिति प्रक्रिया (State): अस्तित्व, स्वामित्व या स्थिति

प्रतिभागी (Participants): संज्ञा वाक्यांशों के माध्यम से महसूस किए जाते हैं परिवेश (Circumstances): क्रिया विशेषण समूहों या पूर्वसर्ग वाक्यांशों के माध्यम से महसूस किए जाते हैं

2. अनुक्रम प्रतिनिधित्व ढांचा

प्रत्येक भाषाई विशेषता प्रणाली को एक परिमित समुच्चय Σ (वर्णमाला) के रूप में प्रस्तुत किया जाता है:

Σprocess = {action, mental, verbal, state}

कार्टेशियन उत्पाद के माध्यम से कई वर्णमालाओं को संयोजित करना:

Σ = Σprocess × Σtense × Σaspect

3. अनुक्रम विश्लेषण विधि

सबस्ट्रिंग विश्लेषण: सतत प्रतीक ब्लॉक के दोहराए गए पैटर्न की पहचान करता है सबसीक्वेंस विश्लेषण: सापेक्ष क्रम को बनाए रखने वाले लेकिन निरंतरता की आवश्यकता न रखने वाले पैटर्न की पहचान करता है

समानता माप: कोसाइन समानता का उपयोग करना

cos(s1, s2) = (Σi xiyi) / (√(Σi xi²) × √(Σi yi²))

क्लस्टरिंग विधि: पदानुक्रमीय समूहन क्लस्टरिंग (Ward लिंकेज)

तकनीकी नवाचार बिंदु

  1. स्वचालित निष्कर्षण: Llama 3.1 8B निर्देश-ट्यून्ड मॉडल का उपयोग करके, संदर्भ-में-सीखने के माध्यम से भाषाई विशेषताओं को निकालता है, हाथ से बनाए गए नियमों और विशेषज्ञ एनोटेशन से बचता है
  2. अनुक्रमीकरण प्रतिनिधित्व: आख्यानों को प्रतीक अनुक्रमों में मैप करता है, कम्प्यूटेशनल जीव विज्ञान-प्रेरित पैटर्न विश्लेषण का समर्थन करता है
  3. बहु-स्तरीय विश्लेषण: एकल प्रतीकों से जटिल सबस्ट्रिंग तक बहु-स्तरीय पैटर्न पहचान
  4. मनोविज्ञान संबंध: भाषाई पैटर्न को मानसिक स्थिति से जोड़ता है

प्रयोग सेटअप

डेटासेट

DreamBank कॉर्पस:

  • हजारों अमेरिकी-संग्रहीत स्वप्न आख्यान
  • पाँच श्रृंखलाओं का विश्लेषण: blind (दीर्घकालिक अंधे स्वप्नदर्शक, n=361), ed (विधुर, n=139), izzy (किशोर, n=1091), merri (कलाकार, n=202), viet (वियतनाम युद्ध दिग्गज, PTSD, n=566)
  • बेंचमार्क निर्माण: प्रत्येक श्रृंखला से यादृच्छिक रूप से 10 आख्यान नमूना, कुल 720 स्वप्न आख्यान

मूल्यांकन मेट्रिक्स

  • Odds Ratio: विभिन्न श्रृंखलाओं में विशिष्ट सबस्ट्रिंग के प्रकट होने की सापेक्ष संभावना को मापता है
  • Fisher सटीक परीक्षण (Holm-Bonferroni सुधार): सांख्यिकीय महत्व परीक्षण
  • सिल्हूट गुणांक (Silhouette Score): क्लस्टरिंग गुणवत्ता मूल्यांकन
  • कोसाइन समानता: अनुक्रम समानता माप

तुलनात्मक विधियाँ

  • बेंचमार्क (norm) के साथ तुलनात्मक विश्लेषण
  • विभिन्न श्रृंखलाओं के बीच पैटर्न तुलना

कार्यान्वयन विवरण

  • मॉडल: Llama 3.1 8B Instruct
  • हार्डवेयर: Tesla V100 32GB, 80 घंटे चलाना
  • पूर्व-प्रसंस्करण: SpaCy वाक्य विभाजन, भाषा मॉडल वाक्य विभाजन
  • सत्यापन: 50 स्वर्ण-मानक वाक्यों का मात्रात्मक सत्यापन, भविष्यवाणी सटीकता 100%

प्रयोग परिणाम

मुख्य परिणाम

वियतनाम युद्ध दिग्गज (viet) केस विश्लेषण:

सबस्ट्रिंग वितरण खोजें:

  • मौखिक प्रक्रिया बेंचमार्क से 40% अधिक (OR=1.4, p<0.05)
  • मानसिक प्रक्रिया बेंचमार्क से 40% कम (OR=0.6, p<0.05)
  • सतत मौखिक प्रक्रिया पैटर्न महत्वपूर्ण: verbal.verbal (OR=2.00), verbal.verbal.verbal (OR=1.75)

क्लस्टरिंग विश्लेषण:

  • इष्टतम क्लस्टरिंग: 2 क्लस्टर, अधिकतम सिल्हूट गुणांक
  • क्लस्टर 1 प्रतिनिधि अनुक्रम: उच्च कार्य-उन्मुख (कार्य प्रक्रिया 23 बार, मानसिक प्रक्रिया 2 बार), 274 अनुक्रमों को कवर करता है
  • क्लस्टर 2 प्रतिनिधि अनुक्रम: कार्य-स्थिति संतुलन (कार्य प्रक्रिया 13 बार, स्थिति प्रक्रिया 16 बार, मानसिक प्रक्रिया 4 बार), 179 अनुक्रमों को कवर करता है

केस विश्लेषण

उदाहरण अनुक्रम रूपांतरण:

"I wake in a dark room. I feel a cold wind. I tell myself to move."
→ खंड विश्लेषण → विशेषता निष्कर्षण → अनुक्रम: amv
→ सबस्ट्रिंग: {am, mv}

प्रयोग निष्कर्ष

  1. मानसिक स्थिति संबंध: viet मुख्य रूप से मानसिक प्रक्रियाओं के बजाय कार्य और मौखिक के माध्यम से अनुभव का निर्माण करते हैं, जो आघात से कैसे संज्ञानात्मक और भावनात्मक प्रसंस्करण प्रभावित होता है, से संबंधित हो सकता है
  2. पैटर्न सामंजस्य: दिग्गज दो टेम्पलेट का पालन करते हैं: उच्च कार्य-उन्मुख संरचना या स्थिति-कार्य वैकल्पिक संरचना
  3. स्वचालन प्रभावकारिता: भाषा मॉडल मानक परीक्षण सेट पर 100% सटीकता प्राप्त करता है

संबंधित कार्य

प्रणालीगत कार्यात्मक भाषाविज्ञान पार्सिंग

  • प्रारंभिक नियम-आधारित विधियाँ: सीमित कवरेज, डोमेन-संवेदनशील
  • ग्राफ-आधारित पाइपलाइन: निर्भरता पेड़ों को SFL नेटवर्क में परिवर्तित करता है
  • पर्यवेक्षित विधियाँ: विशेषज्ञ एनोटेशन डेटा की आवश्यकता
  • इस पेपर का नवाचार: कम-नमूना भाषा मॉडल दृष्टिकोण, हाथ से बनाए गए व्याकरण या क्रिया शब्दकोश की आवश्यकता नहीं

स्वप्न आख्यान का कम्प्यूटेशनल विश्लेषण

  • पारंपरिक विधियाँ: शब्दकोश-आधारित हाथ से बनाई गई कोडिंग प्रणाली
  • वितरण विधियाँ: शब्दार्थ स्थान एम्बेडिंग और विषय क्लस्टरिंग
  • मिश्रित प्रणाली: शब्दकोश स्कोरिंग + वर्गीकारक
  • भाषा मॉडल दृष्टिकोण: भावना पहचान और वर्ण भविष्यवाणी
  • इस पेपर का अंतर: "क्या कहा गया है" के बजाय "कैसे कहा गया है" पर ध्यान केंद्रित करता है

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. सैद्धांतिक योगदान: प्रणालीगत कार्यात्मक भाषाविज्ञान पर आधारित भाषाई विकल्पों के अनुक्रम पैटर्न के रूप में शैली को सफलतापूर्वक औपचारिक बनाता है
  2. विधि प्रभावकारिता: स्वचालित ढांचा मनोविज्ञान महत्व के पैटर्न को प्रकट कर सकता है
  3. अनुप्रयोग क्षमता: चिकित्सा वातावरण में आख्यान पुनर्निर्माण और लक्षित हस्तक्षेप का समर्थन करता है

सीमाएं

  1. स्वचालित निष्कर्षण त्रुटि: भाषा मॉडल प्रक्रियाओं या प्रतिभागियों को गलत तरीके से वर्गीकृत कर सकता है, पैटर्न विश्वसनीयता को प्रभावित करता है
  2. मनोविज्ञान व्याख्या: भाषाई विकल्पों और मानसिक स्थिति के बीच संबंध अभी भी सहसंबंधी और वर्णनात्मक हैं, नैदानिक मूल्यांकन सत्यापन की आवश्यकता है
  3. विशेषता श्रेणी: वर्तमान में केवल प्रक्रिया प्रकारों पर ध्यान केंद्रित करता है, भविष्य में अधिक सूक्ष्म भाषाई विशेषताओं तक विस्तार की आवश्यकता है

भविष्य की दिशाएं

  1. लेखक प्रोफाइलिंग: व्यक्तिपरक अनुभव पैटर्न के आधार पर लेखक विशेषता अनुमान
  2. शैली-सशर्त पीढ़ी: विकल्प अनुक्रमों से आख्यान उत्पन्न करना, चिकित्सीय हस्तक्षेप का समर्थन करता है
  3. जटिलता विज्ञान विधियाँ: Lempel-Ziv जटिलता जैसे उपायों को लागू करके अनुक्रम अतिरेक को मापना
  4. नैदानिक सत्यापन: मनोविज्ञान व्याख्या को सत्यापित करने के लिए नैदानिक मूल्यांकन के साथ संयोजन

गहन मूल्यांकन

शक्तियाँ

  1. अंतःविषय नवाचार: कार्यात्मक भाषाविज्ञान, कंप्यूटर विज्ञान और मनोविज्ञान को सफलतापूर्वक एकीकृत करता है
  2. विधि उन्नति: SFL विश्लेषण को स्वचालित करने के लिए बड़े भाषा मॉडल का पहला उपयोग
  3. व्यावहारिक मूल्य: चिकित्सीय अनुप्रयोगों के लिए परिचालन उपकरण प्रदान करता है
  4. सैद्धांतिक कठोरता: परिपक्व प्रणालीगत कार्यात्मक भाषाविज्ञान सिद्धांत पर आधारित
  5. विस्तारशीलता: ढांचा विभिन्न भाषाई विशेषताओं और अनुप्रयोग परिदृश्यों के अनुकूल हो सकता है

कमियाँ

  1. सीमित सत्यापन: केवल 50 मानक नमूनों पर सत्यापित, बड़े पैमाने पर विशेषज्ञ एनोटेशन सत्यापन की आवश्यकता है
  2. मनोविज्ञान संबंध: नैदानिक निदान के साथ प्रत्यक्ष सत्यापन की कमी
  3. भाषा कवरेज: केवल अंग्रेजी स्वप्न आख्यानों पर परीक्षण किया गया, क्रॉस-भाषा प्रयोज्यता अज्ञात है
  4. विशेषता सरलीकरण: वर्तमान विश्लेषण अपेक्षाकृत सरल है, SFL की समृद्धि का पूरी तरह से उपयोग नहीं करता है

प्रभाव

  1. शैक्षणिक योगदान: कम्प्यूटेशनल भाषाविज्ञान और मनोविज्ञान के अंतःविषय क्षेत्र के लिए नया अनुसंधान प्रतिमान प्रदान करता है
  2. अनुप्रयोग संभावनाएं: डिजिटल चिकित्सा, लेखक विश्लेषण, शैली पीढ़ी आदि क्षेत्रों में व्यापक अनुप्रयोग संभावनाएं हैं
  3. पुनरुत्पादनीयता: लेखक पूर्ण प्रॉम्प्ट, हाइपरपैरामीटर और निकाले गए अनुक्रम प्रदान करते हैं, अनुसंधान पुनरुत्पादन का समर्थन करते हैं

लागू परिदृश्य

  1. नैदानिक मनोविज्ञान: चिकित्सकों को रोगी आख्यान पैटर्न विश्लेषण में सहायता करता है
  2. फोरेंसिक भाषाविज्ञान: लेखक पहचान और विशेषता विश्लेषण
  3. साहित्य अनुसंधान: लेखक शैली का मात्रात्मक विश्लेषण
  4. डिजिटल स्वास्थ्य: व्यक्तिगत डायरी और आख्यान का मानसिक स्वास्थ्य निगरानी
  5. शैक्षणिक अनुप्रयोग: लेखन शैली मार्गदर्शन और व्यक्तिगत प्रतिक्रिया

संदर्भ

पेपर समृद्ध अंतःविषय साहित्य का हवाला देता है, जिसमें शामिल हैं:

  • Halliday et al. (2014): प्रणालीगत कार्यात्मक भाषाविज्ञान सिद्धांत आधार
  • Tellier और Finkel (1995): भाषाई शैली औपचारिकीकरण का प्रारंभिक कार्य
  • Banks (2019): SFL व्यावहारिक मार्गदर्शन
  • Domhoff और Schneider (2008): स्वप्न मात्रात्मक विश्लेषण विधियाँ
  • साथ ही कम्प्यूटेशनल भाषाविज्ञान, मनोविज्ञान और संज्ञानात्मक विज्ञान से संबंधित व्यापक साहित्य

यह पेपर सैद्धांतिक नवाचार, विधि उन्नति और अनुप्रयोग संभावनाओं के संदर्भ में उत्कृष्ट प्रदर्शन करता है, व्यक्तिगत आख्यानों के कम्प्यूटेशनल विश्लेषण के लिए अनुसंधान की एक नई दिशा खोलता है, और महत्वपूर्ण शैक्षणिक मूल्य और व्यावहारिक महत्व रखता है।