2025-11-15T12:01:11.943866

Sufficient and Necessary Conditions for the Identifiability of DINA Models with Polytomous Responses

Lin, Xu
Cognitive Diagnosis Models (CDMs) provide a powerful statistical and psychometric tool for researchers and practitioners to learn fine-grained diagnostic information about respondents' latent attributes. There has been a growing interest in the use of CDMs for polytomous response data, as more and more items with multiple response options become widely used. Similar to many latent variable models, the identifiability of CDMs is critical for accurate parameter estimation and valid statistical inference. However, the existing identifiability results are primarily focused on binary response models and have not adequately addressed the identifiability of CDMs with polytomous responses. This paper addresses this gap by presenting sufficient and necessary conditions for the identifiability of the widely used DINA model with polytomous responses, with the aim to provide a comprehensive understanding of the identifiability of CDMs with polytomous responses and to inform future research in this field.
academic

बहुपद प्रतिक्रियाओं के साथ DINA मॉडल की पहचान के लिए पर्याप्त और आवश्यक शर्तें

मूल जानकारी

  • पेपर ID: 2304.01363
  • शीर्षक: बहुपद प्रतिक्रियाओं के साथ DINA मॉडल की पहचान के लिए पर्याप्त और आवश्यक शर्तें
  • लेखक: Mengqi Lin, Gongjun Xu (मिशिगन विश्वविद्यालय)
  • वर्गीकरण: stat.ME, math.ST, stat.TH
  • प्रकाशन समय: 22 फरवरी 2024 (arXiv संस्करण 3)
  • पेपर लिंक: https://arxiv.org/abs/2304.01363

सारांश

संज्ञानात्मक निदान मॉडल (CDMs) शोधकर्ताओं और व्यावहारिकों को परीक्षार्थियों की अव्यक्त विशेषताओं की सूक्ष्म निदान जानकारी प्राप्त करने के लिए शक्तिशाली सांख्यिकीय और मनोमितीय उपकरण प्रदान करते हैं। बहु-विकल्प प्रश्नों के व्यापक अनुप्रयोग के साथ, बहुपद प्रतिक्रिया डेटा में CDMs के अनुप्रयोग में तेजी से वृद्धि हुई है। कई अव्यक्त चर मॉडल की तरह, CDMs की पहचान सटीक पैरामीटर अनुमान और प्रभावी सांख्यिकीय अनुमान के लिए महत्वपूर्ण है। हालांकि, मौजूदा पहचान परिणाम मुख्य रूप से द्विआधारी प्रतिक्रिया मॉडल पर केंद्रित हैं और बहुपद प्रतिक्रिया CDMs की पहचान समस्या को पर्याप्त रूप से संबोधित नहीं करते हैं। यह पेपर व्यापक रूप से उपयोग किए जाने वाले बहुपद प्रतिक्रिया DINA मॉडल की पहचान के लिए पर्याप्त और आवश्यक शर्तें प्रस्तावित करके इस अंतर को भरता है।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या की पृष्ठभूमि

  1. संज्ञानात्मक निदान मॉडल का महत्व: CDMs असतत अव्यक्त चर मॉडल के रूप में, शैक्षिक मूल्यांकन, मानसिक रोग निदान, महामारी विज्ञान अनुसंधान आदि क्षेत्रों में व्यापक रूप से लागू होते हैं
  2. बहुपद प्रतिक्रिया की बढ़ती मांग: व्यावहारिक रूप से अधिकाधिक परीक्षण पारंपरिक द्विआधारी प्रतिक्रिया से परे बहु-विकल्प प्रारूप अपनाते हैं
  3. पहचान की महत्वपूर्णता: मॉडल पैरामीटर की पहचान विश्वसनीय पैरामीटर अनुमान और प्रभावी सांख्यिकीय अनुमान का आधार है

मौजूदा विधियों की सीमाएं

  1. द्विआधारी प्रतिक्रिया की ओर अनुसंधान पूर्वाग्रह: मौजूदा पहचान सिद्धांत मुख्य रूप से द्विआधारी DINA मॉडल पर केंद्रित है, जैसे Xu और Zhang (2016), Gu और Xu (2019b) का कार्य
  2. बहुपद प्रतिक्रिया सिद्धांत अधूरा: हालांकि Culpepper (2019) और Fang आदि (2019) ने बहुपद CDMs की पर्याप्त शर्तों पर चर्चा की है, आवश्यक शर्तें अभी भी खुली समस्या हैं
  3. तकनीकी उपकरण सीमाएं: मौजूदा T-matrix उपकरण मुख्य रूप से द्विआधारी प्रतिक्रिया के लिए डिज़ाइन किए गए हैं और बहुपद स्थितियों पर सीधे लागू नहीं हो सकते

अनुसंधान प्रेरणा

यह पेपर बहुपद प्रतिक्रिया DINA मॉडल के लिए एक संपूर्ण पहचान सैद्धांतिक ढांचा स्थापित करने का लक्ष्य रखता है, जो व्यावहारिक संज्ञानात्मक निदान परीक्षण डिजाइन के लिए सांख्यिकीय मार्गदर्शन प्रदान करता है।

मुख्य योगदान

  1. सैद्धांतिक ढांचे का विस्तार: बहुपद प्रतिक्रिया DINA मॉडल के लिए पहली बार पर्याप्त और आवश्यक दोनों शर्तें सहित एक संपूर्ण पहचान सिद्धांत स्थापित किया
  2. T-matrix उपकरण का सामान्यीकरण: शास्त्रीय T-matrix ढांचे को बहुपद प्रतिक्रिया मॉडल तक विस्तारित किया, दो विभिन्न मॉडल संरचनाओं के लिए संबंधित सामान्यीकृत संस्करण डिजाइन किए
  3. दो मॉडलों का संपूर्ण विश्लेषण:
    • GPDINA मॉडल: द्विआधारी DINA के समान पहचान शर्तें प्रदान करता है (C1-C3)
    • Sequential DINA मॉडल: पहली श्रेणी के आधार पर पर्याप्त शर्तें (S1-S3) और कमजोर आवश्यक शर्तें (S2*, S3*) स्थापित करता है
  4. व्यावहारिक मार्गदर्शन मूल्य: शर्तें केवल Q-matrix संरचना पर निर्भर करती हैं, परीक्षण डिजाइन के लिए सत्यापन योग्य व्यावहारिक दिशानिर्देश प्रदान करती हैं

विधि विवरण

कार्य परिभाषा

बहुपद प्रतिक्रिया DINA मॉडल के पैरामीटर पहचान समस्या का अनुसंधान। दिया गया:

  • J बहुपद प्रश्न, प्रत्येक प्रश्न j में Hj+1 श्रेणियां (0,1,...,Hj)
  • K द्विआधारी अव्यक्त विशेषताएं α = (α1,...,αK)^T
  • Q-matrix प्रश्न और विशेषताओं के बीच संबंध का वर्णन करता है

लक्ष्य: निर्धारित करें कि मॉडल पैरामीटर (θ+, θ-, p) या (β+, β-, p) कब विशिष्ट रूप से पहचाने जा सकते हैं।

मॉडल आर्किटेक्चर

GPDINA मॉडल

GPDINA मॉडल के लिए, एक ही प्रश्न की विभिन्न गैर-शून्य श्रेणियों को विशेषताओं का एक ही समूह चाहिए:

  • आदर्श प्रतिक्रिया: ξj,α = I(α ⪰ qj)
  • आइटम पैरामीटर:
    • θ+j,l := P(Rj = l | ξj,α = 1), l ∈ Hj
    • θ-j,l := P(Rj = l | ξj,α = 0), l ∈ Hj
  • प्रतिक्रिया संभावना:
P(R = r | Q, θ+, θ-, p) = Σα pα ∏j (θ+j,rj)^ξj,α (θ-j,rj)^(1-ξj,α)

Sequential DINA मॉडल

Sequential DINA मॉडल में, श्रेणियों को क्रमिक रूप से पूरा किया जाना चाहिए, विभिन्न श्रेणियों को विभिन्न विशेषताओं की आवश्यकता हो सकती है:

  • आदर्श प्रतिक्रिया: ξj,l,α = I(α ⪰ qj,l) प्रत्येक श्रेणी l के लिए
  • आइटम पैरामीटर:
    • β+j,l := P(Rj ≥ l | Rj ≥ l-1, ξj,l,α = 1)
    • β-j,l := P(Rj ≥ l | Rj ≥ l-1, ξj,l,α = 0)

तकनीकी नवाचार बिंदु

T-matrix का सामान्यीकरण

  1. GPDINA का T-matrix:
    • आयाम: ∏j(Hj+1) × 2^K
    • प्रविष्टि: tr,α(θ+,θ-) = ∏j:rj≠0 P(Rj = rj | Q, θ+, θ-, α)
    • द्विआधारी DINA के समान संरचना बनाए रखता है
  2. Sequential DINA का Ts-matrix:
    • प्रविष्टि: tsr,α(β+,β-) = ∏j:rj≠0 ∏l=1^rj (β+j,l)^ξj,l,α (β-j,l)^(1-ξj,l,α)
    • संरचना अधिक जटिल है, उच्च-क्रम श्रेणियां कई पैरामीटर के गुणनफल को शामिल करती हैं

पहचान शर्तें

GPDINA मॉडल शर्तें (C1-C3):

  • C1: Q-matrix पूर्णता (इकाई मैट्रिक्स IK शामिल)
  • C2: प्रत्येक विशेषता को कम से कम 3 प्रश्नों की आवश्यकता है
  • C3: Q* उप-मैट्रिक्स के किन्हीं दो स्तंभ भिन्न हैं

Sequential DINA मॉडल शर्तें (S1-S3):

  • S1: Q1-matrix पूर्णता
  • S2: प्रत्येक विशेषता को कम से कम 3 प्रश्नों की पहली श्रेणी की आवश्यकता है
  • S3: Q1 उप-मैट्रिक्स के किन्हीं दो स्तंभ भिन्न हैं

प्रायोगिक सेटअप

डेटासेट

पेपर सैद्धांतिक परिणामों को सत्यापित करने के लिए दो वास्तविक डेटासेट का उपयोग करता है:

  1. PISA 2000 पठन मूल्यांकन डेटा:
    • 1,039 अंग्रेजी परीक्षार्थी, 20 प्रश्न (5 बहुपद)
    • 5 संज्ञानात्मक विशेषताएं (सूचना पुनः प्राप्ति, समझ, व्याख्या, सामग्री मूल्यांकन, रूप मूल्यांकन)
  2. TIMSS 2007 चौथी कक्षा गणित मूल्यांकन डेटा:
    • 823 छात्र, 12 प्रश्न (आंशिक बहुपद)
    • 8 गणितीय संज्ञानात्मक विशेषताएं

मूल्यांकन विधि

प्रस्तावित पहचान शर्तों को Q-matrix संतुष्ट करता है या नहीं, इसकी जांच करके सैद्धांतिक परिणामों की व्यावहारिकता को सत्यापित करें।

प्रायोगिक परिणाम

मुख्य निष्कर्ष

PISA डेटा विश्लेषण

Theorem 1 की शर्तों C1-C3 के अनुसार जांच:

  • Q-matrix में इकाई मैट्रिक्स नहीं है, पूर्णता शर्त C1 का उल्लंघन करता है
  • विशेषता प्रोफाइल 0, e1, e3, e4, e5 में समान सशर्त प्रतिक्रिया वितरण है
  • निष्कर्ष: मॉडल पैरामीटर पहचाने जाने योग्य नहीं हैं

TIMSS डेटा विश्लेषण

Sequential DINA मॉडल के लिए Proposition 3 की जांच:

  • Q1-matrix में इकाई मैट्रिक्स नहीं है, पूर्णता शर्त S1 का उल्लंघन करता है
  • जब β-j,1 = 0 हो, तो कई विशेषता प्रोफाइल में समान प्रतिक्रिया संभावना है
  • निष्कर्ष: मॉडल पैरामीटर पहचाने जाने योग्य नहीं हैं

सैद्धांतिक सत्यापन

निर्माणात्मक प्रमाण और प्रतिउदाहरणों के माध्यम से सत्यापित किया:

  1. GPDINA मॉडल की शर्तें C1-C3 पर्याप्त और आवश्यक दोनों हैं
  2. Sequential DINA मॉडल की शर्त S1 आवश्यक है, S2-S3 पर्याप्त हैं
  3. कमजोर आवश्यक शर्तें S2*, S3* का अस्तित्व

संबंधित कार्य

द्विआधारी प्रतिक्रिया CDMs की पहचान

  • शास्त्रीय परिणाम: Xu और Zhang (2016), Gu और Xu (2019b) ने द्विआधारी DINA मॉडल के लिए पहचान सिद्धांत स्थापित किया
  • तकनीकी उपकरण: T-matrix विधि (Liu आदि, 2013) विश्लेषण उपकरण का मानक बन गई

बहुपद प्रतिक्रिया CDMs

  • मॉडल विकास: Chen और de la Torre (2018) का GPDM, Ma और de la Torre (2016) का Sequential CDM
  • आंशिक परिणाम: Culpepper (2019), Fang आदि (2019) ने पर्याप्त शर्तें प्रदान कीं, लेकिन आवश्यकता विश्लेषण की कमी है

इस पेपर का सैद्धांतिक योगदान

मौजूदा कार्य की तुलना में, यह पेपर पहली बार बहुपद प्रतिक्रिया DINA मॉडल की पहचान के लिए एक संपूर्ण सैद्धांतिक ढांचा प्रदान करता है।

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. GPDINA मॉडल: पहचान शर्तें द्विआधारी DINA मॉडल के समान हैं (C1-C3), हालांकि पैरामीटर संरचना अधिक जटिल है
  2. Sequential DINA मॉडल: पहली श्रेणी की सूचना संरचना पहचान के लिए महत्वपूर्ण भूमिका निभाती है
  3. व्यावहारिक मार्गदर्शन: शर्तें केवल Q-matrix संरचना पर निर्भर करती हैं, व्यावहारिक अनुप्रयोग में सत्यापन को सुविधाजनक बनाती हैं

सीमाएं

  1. Q-matrix ज्ञात मानना: व्यावहारिक रूप से Q-matrix का अनुमान और सत्यापन की आवश्यकता हो सकती है
  2. कठोर पहचान: कुछ शर्तें सामान्य पहचान ढांचे में अत्यधिक कठोर हो सकती हैं
  3. कम्प्यूटेशनल जटिलता: उच्च-क्रम श्रेणियों के पैरामीटर इंटरैक्शन विश्लेषण को अधिक जटिल बनाते हैं

भविष्य की दिशाएं

  1. सामान्य पहचान: अधिक शिथिल पहचान अवधारणा का अनुसंधान
  2. Q-matrix पहचान: Q-matrix अज्ञात स्थितियों तक विस्तार
  3. बहुपद विशेषताएं: ऐसी स्थितियां जहां विशेषताएं स्वयं बहुपद हों
  4. अधिक सामान्य CDMs: G-DINA जैसे अधिक सामान्य मॉडलों तक विस्तार

गहन मूल्यांकन

शक्तियां

  1. सैद्धांतिक पूर्णता: बहुपद प्रतिक्रिया DINA मॉडल के लिए पहली बार पर्याप्त आवश्यक शर्तों का संपूर्ण सिद्धांत
  2. तकनीकी नवाचार: T-matrix उपकरण को जटिल बहुपद स्थितियों तक सफलतापूर्वक सामान्यीकृत किया
  3. व्यावहारिक मूल्य: परीक्षण डिजाइन में सीधे लागू की जा सकने वाली सत्यापन शर्तें प्रदान करता है
  4. कठोरता: विस्तृत प्रमाण, निर्माणात्मक प्रमाण और प्रतिउदाहरणों द्वारा सैद्धांतिक परिणामों का सत्यापन

कमजोरियां

  1. अनुप्रयोग सीमा: वास्तविक डेटा उदाहरण दर्शाते हैं कि मौजूदा परीक्षण अक्सर पहचान शर्तों को संतुष्ट नहीं करते
  2. शर्त कठोरता: कुछ आवश्यक शर्तें (जैसे S1) अत्यधिक कठोर हो सकती हैं, व्यावहारिक अनुप्रयोग को सीमित करती हैं
  3. कम्प्यूटेशनल जटिलता: Sequential DINA मॉडल का विश्लेषण जटिल पैरामीटर इंटरैक्शन को शामिल करता है

प्रभाव

  1. सैद्धांतिक योगदान: बहुपद प्रतिक्रिया CDMs के लिए एक ठोस पहचान सैद्धांतिक आधार स्थापित करता है
  2. व्यावहारिक मार्गदर्शन: शैक्षिक मापन और मनोवैज्ञानिक मूल्यांकन में परीक्षण डिजाइन के लिए सांख्यिकीय मार्गदर्शन प्रदान करता है
  3. पद्धति मूल्य: T-matrix का सामान्यीकरण अन्य अव्यक्त चर मॉडलों के लिए संदर्भ मूल्य हो सकता है

लागू परिदृश्य

  1. शैक्षिक मूल्यांकन: बहु-स्तरीय स्कोरिंग के साथ संज्ञानात्मक निदान परीक्षण डिजाइन
  2. मनोमितीय: बहु-लक्षण स्तरों के साथ मानसिक रोग निदान
  3. सैद्धांतिक अनुसंधान: बहुपद प्रतिक्रिया अव्यक्त चर मॉडलों के सांख्यिकीय सिद्धांत अनुसंधान

संदर्भ

  • Xu, G., & Zhang, S. (2016). Identifiability of diagnostic classification models. Psychometrika, 81, 625-649.
  • Gu, Y., & Xu, G. (2019). The sufficient and necessary condition for the identifiability and estimability of the DINA model. Psychometrika, 84(2), 468-483.
  • Chen, J., & de la Torre, J. (2018). Introducing the general polytomous diagnosis modeling framework. Frontiers in Psychology, 9, 1474.
  • Ma, W., & de la Torre, J. (2016). A sequential cognitive diagnosis model for polytomous responses. British Journal of Mathematical and Statistical Psychology, 69(3), 253-275.