2025-11-15T12:01:11.943866

Sufficient and Necessary Conditions for the Identifiability of DINA Models with Polytomous Responses

Lin, Xu

Cognitive Diagnosis Models (CDMs) provide a powerful statistical and psychometric tool for researchers and practitioners to learn fine-grained diagnostic information about respondents' latent attributes. There has been a growing interest in the use of CDMs for polytomous response data, as more and more items with multiple response options become widely used. Similar to many latent variable models, the identifiability of CDMs is critical for accurate parameter estimation and valid statistical inference. However, the existing identifiability results are primarily focused on binary response models and have not adequately addressed the identifiability of CDMs with polytomous responses. This paper addresses this gap by presenting sufficient and necessary conditions for the identifiability of the widely used DINA model with polytomous responses, with the aim to provide a comprehensive understanding of the identifiability of CDMs with polytomous responses and to inform future research in this field.

academic

الشروط الكافية والضرورية لتحديد هوية نماذج DINA مع الاستجابات متعددة الفئات

المعلومات الأساسية

معرّف الورقة: 2304.01363
العنوان: الشروط الكافية والضرورية لتحديد هوية نماذج DINA مع الاستجابات متعددة الفئات
المؤلفون: Mengqi Lin, Gongjun Xu (جامعة ميشيغان)
التصنيف: stat.ME, math.ST, stat.TH
تاريخ النشر: 22 فبراير 2024 (الإصدار الثالث من arXiv)
رابط الورقة: https://arxiv.org/abs/2304.01363

الملخص

توفر نماذج التشخيص المعرفي (CDMs) أدوات إحصائية وقياسية نفسية قوية للباحثين والممارسين لدراسة المعلومات التشخيصية الدقيقة للسمات الكامنة للمختبرين. مع الاستخدام الواسع للأسئلة متعددة الخيارات، يتزايد الاهتمام بتطبيق نماذج التشخيص المعرفي على بيانات الاستجابات متعددة الفئات. وكما هو الحال مع العديد من نماذج المتغيرات الكامنة، فإن قابلية تحديد الهوية في نماذج التشخيص المعرفي ضرورية للتقدير الدقيق للمعاملات والاستدلال الإحصائي الفعال. ومع ذلك، تركز النتائج الحالية لقابلية تحديد الهوية بشكل أساسي على نماذج الاستجابة الثنائية، وتفشل في معالجة قابلية تحديد الهوية بشكل كافٍ في نماذج التشخيص المعرفي ذات الاستجابات متعددة الفئات. تملأ هذه الورقة هذه الفجوة من خلال اقتراح الشروط الكافية والضرورية لقابلية تحديد هوية نموذج DINA متعدد الاستجابات المستخدم على نطاق واسع.

خلفية البحث والدافع

خلفية المشكلة

أهمية نماذج التشخيص المعرفي: تُستخدم نماذج التشخيص المعرفي كنماذج متغيرات كامنة منفصلة على نطاق واسع في التقييم التعليمي وتشخيص الأمراض النفسية والدراسات الوبائية
النمو المتزايد للاستجابات متعددة الفئات: يعتمد عدد متزايد من الاختبارات العملية على تنسيقات متعددة الخيارات، متجاوزة الاستجابات الثنائية التقليدية
أهمية قابلية تحديد الهوية: قابلية تحديد هوية معاملات النموذج هي الأساس للتقدير الموثوق للمعاملات والاستدلال الإحصائي الفعال

قيود الطرق الموجودة

التركيز البحثي على الاستجابات الثنائية: تركز النظرية الحالية لقابلية تحديد الهوية بشكل أساسي على نماذج DINA الثنائية، مثل أعمال Xu و Zhang (2016) و Gu و Xu (2019b)
نظرية الاستجابات متعددة الفئات غير مكتملة: بينما ناقش Culpepper (2019) و Fang وآخرون (2019) الشروط الكافية لنماذج التشخيص المعرفي متعددة الفئات، لا تزال الشروط الضرورية مسألة مفتوحة
قيود الأدوات التقنية: تم تصميم أداة T-matrix الموجودة بشكل أساسي للاستجابات الثنائية ولا يمكن تطبيقها مباشرة على الحالات متعددة الفئات

دافع البحث

تهدف هذه الورقة إلى إنشاء إطار نظري شامل لقابلية تحديد هوية نموذج DINA متعدد الاستجابات، وتوفير إرشادات إحصائية لتصميم الاختبارات التشخيصية المعرفية في الممارسة العملية.

المساهمات الأساسية

توسيع الإطار النظري: إنشاء نظرية قابلية تحديد الهوية الشاملة لأول مرة لنموذج DINA متعدد الاستجابات، بما في ذلك الشروط الكافية والضرورية
تعميم أداة T-matrix: توسيع إطار T-matrix الكلاسيكي ليشمل نماذج الاستجابات متعددة الفئات، مع تصميم إصدارات معممة لهيكلي نموذج مختلفين
التحليل الشامل لنوعي النموذج:
- نموذج GPDINA: توفير نفس شروط قابلية تحديد الهوية كما في DINA الثنائي (C1-C3)
- نموذج Sequential DINA: إنشاء شروط كافية بناءً على الفئة الأولى (S1-S3) وشروط ضرورية أضعف (S2*, S3*)
قيمة التوجيه العملي: تعتمد الشروط فقط على هيكل Q-matrix، مما يوفر إرشادات عملية قابلة للتحقق لتصميم الاختبارات

شرح الطريقة

تعريف المهمة

دراسة مشكلة قابلية تحديد هوية المعاملات في نموذج DINA متعدد الاستجابات. بناءً على:

J من الأسئلة متعددة الفئات، حيث يحتوي كل سؤال j على Hj+1 فئات (0,1,...,Hj)
K من السمات الكامنة الثنائية α = (α1,...,αK)^T
Q-matrix يصف العلاقة بين الأسئلة والسمات

الهدف: تحديد متى تكون معاملات النموذج (θ+, θ-, p) أو (β+, β-, p) قابلة للتحديد الفريد.

بنية النموذج

نموذج GPDINA

في نموذج GPDINA، تحتاج الفئات غير الصفرية المختلفة للسؤال نفسه إلى نفس مجموعة السمات:

الاستجابة المثالية: ξj,α = I(α ⪰ qj)
معاملات الأسئلة:
- θ+j,l := P(Rj = l | ξj,α = 1)، l ∈ Hj
- θ-j,l := P(Rj = l | ξj,α = 0)، l ∈ Hj
احتمالية الاستجابة:

P(R = r | Q, θ+, θ-, p) = Σα pα ∏j (θ+j,rj)^ξj,α (θ-j,rj)^(1-ξj,α)

نموذج Sequential DINA

في نموذج Sequential DINA، يجب إكمال الفئات بالترتيب، وقد تتطلب الفئات المختلفة سمات مختلفة:

الاستجابة المثالية: ξj,l,α = I(α ⪰ qj,l) لكل فئة l
معاملات الأسئلة:
- β+j,l := P(Rj ≥ l | Rj ≥ l-1, ξj,l,α = 1)
- β-j,l := P(Rj ≥ l | Rj ≥ l-1, ξj,l,α = 0)

نقاط الابتكار التقني

تعميم T-matrix

T-matrix لنموذج GPDINA:
- البعد: ∏j(Hj+1) × 2^K
- المدخلات: tr,α(θ+,θ-) = ∏j:rj≠0 P(Rj = rj | Q, θ+, θ-, α)
- يحافظ على هيكل مشابه لـ DINA الثنائي
Ts-matrix لنموذج Sequential DINA:
- المدخلات: tsr,α(β+,β-) = ∏j:rj≠0 ∏l=1^rj (β+j,l)^ξj,l,α (β-j,l)^(1-ξj,l,α)
- الهيكل أكثر تعقيداً، حيث تتضمن الفئات ذات الرتبة الأعلى منتجات معاملات متعددة

شروط قابلية تحديد الهوية

شروط نموذج GPDINA (C1-C3):

C1: اكتمال Q-matrix (يتضمن مصفوفة الهوية IK)
C2: كل سمة مطلوبة من قبل ثلاثة أسئلة على الأقل
C3: أي عمودين مختلفين في مصفوفة Q* الجزئية

شروط نموذج Sequential DINA (S1-S3):

S1: اكتمال Q1-matrix
S2: كل سمة مطلوبة من قبل ثلاثة أسئلة على الأقل في الفئة الأولى
S3: أي عمودين مختلفين في مصفوفة Q1 الجزئية

إعداد التجارب

مجموعات البيانات

تستخدم الورقة مجموعتي بيانات حقيقيتين للتحقق من النتائج النظرية:

بيانات تقييم القراءة من PISA 2000:
- 1,039 متعلماً ناطقاً باللغة الإنجليزية، 20 سؤالاً (5 متعددة الفئات)
- 5 سمات معرفية (استرجاع المعلومات، الفهم، التفسير، تقييم المحتوى، تقييم الشكل)
بيانات تقييم الرياضيات للصف الرابع من TIMSS 2007:
- 823 طالباً، 12 سؤالاً (بعضها متعدد الفئات)
- 8 سمات معرفية رياضية

طريقة التقييم

التحقق من النتائج النظرية من خلال اختبار ما إذا كانت Q-matrix تفي بشروط قابلية تحديد الهوية المقترحة.

نتائج التجارب

النتائج الرئيسية

تحليل بيانات PISA

الاختبار وفقاً لشروط Theorem 1 (C1-C3):

لا تحتوي Q-matrix على مصفوفة الهوية، مما ينتهك شرط الاكتمال C1
ملفات السمات 0, e1, e3, e4, e5 لها نفس توزيع الاستجابة الشرطية
الخلاصة: معاملات النموذج غير قابلة للتحديد

تحليل بيانات TIMSS

الاختبار وفقاً لـ Proposition 3 لنموذج Sequential DINA:

لا تحتوي Q1-matrix على مصفوفة الهوية، مما ينتهك شرط الاكتمال S1
عندما β-j,1 = 0، تمتلك ملفات السمات المتعددة نفس احتمالية الاستجابة
الخلاصة: معاملات النموذج غير قابلة للتحديد

التحقق النظري

التحقق من خلال الإثبات البنائي والأمثلة المضادة:

شروط GPDINA (C1-C3) كافية وضرورية
شرط Sequential DINA S1 ضروري، و S2-S3 شروط كافية
وجود شروط ضرورية أضعف S2*, S3*

الأعمال ذات الصلة

قابلية تحديد الهوية في نماذج التشخيص المعرفي ذات الاستجابات الثنائية

النتائج الكلاسيكية: أسس Xu و Zhang (2016) و Gu و Xu (2019b) النظرية الخاصة بقابلية تحديد هوية نموذج DINA الثنائي
الأدوات التقنية: أصبحت طريقة T-matrix (Liu وآخرون، 2013) معياراً للأدوات التحليلية

نماذج التشخيص المعرفي ذات الاستجابات متعددة الفئات

تطور النموذج: GPDM لـ Chen و de la Torre (2018)، Sequential CDM لـ Ma و de la Torre (2016)
النتائج الجزئية: قدم Culpepper (2019) و Fang وآخرون (2019) شروطاً كافية، لكن تحليل الضرورة كان ناقصاً

نموذج GPDINA: شروط قابلية تحديد الهوية هي نفسها كما في نموذج DINA الثنائي (C1-C3)، على الرغم من أن هيكل المعاملات أكثر تعقيداً
نموذج Sequential DINA: هيكل المعلومات في الفئة الأولى يلعب دوراً حاسماً في قابلية تحديد الهوية
التوجيه العملي: تعتمد الشروط فقط على هيكل Q-matrix، مما يسهل التحقق في التطبيقات العملية

القيود

افتراض Q-matrix معروف: قد تحتاج Q-matrix في الواقع إلى التقدير والتحقق
قابلية التحديد الصارمة: قد تكون بعض الشروط صارمة جداً في إطار قابلية التحديد العام
التعقيد الحسابي: التفاعل بين معاملات الفئات ذات الرتبة الأعلى يجعل التحليل أكثر تعقيداً

الاتجاهات المستقبلية

قابلية التحديد العام: دراسة مفاهيم قابلية تحديد أكثر مرونة
قابلية تحديد Q-matrix: التوسع إلى الحالات التي تكون فيها Q-matrix غير معروفة
السمات متعددة الفئات: النظر في الحالات التي تكون فيها السمات نفسها متعددة الفئات
نماذج التشخيص المعرفي الأكثر عمومية: التوسع إلى نماذج أكثر عمومية مثل G-DINA

التقييم المتعمق

المزايا

اكتمال النظرية: توفير نظرية شاملة للشروط الكافية والضرورية لنموذج DINA متعدد الاستجابات للمرة الأولى
الابتكار التقني: نجاح تعميم أداة T-matrix إلى الحالات المعقدة متعددة الفئات
القيمة العملية: توفير شروط تحقق يمكن تطبيقها مباشرة على تصميم الاختبارات
الدقة: إثبات تفصيلي والتحقق من النتائج النظرية من خلال الإثبات البنائي والأمثلة المضادة

أوجه القصور

قيود نطاق التطبيق: تُظهر أمثلة البيانات الحقيقية أن الاختبارات الموجودة غالباً لا تفي بشروط قابلية تحديد الهوية
صرامة الشروط: قد تكون بعض الشروط الضرورية (مثل S1) صارمة جداً، مما يحد من التطبيق العملي
التعقيد الحسابي: يتضمن تحليل نموذج Sequential DINA تفاعلات معاملات معقدة

التأثير

المساهمة النظرية: وضع أساس نظري متين لقابلية تحديد الهوية في نماذج التشخيص المعرفي متعددة الفئات
التوجيه العملي: توفير إرشادات إحصائية لتصميم الاختبارات في التقييم التعليمي والقياس النفسي
القيمة المنهجية: قد يكون تعميم T-matrix مفيداً لنماذج المتغيرات الكامنة الأخرى

السيناريوهات المطبقة

التقييم التعليمي: تصميم اختبارات التشخيص المعرفي ذات التصنيفات متعددة المستويات
القياس النفسي: تشخيص الأمراض النفسية مع درجات أعراض متعددة
البحث النظري: دراسة النظرية الإحصائية لنماذج المتغيرات الكامنة ذات الاستجابات متعددة الفئات

المراجع

Xu, G., & Zhang, S. (2016). Identifiability of diagnostic classification models. Psychometrika, 81, 625-649.
Gu, Y., & Xu, G. (2019). The sufficient and necessary condition for the identifiability and estimability of the DINA model. Psychometrika, 84(2), 468-483.
Chen, J., & de la Torre, J. (2018). Introducing the general polytomous diagnosis modeling framework. Frontiers in Psychology, 9, 1474.
Ma, W., & de la Torre, J. (2016). A sequential cognitive diagnosis model for polytomous responses. British Journal of Mathematical and Statistical Psychology, 69(3), 253-275.