2025-11-23T12:04:17.035274

Discursive Circuits: How Do Language Models Understand Discourse Relations?

Miao, Kan
Which components in transformer language models are responsible for discourse understanding? We hypothesize that sparse computational graphs, termed as discursive circuits, control how models process discourse relations. Unlike simpler tasks, discourse relations involve longer spans and complex reasoning. To make circuit discovery feasible, we introduce a task called Completion under Discourse Relation (CuDR), where a model completes a discourse given a specified relation. To support this task, we construct a corpus of minimal contrastive pairs tailored for activation patching in circuit discovery. Experiments show that sparse circuits ($\approx 0.2\%$ of a full GPT-2 model) recover discourse understanding in the English PDTB-based CuDR task. These circuits generalize well to unseen discourse frameworks such as RST and SDRT. Further analysis shows lower layers capture linguistic features such as lexical semantics and coreference, while upper layers encode discourse-level abstractions. Feature utility is consistent across frameworks (e.g., coreference supports Expansion-like relations).
academic

الدوائر الخطابية: كيف تفهم نماذج اللغة علاقات الخطاب؟

المعلومات الأساسية

  • معرّف الورقة: 2510.11210
  • العنوان: الدوائر الخطابية: كيف تفهم نماذج اللغة علاقات الخطاب؟
  • المؤلفون: Yisong Miao, Min-Yen Kan (جامعة سنغافورة الوطنية)
  • التصنيف: cs.CL (اللسانيات الحسابية)، cs.LG (التعلم الآلي)
  • تاريخ النشر: 13 أكتوبر 2025 (نسخة arXiv المسبقة)
  • رابط الورقة: https://arxiv.org/abs/2510.11210

الملخص

تستكشف هذه الورقة أي المكونات في نماذج لغة المحول (Transformer) مسؤولة عن فهم الخطاب. يفترض المؤلفون أن الرسوم البيانية الحسابية المتفرقة (تسمى دوائر خطابية) تتحكم في كيفية معالجة النموذج لعلاقات الخطاب. على عكس المهام البسيطة، تتضمن علاقات الخطاب امتدادات نصية أطول واستدلالاً معقداً. لجعل اكتشاف الدوائر ممكناً، يقدم المؤلفون مهمة "الإكمال تحت علاقات الخطاب" (CUDR)، التي تسمح للنموذج بإكمال الخطاب تحت علاقة محددة. تُظهر التجارب أن الدوائر المتفرقة (حوالي 0.2% من نموذج GPT-2) يمكنها استعادة قدرة فهم الخطاب في مهام CUDR القائمة على PDTB، وتعمم بشكل جيد على أطر خطابية غير مرئية مثل RST و SDRT.

خلفية البحث والدافع

تعريف المشكلة

البنية الخطابية حاسمة لضمان السلوك الآمن والأخلاقي لنماذج اللغة، لكن يُعرف القليل جداً عن كيفية معالجة نماذج اللغة للخطاب داخلياً، مما يحد من قدرتنا على ضمان موثوقية النموذج والمخرجات الخالية من الأضرار.

أهمية البحث

  1. متطلبات الأمان: فهم الخطاب حاسم للسلوك الآمن والأخلاقي للنموذج
  2. نقص القابلية للتفسير: تفتقر الطرق الحالية إلى فهم عميق لآليات معالجة الخطاب
  3. تحديات التعقيد: تتضمن علاقات الخطاب سياقاً أطول واستدلالاً أكثر تعقيداً من المهام البسيطة

قيود الطرق الموجودة

  1. تصور الانتباه وتوليد التبريرات وغيرها تفتقر إلى التفسيرات الآلية
  2. طرق اكتشاف الدوائر الموجودة تركز بشكل أساسي على المهام البسيطة (مثل المقارنة الرقمية)، وتصعب التكيف المباشر مع علاقات الخطاب
  3. نقص الفهم الموحد عبر الأطر: يفتقد المقارنة على مستوى الآلية بين أطر الخطاب المختلفة

دافع البحث

فتح مسارات جديدة لفهم آليات المهام اللغوية المعقدة من خلال ربط البنية اللسانية للخطاب مع متطلبات اكتشاف الدوائر.

المساهمات الأساسية

  1. اقتراح مهمة CUDR: تصميم مهمة إكمال علاقات الخطاب المناسبة لاكتشاف الدوائر
  2. بناء مجموعات بيانات متعددة الأطر: تغطي PDTB و RST و SDRT وغيرها، مع 27,754 مثالاً
  3. اكتشاف دوائر خطابية: تحديد دوائر متفرقة تمثل فقط 0.2% من الاتصالات لكنها تحقق 90% من الدقة
  4. التعميم عبر الأطر: إثبات أن الدوائر المتعلمة من PDTB تعمم بشكل جيد على أطر خطابية أخرى
  5. بناء هيكل هرمي للدوائر: أول هيكل هرمي خطابي قائم على مكونات الدوائر العصبية
  6. تحليل الميزات اللغوية: الكشف عن الميزات اللغوية التي تلتقطها المستويات المختلفة والاتساق عبر الأطر

شرح الطريقة

تعريف المهمة: CUDR (الإكمال تحت علاقات الخطاب)

تنشئ مهمة CUDR بيئة محكومة لاختبار السلوك الخطابي للنموذج:

صيغة الإدخال:

  • الخطاب الأصلي: dori=(Arg1,Arg2,R,Conn)d_{ori} = (Arg1, Arg2, R, Conn)
  • الخطاب المضاد للواقع: dcf=(Arg1,Arg2,R,Conn)d_{cf} = (Arg1, Arg'_2, R', Conn')

إعداد المهمة:

يرجى اختيار أحد الخيارين التاليين لإكمال الخطاب:
الخيار 1: "يذهب إلى الكافتيريا"
الخيار 2: "الكافتيريا مغلقة"

المراد إكماله: [بوب جائع]_{Arg1} [لذا]_{Conn} → [يذهب إلى الكافتيريا]_{Arg2}

بتغيير أداة الربط الخطابية (من "لذا" إلى "لكن")، يجب أن تتغير تنبؤات النموذج وفقاً لذلك.

طريقة اكتشاف الدوائر

تصحيح التفعيل (Activation Patching)

تعريف تأثير الحافة ee كالتالي: g(e)=L(xcfdo(E=eori))L(xcf)g(e) = L(x_{cf}|do(E = e_{ori})) - L(x_{cf})

حيث LL هو مقياس التقييم، xcfx_{cf} هو الإدخال المضاد للواقع، و eorie_{ori} هو التفعيل في التشغيل الأصلي.

تصحيح نسب الحافة (Edge Attribution Patching)

استخدام تقريب تايلور من الدرجة الأولى لتسريع الحساب: g(e)(zuorizucf)TvL(xcf)g(e) \approx (z^{ori}_u - z^{cf}_u)^T \nabla_v L(x_{cf})

حيث zuoriz^{ori}_u و zucfz^{cf}_u هما التفعيلات في العقدة uu في التشغيلات الأصلية والمضادة للواقع على التوالي، و vL(xcf)\nabla_v L(x_{cf}) هو التدرج عند العقدة vv.

بناء الدوائر الخطابية

  1. تطبيق تصحيح النسب على مجموعة عينات لعلاقة خطابية معينة
  2. حساب متوسط قيمة g(e)g(e) لكل حافة
  3. اختيار أعلى 1000 حافة بالقيمة المطلقة لتشكيل الدائرة

بناء مجموعة البيانات

التغطية متعددة الأطر

إطار الخطابعدد العلاقاتبيانات CUDR
PDTB1311,843
GDTB125,253
GUM-RST176,805
SDRT103,853
الإجمالي5227,754

استراتيجية توليد البيانات المضادة للواقع

استخدام GPT-4o-mini لتوليد Arg2Arg'_2 المضادة للواقع، مع ضمان:

  1. الاتساق مع Arg1Arg1 الأصلي و ConnConn' المضاد للواقع
  2. مطابقة الطول مع Arg2Arg2 الأصلي
  3. التعبير الواضح والبارز عن العلاقة

إعداد التجارب

اختيار النموذج

  • النموذج الرئيسي: GPT-2 متوسط (يتبع الاختيار المعياري في أبحاث اكتشاف الدوائر الموجودة)
  • التحقق الموسع: GPT-2 كبير

مقاييس التقييم

  • درجة الدقة: ΔLpatchΔLfull\frac{\Delta L_{patch}}{\Delta L_{full}} (الدقة المعايرة)
  • الفرق المنطقي: ΔL=L(Arg2)L(Arg2)\Delta L = L(Arg2) - L(Arg'_2)

طرق المقارنة

  1. الدوائر العشوائية: حواف محول عشوائية
  2. دائرة IOI: دائرة التعريف بالكائن غير المباشر (تمثل قدرات نمذجة اللغة العامة)

الهيكل الهرمي للدوائر

بناء هيكل هرمي للدوائر بأسلوب PDTB:

  • L3: علاقات العقد الطرفية (1000 حافة)
  • L2: دمج دوائر L3 متعددة (500+ حافة)
  • L1: دوائر الفئات العليا (200-500 حافة)
  • L0: الدوائر الفوقية (137 حافة)

نتائج التجارب

النتائج الرئيسية

السؤال 1: دقة الدوائر الخطابية

  • دقة قوية: تحقق دوائر L3 و L1 دقة 90% باستخدام حوالي 200 حافة فقط
  • تفوق على المقارنات: تتفوق بشكل ملحوظ على المقارنات العشوائية و IOI
  • تأثير الهرمية: الدوائر الدقيقة (L3) أكثر فعالية في المراحل المبكرة، لكن بتباين أكبر

السؤال 2: قدرة التعميم عبر الأطر

  • تعميم جيد: تعمم دوائر PDTB بفعالية على GDTB و RST و SDRT
  • ترتيب الأداء: Own > L3 > L1 ≈ L0 > IOI > Random (اتجاه متسق)
  • تداخل الدوائر: يرتبط التداخل بين الدوائر عبر الأطر بالأداء بشكل إيجابي (مثل PDTB→GDTB: r=0.44)

السؤال 3: تحليل الميزات اللغوية

اكتشاف أنماط الاستخدام لخمس ميزات لغوية رئيسية:

  1. الجهة (modality): الاستخدام الأوسع
  2. الترادف (synonymy): أكثر استخداماً من التضاد
  3. النفي (negation): استخدام متسق عبر الأطر
  4. التضاد (antonymy): أضعف في العلاقات السببية والزمنية
  5. الإحالة (coreference): الأكثر نشاطاً في علاقات الفئات الموسعة

التحليل الهرمي

  • المستويات المنخفضة: التقاط الميزات اللغوية (الدلالات المعجمية، الإحالة)
  • المستويات العليا: ترميز التجريدات على مستوى الخطاب
  • المناطق المتخصصة بالخطاب: تحتوي الطبقات 8-16 للمصدر والطبقات 10-20 للهدف على حواف متخصصة بالخطاب

دراسات الحالة

يكشف تحليل الحالات الخاطئة عن أوجه قصور في دوائر PDTB عند التعامل مع الكلمات الانفعالية ("يا!") وحذف الفاعل، بينما تتعامل دوائر SDRT بشكل أفضل مع هذه الظواهر.

الأعمال ذات الصلة

نمذجة الخطاب

  • تطور الأطر: الأطر الثلاثة الرئيسية PDTB و RST و SDRT
  • الجهود الموحدة: معيار DISRPT وتحويل الأطر التلقائي
  • طرق التقييم: التقييم القائم على الأسئلة وتوليد البيانات الاصطناعية

القابلية للتفسير الآلية

  • اكتشاف الدوائر: التطبيقات الرئيسية على المهام البسيطة (IOI والمقارنة الرقمية واتفاق الفاعل والفعل وغيرها)
  • قيود الطرق: تصعب الطرق الموجودة التعامل مع ظواهر الخطاب المعقدة
  • مساهمة هذه الورقة: أول تطبيق لاكتشاف الدوائر على فهم الخطاب

الخلاصة والمناقشة

الاستنتاجات الرئيسية

  1. الفعالية المتفرقة: فقط 0.2% من اتصالات النموذج كافية لتحقيق فهم الخطاب
  2. الاتساق عبر الأطر: قد تقوم نماذج اللغة بترميز تمثيل موحد لعلاقات الخطاب
  3. المعالجة الهرمية: المستويات المنخفضة تعالج الميزات اللغوية، والمستويات العليا تعالج التجريدات الخطابية
  4. اتساق الميزات: تبقى فائدة الميزات اللغوية متسقة عبر الأطر

القيود

  1. قيود اللغة: يقتصر البحث على المدونات الإنجليزية
  2. نطاق النموذج: يركز بشكل أساسي على نموذج محول واحد
  3. المقارنة بالدماغ البشري: لا توجد مقارنة مع آليات معالجة الخطاب البشري
  4. جودة البيانات: البيانات المضادة للواقع المولدة بسيطة نسبياً وسهلة الفهم

الاتجاهات المستقبلية

  1. التوسع متعدد اللغات: استكشاف اتساق دوائر الخطاب عبر اللغات
  2. السيناريوهات المعقدة: التوسع إلى أنماط خطاب وحالات غموض أكثر تعقيداً
  3. التطبيقات الموجهة: الاستخدام في كشف التحيز وتوجيه النموذج
  4. توسع الهندسة المعمارية: التكيف مع نماذج اللغة الأكبر حجماً

التقييم المتعمق

المزايا

  1. الابتكار القوي: أول تطبيق لاكتشاف الدوائر على مهمة فهم الخطاب المعقدة
  2. الطريقة الصارمة: تصميم مهمة CUDR ذكي يدعم بفعالية تصحيح التفعيل
  3. التغطية الشاملة: تغطي أطر الخطاب الرئيسية المتعددة مع حجم مجموعة بيانات معقول
  4. التحليل العميق: تحليل متعدد الأبعاد من هرمية الدوائر إلى الميزات اللغوية
  5. التعميم الجيد: نتائج التعميم عبر الأطر مقنعة

أوجه القصور

  1. التعقيد الحسابي: عملية اكتشاف الدوائر كثيفة الاستخدام للحسابات، يصعب توسيعها إلى نماذج أكبر
  2. الاعتماد على البيانات: يعتمد على بيانات مضادة للواقع مولدة بواسطة نماذج لغة كبيرة، قد تدخل انحيازات
  3. قيود التقييم: يعتمد بشكل أساسي على هندسة معمارية نموذج واحدة، التعميم يحتاج التحقق
  4. العمق النظري: يفتقد التفسيرات النظرية لسبب فعالية هذه الدوائر

التأثير

  1. القيمة الأكاديمية: فتح اتجاهات جديدة لأبحاث آليات فهم الخطاب
  2. الإمكانات العملية: يمكن استخدامها في تصحيح النموذج وكشف التحيز وغيرها
  3. المساهمة المنهجية: يمكن توسيع نموذج CUDR إلى مهام NLP معقدة أخرى
  4. الأهمية متعددة التخصصات: ربط أبحاث اللسانيات الحسابية مع أبحاث القابلية للتفسير الآلية

السيناريوهات المناسبة

  1. تحليل النموذج: فهم آليات معالجة الخطاب في نماذج اللغة الكبيرة
  2. كشف الأمان: تحديد التحيزات المحتملة في فهم النموذج للخطاب
  3. تحسين النموذج: توجيه التحسينات المستهدفة لقدرات فهم الخطاب
  4. البحث التعليمي: توفير منظور حسابي للتحقق من نظرية الخطاب

المراجع

تستشهد الورقة بأعمال ذات صلة غنية، بما في ذلك:

  • الأدبيات الكلاسيكية لنظرية الخطاب: Mann & Thompson (1987), Asher & Lascarides (2003)
  • طرق اكتشاف الدوائر: Wang et al. (2023), Conmy et al. (2023)
  • مجموعات بيانات الخطاب: Webber et al. (2019), Liu et al. (2024b)
  • القابلية للتفسير الآلية: Zhang & Nanda (2024), Miller et al. (2024)

التقييم الإجمالي: هذه ورقة بحثية عالية الجودة تتميز بالابتكار في الطريقة وتصميم التجارب وعمق التحليل. من خلال تصميم مهمة CUDR الذكية، نجحت في تطبيق تقنية اكتشاف الدوائر على مهمة فهم الخطاب المعقدة، مما يوفر منظوراً جديداً لفهم الآليات الداخلية لنماذج اللغة. على الرغم من وجود بعض القيود، فإن طبيعتها الرائدة والاكتشافات الغنية تجعلها ذات قيمة أكاديمية وإمكانات عملية مهمة.