This paper proposes a modeling framework for dynamic topic evolution based on temporal large language models. The method first uses a large language model to obtain contextual embeddings of text and then introduces a temporal decay function and an attention mechanism. These components allow the model to adjust the importance of semantic units according to time intervals and capture topic variations across different periods. The temporal representations are then mapped into a latent topic space, where a state transition matrix is applied to describe the dynamic evolution of topics. A joint optimization objective constrains both semantic modeling and temporal consistency, ensuring diversity and smoothness in topic generation. The design emphasizes the unified modeling of semantic representation and temporal evolution, which improves topic coherence and diversity while enhancing stability and interpretability over time. Experiments on real-world corpora show that the framework effectively captures the generation, expansion, and decline of topics and outperforms existing models across multiple metrics. Overall, the proposed method provides a systematic solution for understanding dynamic semantic patterns in large-scale text, enriches the research paradigm of topic modeling, and supports complex text analysis tasks in multiple domains.
- معرّف الورقة: 2510.10613
- العنوان: Dynamic Topic Evolution with Temporal Decay and Attention in Large Language Models
- المؤلفون: Di Wu (جامعة جنوب كاليفورنيا)، Shuaidong Pan (جامعة كارنيجي ميلون)
- التصنيف: cs.CL cs.AI
- وقت النشر/المؤتمر: نسخة أولية عام 2024
- رابط الورقة: https://arxiv.org/abs/2510.10613
تقترح هذه الورقة إطار عمل لنمذجة تطور الموضوعات الديناميكي بناءً على نماذج اللغة الكبيرة الزمنية. تستخدم الطريقة أولاً نموذج لغة كبير للحصول على تمثيلات التضمين السياقية للنصوص، ثم تقدم دالة التحلل الزمني وآليات الانتباه، مما يمكّن النموذج من تعديل أهمية الوحدات الدلالية وفقاً للفترات الزمنية والتقاط تغييرات الموضوع عبر فترات مختلفة. يتم بعد ذلك تعيين التمثيلات الزمنية إلى فضاء الموضوع الكامن، حيث تصف مصفوفة انتقال الحالة التطور الديناميكي للموضوعات. يوازن الهدف المُحسّن بشكل مشترك بين قيود النمذجة الدلالية والاتساق الزمني، مما يضمن تنوع الموضوعات وسلاستها. يؤكد هذا التصميم على النمذجة الموحدة للتمثيل الدلالي والتطور الزمني، مما يحسّن التماسك والتنوع في الموضوعات، مع تعزيز الاستقرار الزمني والقابلية للتفسير.
يهدف هذا البحث إلى حل القيود الأساسية للطرق التقليدية في نمذجة الموضوعات عند التعامل مع البيانات النصية الديناميكية:
- مشكلة الافتراض الثابت: تعتمد الطرق التقليدية مثل LDA على افتراضات ثابتة، وغير قادرة على التقاط تغيير الموضوعات عبر الزمن
- غياب المعلومات الزمنية: على الرغم من أن نماذج اللغة الكبيرة الحالية تتمتع بقدرات تمثيل دلالي قوية، إلا أنها تتجاهل البعد الزمني
- نمذجة التطور الديناميكي: في الواقع، تمر الموضوعات بعمليات ديناميكية مثل الظهور والتوسع والدمج أو الاضمحلال
- احتياجات المجالات الحساسة: في المجالات المالية والطبية ومراقبة الرأي العام، يعتبر فهم كيفية تطور الموضوعات عبر الزمن حاسماً للتنبؤ بالاتجاهات ودعم القرارات
- بناء الأنظمة المعرفية: تعتبر نمذجة تطور الموضوعات الديناميكي جوهرية لفهم كيفية بناء الأنظمة المعرفية البشرية
- تفسير الديناميكيات الاجتماعية: تعتبر نمذجة الموضوعات الزمنية طريقة رئيسية لتفسير منطق الديناميكيات الاجتماعية في عصر المعلومات
- نماذج الموضوعات التقليدية: تعتمد طرق مثل LDA على تكرار الكلمات والتزامن، وغير قادرة على عكس المسارات الدلالية
- نماذج اللغة الثابتة: تفتقر BERT و DeBERTa وغيرها إلى آليات نمذجة زمنية
- عدم كفاية الاتساق الزمني: تواجه الطرق الموجودة صعوبة في ضمان سلاسة تحولات الموضوعات
- اقتراح إطار عمل نموذج لغة كبير يدرك الزمن: دمج دوال التحلل الزمني وآليات الانتباه في نموذج لغة كبير للنمذجة الديناميكية للموضوعات للمرة الأولى
- تصميم معمارية نمذجة دلالية-زمنية موحدة: تحقيق نمذجة التطور الديناميكي في فضاء الموضوع من خلال مصفوفة انتقال الحالة
- بناء هدف تحسين مشترك: موازنة قيود تعلم التمثيل الدلالي ونمذجة السلاسل الزمنية، مما يضمن تنوع الموضوعات وسلاستها الزمنية
- تحقيق تحسينات كبيرة على مؤشرات متعددة: تحسن واضح مقارنة بالطرق الموجودة في الحيرة والتنوع والتماسك الموضوعي والاستقرار
بالنظر إلى تسلسل نصي زمني X={x1,x2,...,xT}، الهدف هو تعلم نموذج قادر على:
- التقاط تمثيلات النصوص الدلالية
- نمذجة آليات الانتقال التي تصف التطور الديناميكي للموضوعات عبر الزمن
- توليد توزيعات موضوعات متسقة زمنياً ومتماسكة دلالياً
تعيين النصوص المدخلة إلى متجهات تضمين حساسة للسياق من خلال طبقة الترميز لنموذج اللغة الكبير:
H=f(X)={h1,h2,...,hT},ht∈Rd
حيث يمثل f نموذج لغة معاملي، و ht هو متجه دلالي للكلمة t.
لالتقاط التطور الديناميكي في البعد الزمني، نقدم عامل التحلل الزمني:
αij=∑k=1Texp(g(tik)⋅dhiThk)exp(g(tij)⋅dhiThj)
حيث يمثل tij الفترة الزمنية بين وحدتي نص، و g(⋅) هي دالة الوزن الزمني، مصممة بشكل تحلل أسي g(t)=e−λt.
تعيين التمثيل الدلالي الحساس للزمن إلى فضاء الموضوع الكامن:
θi=softmax(Whi+b),θi∈RK
حيث يمثل W و b معاملات قابلة للتعلم، و θi هو متجه التوزيع للمستند i على K موضوع.
استخدام مصفوفة انتقال الحالة لنمذجة التغيير الديناميكي للموضوعات عبر الزمن:
At+1=ΦAt+ϵt,Φ∈RK×K
حيث تمثل Φ مصفوفة انتقال الموضوعات، و ϵt هي حد الضوضاء الغاوسية الذي يصف عدم اليقين في التطور.
- الابتكار: دمج آلية التحلل الزمني مباشرة في حساب الانتباه لنموذج اللغة الكبير للمرة الأولى
- المنطقية: تبرز دالة التحلل الأسي تأثير الدلالات الحديثة، مع إضعاف تأثير الدلالات البعيدة
تصميم دالة الهدف المُحسّن بشكل مشترك:
L=∑i=1N∑k=1Kyiklog(θik)+λ∑t=1T−1∣∣At+1−ΦAt∣∣22
- الحد الأول: خسارة الاحتمالية اللوغاريتمية بناءً على توزيع الموضوعات
- الحد الثاني: قيد الاتساق الزمني
- معامل الوزن λ: موازنة تعلم التمثيل الدلالي ونمذجة التطور الديناميكي
استخدام مجموعة بيانات 20 Newsgroups:
- الحجم: تتضمن مقالات من 20 مجموعة أخبار مختلفة
- الخصائص: تغطي مجالات متعددة مثل المجتمع والعلوم والتكنولوجيا والترفيه
- الخصائص الزمنية: تمت معالجتها وتجميعها بعناية، محافظة على التمييز بين المجالات والخصائص الزمنية
- الحيرة (Perplexity): قياس قدرة النموذج على التنبؤ
- التنوع (Diversity): تقييم درجة تنوع الموضوعات
- التماسك الموضوعي (Topic Coherence): قياس الاتساق الدلالي للكلمات داخل الموضوع
- استقرار الموضوع (Topic Stability): تقييم سلاسة تطور الموضوع عبر الزمن
- LDA: تخصيص ديريشليت الكامن التقليدي
- BERT: نمذجة موضوعات قائمة على BERT
- DeBERTa: متغير BERT المحسّن
- Topic Audiolization: الكشف عن الموضوعات بناءً على الصوتيات
- T3: طريقة نمذجة الموضوعات الزمنية
| النموذج | الحيرة | التنوع | التماسك الموضوعي | استقرار الموضوع |
|---|
| LDA | 950.3 | 0.62 | 0.41 | 0.48 |
| BERT | 730.5 | 0.68 | 0.46 | 0.55 |
| DeBERTa | 702.7 | 0.71 | 0.50 | 0.60 |
| Topic Audiolization | 680.4 | 0.71 | 0.50 | 0.60 |
| T3 | 655.8 | 0.73 | 0.52 | 0.62 |
| طريقة هذه الورقة | 598.2 | 0.78 | 0.57 | 0.69 |
الاكتشافات الرئيسية:
- تحقق طريقة هذه الورقة أفضل أداء على جميع المؤشرات
- انخفاض الحيرة بنسبة 8.8% مقارنة بأفضل طريقة أساسية
- تحسن ملحوظ في استقرار الموضوع، بزيادة 11.3% مقارنة بطريقة T3
أظهرت نتائج التجارب:
- 128-768 بُعد: يزداد التماسك الموضوعي والتنوع مع زيادة البُعد
- 768 بُعد: تحقيق أفضل نقطة توازن في الأداء
- 1024 بُعد: انخفاض طفيف في الأداء، مما يشير إلى أن الأبعاد العالية جداً تدخل ضوضاء
- طول التسلسل 200: تحقيق أقل قيمة حيرة
- الطول المتوسط: تحقيق ذروة التنوع
- التسلسلات الطويلة جداً: قد تدخل معلومات زائدة، مما يؤثر على فعالية النمذجة
- فعالية آلية الزمن: يحسّن إدخال التحلل الزمني بشكل كبير استقرار الموضوع
- أهمية اختيار البُعد: يعتبر اختيار بُعد طبقة مخفية مناسب حاسماً لموازنة سعة النموذج والكفاءة
- تحسين طول التسلسل: يوجد نافذة زمنية مثالية، والتسلسلات القصيرة جداً أو الطويلة جداً تؤثر على الأداء
- التوجيه بالمسارات المنظمة: تحسين الاتساق المنطقي لتوليد النصوص
- آليات التوجيه الديناميكي: تعزيز التكيف المعرفي داخل نماذج اللغة الكبيرة
- دمج الرسوم البيانية المعرفية: تعزيز قدرات الاستدلال المنظم
- التكيف الفعال للمعاملات: تحقيق تحديثات نموذج مرنة من خلال المحولات
بالمقارنة مع الأعمال الموجودة، تحقق هذه الورقة للمرة الأولى:
- النمذجة الموحدة للتمثيل الدلالي والتطور الزمني
- آلية تحلل زمني صريحة
- إطار عمل شامل للتطور الديناميكي للموضوعات
- يحل الإطار الحساس للزمن المقترح بفعالية القيود الثابتة لنمذجة الموضوعات التقليدية
- يحسّن الجمع بين التحلل الزمني وآليات الانتباه بشكل كبير قدرة نمذجة تطور الموضوعات
- تضمن استراتيجية التحسين المشترك التوازن بين جودة الدلالات والاتساق الزمني
- التعقيد الحسابي: تزيد آلية الانتباه الزمني من التكلفة الحسابية
- حساسية المعاملات: يتطلب معامل التحلل الزمني λ تحسيناً لكل مجموعة بيانات
- التبعيات طويلة الأجل: لا تزال القدرة على نمذجة السلاسل الزمنية الطويلة جداً محدودة
- نمذجة زمنية متعددة الأبعاد: دمج الأحداث الخارجية والهياكل السببية
- التوسع متعدد اللغات: اختبار التكيف على النصوص متعددة اللغات والمجالات المختلفة
- التكامل متعدد الأنماط: التوسع إلى بيئات معلومات أكثر تعقيداً
- ابتكار الطريقة قوي: دمج التحلل الزمني مباشرة في آلية الانتباه لنموذج اللغة الكبير للمرة الأولى
- تصميم التجارب شامل: يتضمن تجارب مقارنة كافية وأبحاث استئصال
- قوة النتائج: تحسينات كبيرة ومتسقة على مؤشرات متعددة
- قيمة تطبيقية عالية: إمكانية التطبيق المباشر في المجالات المالية والطبية ومراقبة الرأي العام
- قيود مجموعة البيانات: التحقق فقط على 20 Newsgroups، يفتقر إلى تقييم على نطاق أوسع وأكثر تنوعاً
- عدم كفاية التحليل النظري: غياب التحليل النظري لاختيار دالة التحلل الزمني
- غياب مناقشة الكفاءة الحسابية: عدم توفير تحليل تفصيلي للتعقيد الحسابي ومقارنة الكفاءة
- عدم كفاية التوجيه لتحسين المعاملات: غياب التوجيه المنهجي لاختيار المعاملات الفائقة الرئيسية
- المساهمة الأكاديمية: توفير نموذج بحثي جديد لنمذجة الموضوعات الديناميكية
- القيمة العملية: التطبيق المباشر في تحليل النصوص الفورية والتنبؤ بالاتجاهات
- قابلية الاستنساخ: وصف الطريقة واضح، لكن تنقصه معلومات نشر الكود
- تحليل وسائل الإعلام الإخبارية: تتبع مسارات تطور الموضوعات الساخنة
- استخراج الأدبيات الأكاديمية: اكتشاف اتجاهات تطور مجالات البحث
- مراقبة وسائل التواصل الاجتماعي: المراقبة الفورية لتغييرات الرأي العام
- تحليل الذكاء التجاري: تحليل تغييرات اتجاهات السوق واهتمامات المستهلكين
تستشهد الورقة بـ 26 مرجعاً ذا صلة، تغطي مجالات بحثية متعددة بما فيها نمذجة الموضوعات التقليدية ونماذج اللغة الكبيرة والنمذجة الزمنية، مما يوفر أساساً نظرياً متيناً لمسار العمل التقني للورقة.
التقييم الشامل: هذه ورقة ذات مساهمة مهمة في مجال نمذجة الموضوعات الديناميكية، حيث تحل بشكل مبتكر القيود الثابتة للطرق التقليدية من خلال دمج آليات زمنية في نماذج اللغة الكبيرة. على الرغم من وجود مجال للتحسين في نطاق التجارب والتحليل النظري، فإن الابتكار التقني والقيمة العملية تجعلها تقدماً مهماً في هذا المجال.