Pathwise guessing in categorical time series with unbounded alphabets
Chazottes, Gallo, Takahashi
The following learning problem arises naturally in various applications: Given a finite sample from a categorical or count time series, can we learn a function of the sample that (nearly) maximizes the probability of correctly guessing the values of a given portion of the data using the values from the remaining parts? Unlike classical approaches in statistical inference, our approach avoids explicitly estimating the conditional probabilities.
We propose a non-parametric guessing function with a learning rate independent of the alphabet size. Our analysis focuses on a broad class of time series models that encompasses finite-order Markov chains, some hidden Markov chains, Poisson regression for count processes, and one-dimensional Gibbs measures.
We provide a margin condition that controls the rate of convergence for the risk. Additionally, we establish a minimax lower bound for the convergence rate of the risk associated with our guessing problem. This lower bound matches the upper bound achieved by our estimator up to a logarithmic factor, demonstrating its near-optimality.
academic
التخمين على طول المسار في السلاسل الزمنية الفئوية ذات الأبجديات غير المحدودة
تدرس هذه الورقة مشكلة تعلم تنشأ بشكل طبيعي في تطبيقات متعددة: بالنظر إلى عينة محدودة من سلسلة زمنية فئوية أو عد، هل يمكن تعلم دالة عينة تزيد (تقريباً) من احتمالية التنبؤ الصحيح بقيم الجزء المتبقي من البيانات بناءً على الجزء المعطى؟ بخلاف طرق الاستدلال الإحصائي الكلاسيكية، تتجنب الطريقة المقترحة تقدير الاحتمالات الشرطية بشكل صريح. يقدم المؤلفون دالة تخمين غير معاملية بمعدل تعلم مستقل عن حجم الأبجدية، مع تحليل يغطي فئات واسعة من نماذج السلاسل الزمنية بما في ذلك سلاسل ماركوف ذات الرتبة المحدودة، وبعض السلاسل الخفية، والانحدار بواسون لعمليات العد، والقياسات جيبس أحادية البعد.
الدافع التطبيقي: التنبؤ والاستيفاء مشاكل أساسية في العلوم، مع تطبيقات واسعة في السلاسل الزمنية الفئوية، خاصة في سياق ظهور نماذج اللغة الكبيرة، التي يمكن اعتبارها نماذج سلاسل زمنية فئوية بأبجديات كبيرة.
قيود الطرق التقليدية:
تعتمد الطرق الكلاسيكية على تقديرات نقطية لجميع احتمالات الانتقال
عندما يكون حجم الأبجدية كبيراً أو احتمالات الانتقال صغيرة، يصبح التخمين صعباً
يتطلب تقدير دقيق للأحداث النادرة كمية كبيرة من البيانات، وهو غير عملي في الممارسة
التحديات الموجودة:
حجم الأبجدية ورتبة الاعتماد عادة ما تكون عالية جداً
الحاجة إلى التعامل مع نماذج ذات اعتماد وحجم أبجدية غير محدود
قد تواجه الطرق التقليدية صعوبة في تقدير احتمالات جميع الانتقالات الممكنة في حالة الأبجديات الكبيرة
يقترح المؤلفون طريقة أكثر عملية: التركيز على الأحداث الأكثر احتمالاً، أي التنبؤ بالنتائج الأكثر احتمالاً، مع إعطاء وزن أقل للأحداث النادرة وغير المحتملة. هذه الطريقة مناسبة بشكل خاص للتعامل مع التسلسلات ذات المجموعات الرمزية الكبيرة أو اللانهائية.
بالنظر إلى نسختين مستقلتين متطابقتي التوزيع من العمليات (Xj)j∈Z و (Yj)j∈Z، الهدف هو استخدام معلومات مجموعة البيانات D للتنبؤ بالقيم على مجموعة التخمين G.
تستشهد الورقة بـ 26 مرجعاً ذا صلة، تغطي نظرية سلاسل ماركوف، نظرية التعلم الإحصائي، الأنظمة الديناميكية ونظرية الاحتمالات، مما يوفر أساساً نظرياً متيناً لهذه الورقة.