Simple stochastic processes behind Menzerath's Law
MiliÄka
This paper revisits Menzerath's Law, also known as the Menzerath-Altmann Law, which models a relationship between the length of a linguistic construct and the average length of its constituents. Recent findings indicate that simple stochastic processes can display Menzerathian behaviour, though existing models fail to accurately reflect real-world data. If we adopt the basic principle that a word can change its length in both syllables and phonemes, where the correlation between these variables is not perfect and these changes are of a multiplicative nature, we get bivariate log-normal distribution. The present paper shows, that from this very simple principle, we obtain the classic Altmann model of the Menzerath-Altmann Law. If we model the joint distribution separately and independently from the marginal distributions, we can obtain an even more accurate model by using a Gaussian copula. The models are confronted with empirical data, and alternative approaches are discussed.
تعيد هذه الورقة النظر في قانون مينزيراث (يُعرف أيضاً بقانون مينزيراث-ألتمان)، الذي يصف العلاقة بين طول التراكيب اللغوية والطول المتوسط لمكوناتها. تشير الأبحاث الحديثة إلى أن العمليات العشوائية البسيطة يمكن أن تظهر سلوك مينزيراث، لكن النماذج الحالية لا تعكس بدقة البيانات الواقعية. إذا اعتمدنا على المبدأ الأساسي بأن المفردات يمكن أن تغير طولها على بُعدين (المقاطع والفونيمات)، حيث تكون الارتباطات بين هذه المتغيرات غير كاملة والتغييرات ذات طبيعة ضربية، يمكننا الحصول على توزيع لوغاريتمي طبيعي ثنائي المتغير. توضح هذه الورقة أنه من هذا المبدأ البسيط جداً، يمكننا الحصول على نموذج ألتمان الكلاسيكي. إذا قمنا بنمذجة التوزيع المشترك والتوزيعات الهامشية بشكل مستقل، يمكننا استخدام كوبولا غاوسي للحصول على نموذج أكثر دقة.
المشكلة المراد حلها: قانون مينزيراث هو قانون مهم في اللسانيات يصف العلاقة العكسية بين طول التراكيب اللغوية (مثل المفردات) والطول المتوسط لمكوناتها. على الرغم من التحقق الواسع من هذا القانون تجريبياً، إلا أنه يفتقر إلى تفسير نظري مرضٍ وأساس عملية عشوائية.
أهمية المشكلة: يحظى قانون مينزيراث باهتمام كبير في مجتمع اللسانيات الكمية بسبب عموميته وقدرته على دمج مستويات تقسيم مختلفة في إطار موحد. يعتبر فهم العمليات العشوائية الكامنة وراءه ذا أهمية حيوية لنظرية تطور اللغة واللسانيات الكمية.
قيود الطرق الموجودة:
أظهرت دراسة تور وآخرون (2021) أن العمليات العشوائية البسيطة يمكن أن تظهر سلوك مينزيراث، لكن النموذج لا ينطبق على البيانات الحقيقية
يفتقر نموذج ألتمان الكلاسيكي (1980) إلى اشتقاق العملية العشوائية وتفسير المعاملات
تركز النماذج الموجودة بشكل أساسي على عملية إنتاج النصوص، متجاهلة آليات تحديد طول المفردات في تطور اللغة
الدافع البحثي: يعتقد المؤلف أنه يجب فهم قانون مينزيراث من منظور تطور اللغة وليس من منظور إنتاج النصوص، واقتراح شرح الأساس العشوائي للقانون من خلال نمذجة التوزيع المشترك.
Altmann, G. (1980). Prolegomena to Menzerath's law
Menzerath, P. (1954). Die Architektonik des deutschen Wortschatzes
Torre, I. G., et al. (2021). Can Menzerath's law be a criterion of complexity in communication?
Milička, J. (2023). Menzerath's law: Is it just regression toward the mean?
تقدم هذه الورقة مساهمة نظرية مهمة لأبحاث قانون مينزيراث، وتوفر منظوراً جديداً لفهم القانون الكلاسيكي من خلال نمذجة العملية العشوائية، وتتمتع بقيمة أكاديمية وعملية عالية.