Simple stochastic processes behind Menzerath's Law
MiliÄka
This paper revisits Menzerath's Law, also known as the Menzerath-Altmann Law, which models a relationship between the length of a linguistic construct and the average length of its constituents. Recent findings indicate that simple stochastic processes can display Menzerathian behaviour, though existing models fail to accurately reflect real-world data. If we adopt the basic principle that a word can change its length in both syllables and phonemes, where the correlation between these variables is not perfect and these changes are of a multiplicative nature, we get bivariate log-normal distribution. The present paper shows, that from this very simple principle, we obtain the classic Altmann model of the Menzerath-Altmann Law. If we model the joint distribution separately and independently from the marginal distributions, we can obtain an even more accurate model by using a Gaussian copula. The models are confronted with empirical data, and alternative approaches are discussed.
본 논문은 Menzerath 법칙(또는 Menzerath-Altmann 법칙)을 재검토한다. 이 법칙은 언어 구조의 길이와 그 구성 요소의 평균 길이 사이의 관계를 설명한다. 최근 연구에 따르면 단순한 확률 과정이 Menzerath 행동을 나타낼 수 있지만, 기존 모델은 실제 데이터를 정확히 반영하지 못한다. 어휘가 음절과 음소 두 차원에서 길이를 변경할 수 있다는 기본 원리를 채택하면, 이들 변수 간의 상관관계가 완벽하지 않고 변화가 승법적 성질을 가질 때, 이변량 대수정규분포를 얻을 수 있다. 본 논문은 이 매우 단순한 원리에서 출발하여 고전적인 Altmann 모델을 도출할 수 있음을 보여준다. 결합분포와 주변분포를 각각 독립적으로 모델링하면, 가우스 코플라를 사용하여 더 정확한 모델을 얻을 수 있다.