2025-11-15T14:40:11.780900

The Urn of Hill, Lane and Sudderth

Franchini

We review some facts, properties and applications of the urn of Hill, Lane and Sudderth, a paradigmatic model of stochastic process with memory where the urn evolution is as follows: consider an urn of given capacity, at each step a new ball, black or white, is added to the urn with probability that is function (urn function) of the fraction of black balls. The process runs until capacity is reached.

academic

La Urna de Hill, Lane y Sudderth

Información Básica

ID del Artículo: 2506.20826
Título: La Urna de Hill, Lane y Sudderth
Autor: Simone Franchini (Sapienza Università di Roma)
Clasificación: math.PR (Teoría de la Probabilidad)
Fecha de Publicación: 12 de noviembre de 2025 (arXiv v2)
Enlace del Artículo: https://arxiv.org/abs/2506.20826

Resumen

Este artículo revisa sistemáticamente las propiedades y aplicaciones del modelo de urna de Hill, Lane y Sudderth (HLS). Se trata de un modelo paradigmático de procesos estocásticos con memoria: una urna de capacidad dada, en cada paso se añade una bola negra o blanca con probabilidad que es función de la proporción de bolas negras (función de urna), y el proceso continúa hasta que se alcanza la capacidad límite.

Antecedentes de Investigación y Motivación

1. Problema de Investigación

El modelo de urna HLS es una herramienta central para estudiar procesos estocásticos con dependencia de trayectoria, utilizados para describir sistemas dinámicos con efectos de refuerzo (reinforcement). El modelo fue descubierto independientemente por tres grupos de investigadores en los años 1980:

Hill, Lane y Sudderth (1980)
Blum y Brennan (1980)
Arthur, Ermoliev y Kaniovskii (1983)

2. Importancia del Problema

El modelo posee amplio valor de aplicación interdisciplinaria:

Campo Matemático:

Teoría de aproximación estocástica
Teoría de grandes desviaciones
Teoría de campos en redes

Ciencias Sociales:

Teoría de Rendimientos Crecientes de Arthur (Increasing Returns Theory)
Fenómenos de bloqueo tecnológico
Procesos de influencia social

Física y Biología:

Problema de paseos autoevitantes
Modelos de polarización neuronal
Problema de la salchicha de Wiener

3. Limitaciones de la Investigación Existente

Aunque las propiedades básicas de convergencia del modelo HLS han sido estudiadas, los siguientes problemas permanecen sin resolverse completamente:

Integración exacta de funciones generatrices de momentos para funciones de urna no lineales
Soluciones analíticas de ecuaciones diferenciales no lineales de densidad de entropía
Principio completo de grandes desviaciones en el límite termodinámico

4. Motivación de la Investigación

Este artículo tiene como objetivo proporcionar una revisión unificada del modelo HLS, con especial atención a:

Comportamiento de escalado en el límite termodinámico
Principio de grandes desviaciones establecido mediante el marco de teoría de campos en redes
Métodos para reconstruir la función de urna a partir de trayectorias empíricas

Contribuciones Principales

Revisión Sistemática: Integración de propiedades fundamentales del modelo HLS, teoremas de convergencia y escenarios de aplicación
Teoría del Límite Termodinámico:
- Establecimiento de marco de incrustación continua
- Derivación de soluciones explícitas para trayectorias de costo cero
- Provisión de métodos para reconstruir la función de urna a partir de trayectorias
Formulación de Teoría de Campos en Redes:
- Reconstrucción del proceso HLS en forma de integral de trayectoria
- Establecimiento de límite de escalado de la acción (action)
- Demostración del principio de grandes desviaciones de trayectorias muestrales mediante el lema de Varadhan y el teorema de Mogulskii
Ecuaciones No Lineales:
- Provisión de ecuación no lineal para función generatriz de momentos (Ec. 38)
- Provisión de ecuación diferencial no lineal para densidad de entropía (Ec. 42)
Demostración de Aplicaciones:
- Caracterización matemática de la teoría de rendimientos crecientes de Arthur
- Reconstrucción de función de urna a partir de datos experimentales reales (experimento de van de Rijt 2019)

Explicación Detallada de Métodos

Definición de Tareas

Entrada:

Capacidad de urna $T$
Función de urna $\pi: [0,1] \to [0,1]$
Condiciones iniciales $(\psi_0, \tau_0)$

Proceso: En el paso $n$ , cuando la proporción de bolas negras es $\psi_n$ , se añade una bola negra con probabilidad $\pi(\psi_n)$ , y una bola blanca con probabilidad $1-\pi(\psi_n)$

Salida:

Historial completo $\sigma = \{\sigma_n \in \{0,1\}: n \in S\}$
Distribución del punto final $P(\psi_T = x)$
Trayectoria típica $\psi(\tau)$

Arquitectura del Modelo

1. Sistema de Notación Fundamental

Historial de Urna: $\sigma := \{\sigma_n \in \Omega : n \in S\} \in \Omega^S$ donde $\Omega = \{0,1\}$ , $S = \{1 \leq n \leq T\}$

Proporción de Bolas Negras (urn share): $\psi_n := \frac{1}{n}\sum_{n' \leq n} \sigma_{n'}$

Número Total Normalizado de Bolas Negras: $\phi_n := \frac{1}{T}\sum_{n' \leq n} \sigma_{n'}$

Matriz de Transición: $P(\sigma_{n+1} = k | \psi_n) = \pi(\psi_n)\mathbb{I}(k=1) + (1-\pi(\psi_n))\mathbb{I}(k=0)$

2. Ecuación de Aproximación Estocástica

De $E(\sigma_{n+1}|\psi_n) = \pi(\psi_n)$ y la identidad: $\sigma_{n+1} = \psi_n + (n+1)(\psi_{n+1} - \psi_n)$

Se deriva la ecuación central: $E(\psi_{n+1} - \psi_n | \psi_n) = \frac{\pi(\psi_n) - \psi_n}{n+1}$

3. Análisis de Convergencia

El proceso converge al conjunto: $C := \{\psi \in [0,1]: \pi(\psi) = \psi\}$

Condiciones de Estabilidad:

Puntos Estables: $\pi$ cruza la diagonal de arriba hacia abajo (downcrossing)
Puntos Inestables: $\pi$ cruza la diagonal de abajo hacia arriba (upcrossing)

Teoría del Límite Termodinámico

1. Incrustación Continua

Se define la saturación de urna (urn saturation): $\tau_n := n/T$

Límite de escalado: $\lim_{T\to\infty} \tau_n =: \tau \in [0,1]$ $\lim_{T\to\infty} \psi_n =: \psi(\tau)$

Espacio de trayectorias: $Q := \{\phi \in C([0,1]): \partial_\tau \phi(\tau) \in [0,1], \phi(0) = 0\}$

2. Trayectorias de Costo Cero

En el límite de escalado, sustituyendo $E(\sigma_{n+1}|\psi_n) \to \partial_\tau \phi(\tau)$ , se obtiene la ecuación diferencial homogénea: $\partial_\tau \phi(\tau) = \pi(\psi(\tau))$

Transformando a la variable $\psi$ e incorporando condiciones iniciales, se obtiene el problema de Cauchy: $\partial_\tau \psi(\tau) = \frac{\pi(\psi(\tau)) - \psi(\tau)}{\tau}, \quad \psi(\tau_0) = \psi_0$

Solución Analítica: Introduciendo la transformación de función de urna $\Pi(\alpha) := \int \frac{d\alpha}{\pi(\alpha) - \alpha}$

la solución es: $\psi(\tau) = \Pi^{-1}(\Pi(\psi_0) + \log(\tau))$

Fórmula del punto final: $\psi(1) = \Pi^{-1}(\Pi(\psi_0) - \log(\tau_0))$

3. Reconstrucción de Función de Urna

Idea Central: Reconstruir la función de urna a partir de la trayectoria empírica $\{\tau_n, \psi_n\}$

Ecuación fundamental: $\Pi(\psi) - \Pi_0^* = \log\tau(\psi)$

De los datos de trayectoria se puede obtener: $\pi(\psi) = \psi + \tau(\psi)\left(\frac{d\tau(\psi)}{d\psi}\right)^{-1}$

Esto proporciona un método directo para estimar la función de urna a partir de datos experimentales.

Formulación de Teoría de Campos en Redes

1. Forma de Integral de Trayectoria

El promedio de conjunto de cualquier observable: $E(O(\sigma)) = \sum_{\sigma \in \Omega^S} O(\sigma) \frac{\exp(A(\sigma))}{\sum_{\sigma' \in \Omega^S} \exp(A(\sigma'))}$

Acción (Action): $A(\sigma) := \sum_{n \in S} L(\sigma_n, \psi_n)$

Lagrangiano (Lagrangian): $L(\sigma_n, \psi_n) = \sigma_n \log\pi(\psi_n) + (1-\sigma_n)\log(1-\pi(\psi_n))$

2. Límite de Escalado

Acción escalada: $\Phi(\phi) := \int_0^1 d\tau \, \mathcal{L}(\partial_\tau \phi(\tau), \pi(\psi(\tau)))$

Función invariante de escalado: $\mathcal{L}(\alpha, \beta) := \alpha\log\beta + (1-\alpha)\log(1-\beta)$

3. Principio de Grandes Desviaciones

Densidad de Entropía: $\varphi(E^*) := \lim_{T\to\infty} \frac{1}{T}\log P(\sigma \in E)$

Representación Variacional: $\varphi(E^*) = \inf_{\phi \in Q(E^*)} \{\Phi(\phi) - \Phi_0^*(\phi)\}$

donde $\Phi_0^*$ es la función de acción de Mogulskii para el proceso i.i.d.: $\Phi_0^*(\phi) := \int_0^1 d\tau \, \mathcal{L}(\partial_\tau \phi(\tau), \partial_\tau \phi(\tau))$

4. Marco de Demostración

Cambio de Medida: Transformación de medida HLS a medida i.i.d.
Lema de Varadhan: Establecimiento de relación entre acción y densidad de entropía
Teorema de Mogulskii: Determinación de función de velocidad para proceso i.i.d.

Puntos de Innovación Técnica

Marco Unificado: Conexión del modelo HLS con teoría de campos en redes, proporcionando lenguaje matemático unificado
Soluciones Explícitas: Provisión de soluciones en forma cerrada para trayectorias de costo cero mediante transformación de función de urna $\Pi$
Método de Problema Inverso: Reconstrucción de función de urna a partir de trayectoria empírica, conectando reglas microscópicas con dinámicas macroscópicas
Ecuaciones No Lineales:
- Ecuación de función generatriz de momentos: $\pi(\partial_\beta \zeta(\beta)) = \frac{\exp(\zeta(\beta))-1}{\exp(\beta)-1}$
- Ecuación de densidad de entropía: $\pi(x) = \frac{\exp(x\partial_x\varphi(x)-\varphi(x))-1}{\exp(x)-1}$
Lagrangiano Dependiente del Tiempo: Debido a que $\psi_n$ es un promedio en lugar de una suma, el lagrangiano depende explícitamente del "tiempo" $\tau$

Configuración Experimental

Este artículo es principalmente una revisión teórica, pero presenta múltiples casos de aplicación:

Caso 1: Teoría de Rendimientos Crecientes de Arthur (IRT)

Descripción del Modelo:

Dos productos competidores
Cada nuevo cliente consulta un número impar (al menos 3) de clientes anteriores
Selecciona el producto elegido por la mayoría en la muestra

Caracterización Matemática: El modelo puede reducirse al modelo HLS con forma específica de función de urna (véase Figura 5)

Predicciones Teóricas:

Casi seguramente alcanza monopolio (participación de algún producto → 1)
Dependencia de trayectoria: condiciones iniciales determinan el ganador final
Fenómeno de bloqueo

Diseño Experimental:

Participantes responden preguntas, ven estadísticas de respuestas anteriores
Dos grupos experimentales:
- Gráfico izquierdo: 530 personas, conteos iniciales ambos 0
- Gráfico derecho: 3500 personas, opción A con ventaja artificial (110 vs 10, $\psi_0 \approx 91.5\%$ , $\tau_0 \approx 3.4\%$ )

Resultados Observados (Figura 8):

Gráfico izquierdo: trayectorias altamente degeneradas, múltiples preguntas convergen a puntos finales diferentes
Gráfico derecho: inicio tardío elimina degeneración, trayectorias más concentradas

Explicación Teórica: De la fórmula $\psi(1) = \Pi^{-1}(\Pi(\psi_0) - \log\tau_0)$ se puede ver:

$\tau_0 \to 0$ (inicio microscópico): $\log\tau_0 \to -\infty$ , punto final extremadamente sensible a condiciones iniciales
$\tau_0 > 0$ (inicio macroscópico): punto final claramente determinado por condiciones iniciales

Caso 3: Experimento de Gelastopoulos et al. (2024)

La Figura 9 muestra funciones de urna reconstruidas a partir de datos experimentales reales, verificando la efectividad del método de problema inverso de la Sección 2.4.

Resultados Experimentales

Resultados Teóricos Principales

Teorema de Convergencia Fuerte:
- El proceso converge al conjunto de puntos fijos $C = \{\psi: \pi(\psi) = \psi\}$
- Solo los puntos de cruce descendente son estables
Trayectorias de Costo Cero:
- Solución explícita: $\psi(\tau) = \Pi^{-1}(\Pi(\psi_0) + \log(\tau))$
- Para cualquier $\tau_0 > 0$ , el límite de escalado es no degenerado
Principio de Grandes Desviaciones:
- Función de velocidad: $I(\phi) = \Phi(\phi) - \Phi_0^*(\phi)$
- Satisface el LDP completo de trayectorias muestrales

Verificación de Aplicaciones

Modelo IRT (Figura 5):

Trayectorias teóricas coinciden con datos de simulación de Dosi et al. 2018
Predicción exitosa del fenómeno de monopolio

Experimento de Influencia Social (Figura 8):

Explicación cuantitativa del efecto de condiciones iniciales
Mecanismo de eliminación de degeneración por inicio tardío claro

Reconstrucción de Función de Urna (Figura 9):

Estimación exitosa de función de urna a partir de datos experimentales
Verificación de practicidad del método de problema inverso

Descubrimientos Teóricos

Papel Crítico de la Saturación:
- $\tau_0 = 0$ : degeneración completa, condiciones iniciales no pueden predecir punto final
- $\tau_0 > 0$ : degeneración eliminada, trayectoria determinada
Dependencia Temporal:
- Lagrangiano del modelo HLS depende explícitamente de $\tau$
- Diferencia clave con teoría de campos en redes estándar
Problemas No Resueltos:
- Soluciones exactas de ecuaciones no lineales (38) y (42)
- Actualmente solo se pueden usar teoría de perturbaciones y métodos numéricos

Trabajo Relacionado

1. Familia de Modelos de Urna

Urnas Lineales:

Urna de Friedman
Modelo de Bagchi-Pal
Paseo Aleatorio del Elefante (Elephant Random Walk)

Urnas No Lineales:

Modelo IRT de Arthur
Modelos de Adjunción (attachment models)
Modelo KKGW

2. Teoría Matemática

Aproximación Estocástica:

Pemantle (2007): Revisión de procesos estocásticos con refuerzo
Gouet (1993): Teorema del límite central de funcionales de martingala

Teoría de Grandes Desviaciones:

Dembo & Zeitouni (1998): Teoría fundamental
Bryc et al. (2009): Grandes desviaciones de árboles aleatorios
Franchini (2017): Grandes desviaciones para funciones de urna generales

Combinatoria Analítica:

Flajolet et al. (2005, 2006): Urnas analíticas
Morcrette & Mahmoud (2012): Modelos exactamente resolubles

3. Aplicaciones Físicas

Teoría de Campos en Redes:

Jack (2019, 2020): Modelos de cúmulos en crecimiento
Klymko et al. (2017, 2018): Muestreo de sombrilla de trayectorias

Física Estadística:

Problema de paseos autoevitantes
Problema de la salchicha de Wiener
Modelo de captura de Rosenstock

4. Aplicaciones Interdisciplinarias

Economía:

Arthur (1989, 1994): Dependencia de trayectoria y bloqueo
Dosi et al. (1994, 2018): Dinámicas tecnológicas
Gottfried & Grosskinsky (2024): Salarios y rendimiento del capital

Ciencias Sociales:

van de Rijt (2019): Dinámicas de autocorrección en procesos de influencia social
Gelastopoulos et al. (2024): Efecto de mayoría marginal

Biología:

Khanin & Khanin (2001): Polarización neuronal

Conclusiones y Discusión

Conclusiones Principales

El modelo HLS es un modelo paradigmático de procesos estocásticos con memoria, unificando modelos importantes en múltiples campos
Teoría completa en el límite termodinámico:
- Soluciones explícitas para trayectorias de costo cero
- Principio de grandes desviaciones de trayectorias muestrales
- Formulación de teoría de campos en redes
Método de Problema Inverso: Reconstrucción de función de urna a partir de trayectoria empírica, conectando teoría con experimento
Desafío de Ecuaciones No Lineales: Las ecuaciones de función generatriz de momentos y densidad de entropía aún requieren soluciones exactas

Limitaciones

Ausencia de Soluciones Analíticas:
- Las ecuaciones (38) y (42) solo pueden resolverse exactamente en caso lineal
- Caso no lineal depende de teoría de perturbaciones y métodos numéricos
Supuestos Teóricos:
- Función de urna requiere continuidad Hölder
- Conjunto de puntos fijos $C$ debe ser conjunto finito de puntos aislados
Verificación Experimental:
- Principalmente depende de datos experimentales de otros
- Falta diseño experimental sistemático guiado
Complejidad Computacional:
- Cálculo de función de transformación $\Pi$ puede involucrar integrales singulares
- Estabilidad numérica del problema inverso no suficientemente discutida

Direcciones Futuras

Avances Analíticos:
- Búsqueda de soluciones exactas para clases especiales de funciones de urna
- Desarrollo de método sistemático de expansión de perturbaciones
Métodos Numéricos:
- Algoritmos eficientes de integración numérica
- Métodos de estimación robusta para problema inverso
Extensión de Aplicaciones:
- Modelos de urna multicolor
- Funciones de urna dependientes del tiempo
- Modelos de urna en redes
Diseño Experimental:
- Diseño experimental óptimo basado en teoría
- Aprendizaje activo de función de urna

Evaluación Profunda

Fortalezas

Completitud Teórica:
- Derivación completa desde definiciones fundamentales hasta principio de grandes desviaciones
- Marco de teoría de campos en redes proporciona lenguaje unificado
- Existencia y unicidad de soluciones explícitas
Perspectiva Interdisciplinaria:
- Conexión de teoría de probabilidad, física estadística, economía y ciencias sociales
- Demostración de amplia aplicabilidad del modelo
- Casos de aplicación práctica abundantes
Innovación Metodológica:
- Método de problema inverso novedoso y práctico
- Introducción ingeniosa de función de urna transformada $\Pi$
- Interpretación profunda de saturación $\tau$ como "tiempo"
Claridad de Escritura:
- Sistema de notación consistente
- Pasos de derivación detallados
- Ilustraciones intuitivas y efectivas
Combinación de Teoría y Experimento:
- Explicación cuantitativa convincente del experimento de van de Rijt
- Figura 8 demuestra predicción teórica precisa del fenómeno de eliminación de degeneración

Insuficiencias

Problemas No Resueltos Prominentes:
- Ecuaciones no lineales centrales sin soluciones analíticas
- Limita completitud y practicidad de la teoría
Métodos Numéricos Insuficientes:
- Falta descripción específica de algoritmos numéricos
- Análisis de error y estabilidad del problema inverso no discutidos
- No se proporciona código reproducible
Verificación Experimental Limitada:
- Principalmente depende de datos de literatura
- Falta diseño experimental original
- Verificación estadística de ajuste de modelo insuficiente
Detalles Técnicos:
- Condiciones técnicas de incrustación continua (continuidad Hölder) insuficientemente discutidas
- Condiciones de verificación del lema de Varadhan (continuidad) tratadas superficialmente
- Tratamiento riguroso de casos límite ( $\tau_0 = 0$ ) ausente
Guía de Aplicación:
- Falta guía para que profesionales elijan función de urna
- Métodos estadísticos de estimación de parámetros del modelo incompletos
- Evaluación cuantitativa de precisión de predicción ausente

Influencia

Contribución Académica:
- Proporciona revisión autorizada del modelo HLS
- Formulación de teoría de campos en redes abre nuevas direcciones de investigación
- Método de problema inverso tiene valor metodológico
Valor Práctico:
- Base teórica para diseño de experimentos en ciencias sociales
- Modelado de adopción tecnológica y dinámicas de mercado
- Modelos de procesos neurológicos y biológicos
Reproducibilidad:
- Derivaciones teóricas detalladas y reproducibles
- Pero falta código y datos
- Implementación numérica requiere desarrollo por parte del lector
Inspiración para Investigación:
- Resolución de ecuaciones no lineales es problema abierto claro
- Generalización multicolor tiene trayectoria clara
- Versión en red merece exploración

Escenarios de Aplicabilidad

Investigación Teórica:
- Teoría de procesos estocásticos
- Teoría de grandes desviaciones
- Aplicaciones de teoría de campos en redes
Ciencias Sociales:
- Influencia social y comportamiento de conformidad
- Adopción tecnológica y difusión de innovación
- Competencia de cuota de mercado
Economía:
- Rendimientos crecientes y dependencia de trayectoria
- Efectos de bloqueo y competencia de estándares
- Efectos de red
Sistemas Biológicos:
- Polarización celular
- Toma de decisiones colectiva
- Dinámicas evolutivas
Aplicaciones Físicas:
- Procesos de crecimiento
- Modelos de agregación
- Fenómenos de autoorganización

Referencias (Seleccionadas)

Literatura Fundamental:

Hill, Lane, Sudderth (1980): A strong law for some generalized urn processes
Arthur, Ermoliev, Kaniovski (1983): A generalized urn problem and its applications
Franchini (2017): Large deviations for generalized Polya urns with arbitrary urn function

Herramientas Teóricas: 4. Dembo & Zeitouni (1998): Large Deviations Techniques and Applications 5. Pemantle (2007): A survey of random processes with reinforcement

Casos de Aplicación: 6. Arthur (1989, 1994): Increasing Returns and Path Dependence 7. van de Rijt (2019): Self-correcting dynamics in social influence processes 8. Gelastopoulos et al. (2024): The marginal majority effect

Evaluación General: Este es un artículo de revisión de alta calidad que proporciona un marco teórico completo para el modelo de urna HLS desde fundamentos hasta investigación de vanguardia. La formulación de teoría de campos en redes y el método de problema inverso son innovaciones importantes, y las aplicaciones interdisciplinarias demuestran amplio valor del modelo. Las principales insuficiencias son la ausencia de soluciones analíticas para ecuaciones no lineales centrales, y la necesidad de fortalecer métodos numéricos y verificación experimental. Para investigadores en teoría de probabilidad, física estadística e investigación interdisciplinaria, este es un artículo de lectura obligatoria.