2025-11-13T00:34:10.513475

Compositional Symmetry as Compression: Lie Pseudogroup Structure in Algorithmic Agents

Ruffini

In the algorithmic (Kolmogorov) view, agents are programs that track and compress sensory streams using generative programs. We propose a framework where the relevant structural prior is simplicity (Solomonoff) understood as \emph{compositional symmetry}: natural streams are well described by (local) actions of finite-parameter Lie pseudogroups on geometrically and topologically complex low-dimensional configuration manifolds (latent spaces). Modeling the agent as a generic neural dynamical system coupled to such streams, we show that accurate world-tracking imposes (i) \emph{structural constraints} -- equivariance of the agent's constitutive equations and readouts -- and (ii) \emph{dynamical constraints}: under static inputs, symmetry induces conserved quantities (Noether-style labels) in the agent dynamics and confines trajectories to reduced invariant manifolds; under slow drift, these manifolds move but remain low-dimensional. This yields a hierarchy of reduced manifolds aligned with the compositional factorization of the pseudogroup, providing a geometric account of the ``blessing of compositionality'' in deep models. We connect these ideas to the Spencer formalism for Lie pseudogroups and formulate a symmetry-based, self-contained version of predictive coding in which higher layers receive only \emph{coarse-grained residual transformations} (prediction-error coordinates) along symmetry directions unresolved at lower layers.

academic

Simetría Composicional como Compresión: Estructura de Pseudogrupo de Lie en Agentes Algorítmicos

Información Básica

ID del Artículo: 2510.10586
Título: Compositional Symmetry as Compression: Lie Pseudogroup Structure in Algorithmic Agents
Autor: Giulio Ruffini (Neuroelectrics, Starlab, BCOM, Barcelona, España)
Clasificación: cs.LG cs.AI cs.IT math.IT q-bio.NC
Fecha de Publicación/Conferencia: Bajo Revisión - Proceedings Track 2025
Enlace del Artículo: https://arxiv.org/abs/2510.10586

Resumen

Este artículo, basado en el marco de la teoría de la información algorítmica (teoría de Kolmogorov), propone que los agentes inteligentes son programas que rastrean y comprimen flujos sensoriales mediante la generación de programas. Los autores presentan un marco que interpreta los priors estructurales relevantes como simetrías composicionales: los flujos de datos naturales pueden describirse adecuadamente mediante acciones locales de pseudogrupos de Lie de parámetros finitos en variedades de configuración de baja dimensión geométrica y topológicamente complejas. Al modelar agentes como sistemas dinámicos neurales universales acoplados a tales flujos de datos, el artículo demuestra que el rastreo preciso del mundo requiere: (1) restricciones estructurales—equivarianza de las ecuaciones constitutivas del agente y lecturas; (2) restricciones dinámicas—bajo entrada estática, la simetría induce cantidades conservadas en la dinámica del agente y restringe trayectorias a variedades invariantes de dimensión reducida. Esto produce una jerarquía de variedades de dimensión reducida alineada con la descomposición composicional del pseudogrupo, proporcionando una explicación geométrica de la "bendición de la composicionalidad" en modelos profundos.

Antecedentes de Investigación y Motivación

Problema Central

El problema central que este artículo aborda es: ¿Cómo construir un marco teórico basado en simetría para agentes algorítmicos que les permita comprimir y rastrear efectivamente flujos de datos naturales con estructura composicional?

Importancia de la Investigación

Compresión y Descubrimiento de Estructura: Dentro del marco de la teoría de Kolmogorov, la tarea central del agente es construir modelos comprimidos para entender el entorno, mientras que la simetría proporciona un mecanismo de compresión estructurado natural
Fundamentos Teóricos del Aprendizaje Profundo: Proporciona una explicación teórica matemática para la complejidad de muestra superior de los modelos profundos en tareas jerárquicas
Fundamentos Geométricos de la Codificación Predictiva: Proporciona un marco teórico geométrico basado en simetría para la codificación predictiva

Limitaciones de Métodos Existentes

Insuficiencia de Hipótesis de Variedad: Tener solo un prior de variedad sin estructura geométrica de cobertura adicional es insuficiente
Falta de Teoría de Compresión Estructurada: Los métodos existentes carecen de un marco teórico unificado que integre simetría, compresión y aprendizaje jerárquico
Falta de Fundamentos Matemáticos en Codificación Predictiva: La codificación predictiva tradicional carece de formalización matemática rigurosa

Contribuciones Principales

Propone un marco de modelo generativo basado en pseudogrupos de Lie: Define modelos generativos como acciones locales de pseudogrupos de Lie de parámetros finitos en variedades de configuración
Establece teoría de dinámica de rastreo del mundo con restricciones de simetría: Demuestra que el rastreo preciso requiere restricciones de equivarianza y cantidades conservadas tipo Noether
Construye teoría geométrica de reducción dimensional jerárquica: Establece estructura jerárquica de variedades invariantes anidadas mediante descomposición composicional de pseudogrupos
Proporciona implementación de codificación predictiva basada en simetría: Formaliza procesamiento predictivo jerárquico donde niveles superiores reciben solo transformaciones residuales coarse-grained
Conecta con teoría formalista de Spencer: Vincula el complejo de Spencer de pseudogrupos de Lie con la estructura jerárquica del agente

Detalles del Método

Definición de Tarea

La tarea central estudiada en este artículo es construir agentes algorítmicos capaces de rastrear y comprimir flujos de datos sensoriales con simetría composicional. La entrada es un flujo de datos generado por un pseudogrupo de Lie, y la salida es la representación de estado interno del agente y su desempeño en rastreo del mundo.

Marco Teórico

1. Definición de Modelo Generativo

Definición 1 (Modelo Generativo): Un modelo generativo es un mapeo suave de una variedad de configuración M-dimensional C al espacio de observación R^X:

f: C → R^X, I = f(c)

Definición 2 (Modelo Generativo de Lie): Si existe un pseudogrupo de Lie G actuando sobre C y R^X tal que para cualquier c ∈ C, existe γ ∈ G satisfaciendo:

c = γ·c₀, f(c) = γ·I₀

entonces f se denomina modelo generativo de Lie.

2. Dinámica de Rastreo del Mundo

El estado de alta dimensión del agente x ∈ R^X obedece la ecuación de red neuronal:

ẋ = F(x; w, I_θ(t))  (2)

La restricción de rastreo del mundo es:

p(x(t)) ≈ I_θ(t)  (3)

3. Requisitos de Equivarianza

El rastreo efectivo requiere que la dinámica interna respete la misma acción de grupo:

∀γ ∈ G: f(γ·x; w, γ·I_θ) = γ·f(x; w, I_θ)
p(γ·x) = γ·p(x)  (4)

Puntos de Innovación Técnica

1. Estructura Recursiva de Simetría Composicional

Utilizando el mapeo exponencial del pseudogrupo de Lie, transformaciones complejas pueden descomponerse como:

γ = exp(∑ᵣₖ₌₁ θₖTᵏ)

Esto proporciona parametrización composicional recursiva, realizando compresión estructurada.

2. Cantidades Conservadas tipo Noether

Bajo entrada estática, la equivarianza conduce a invariancia de lectura: p(x) = const, cada canal de lectura define una cantidad conservada, y las trayectorias se restringen a hojas de espacio de fase (X-Y)-dimensional.

3. Coarse-graining Jerárquico

Mediante bandera de subpseudogrupo:

G = H₀ ⊃ H₁ ⊃ ... ⊃ H_L

Se construyen variedades anidadas de dimensión reducida:

M₀ ⊃ M₁ := M₀/H₁ ⊃ ... ⊃ M_L

4. Implementación de Capas Predictivas

Cada capa k predice Îₖ = γ̂ₖ·I₀, calculando residuos:

rₖ := γ̂ₖ⁻¹·I_θ(t) - I₀  (8)

Aplicando operador de coarse-graining:

mₖ→ₖ₊₁ := Cₖ→ₖ₊₁(rₖ)  (9)

Configuración Experimental

Prueba de Concepto: Modelo de Gato Blender

El artículo proporciona en el apéndice un ejemplo de implementación concreta, utilizando el rigging del personaje gato de Blender como aplicación práctica de la estructura jerárquica del pseudogrupo de Lie:

Mapeo de Estructura Jerárquica

Nivel 1: Cámara y Lentes - SE(3) × R
Nivel 2: Cuerpo Global/Raíz - SE(3)
Nivel 3: Cadena Torácica/Espinal - R^n_spine
Nivel 4: Extremidades/Garras/Cola - R^n_limb
Nivel 5: Morfología Facial - R^d_face
Nivel 6: Apariencia/Pelaje/Material - R^d_mat
Nivel 7: Iluminación y Entorno - SE(3) × R^d_SH

Implementación de Acción Composicional

Utilizando el modelo de Producto de Exponenciales (Product of Exponentials, PoE):

T(θ) = (∏ₙ∈chain e^[Sₙ]θₙ) M

Resultados Experimentales

Verificación Teórica

Restricciones de Equivarianza: Se demuestra que la compatibilidad entre restricción de rastreo e invariantes requiere equivarianza
Leyes de Conservación: Bajo entrada estática, cada canal de lectura define una cantidad conservada
Restricciones de Reducción Dimensional: Las trayectorias se restringen a hojas invariantes de baja dimensión
Compatibilidad Jerárquica: El complejo de Spencer garantiza integrabilidad de restricciones jerárquicas

Implementación Conceptual

El ejemplo Blender demuestra:

Implementación práctica de descomposición de grupo local γ = γ^(7)γ^(6)...γ^(1)
Significado geométrico de espacios cociente anidados Mₖ = Mₖ₋₁/Hₖ
Mecanismo de propagación de residuos predictivos en direcciones de cociente

Trabajo Relacionado

Simetría y Aprendizaje Profundo

Redes Equivariantes de Grupo: Las restricciones de equivarianza de este artículo son espiritualmente similares a CNN equivariantes de grupo
Aprendizaje de Invariancia: Aprendizaje de grupo de Lie de invariancia visual por Miao & Rao (2007) y otros
Descubrimiento de Simetría: Métodos de inferencia de simetría por Moskalev et al. (2022) y otros

Aprendizaje de Variedades y Compresión

Hipótesis de Variedad: Extiende la hipótesis de variedad tradicional con estructura geométrica de cobertura
Representación Jerárquica: Relacionado con aprendizaje de representación jerárquica en modelos profundos
Teoría de Información Algorítmica: Teoría de compresión basada en complejidad de Kolmogorov

Codificación Predictiva

Codificación Predictiva Tradicional: Teoría de procesamiento predictivo por Friston (2018) y otros
Predicción Jerárquica: Este artículo proporciona formalización matemática basada en simetría

Conclusiones y Discusión

Conclusiones Principales

Simetría como Compresión: La simetría composicional proporciona un mecanismo de compresión estructurado para datos naturales
Necesidad de Equivarianza: El rastreo preciso del mundo requiere equivarianza de la dinámica del agente
Geometría Jerárquica: La descomposición composicional del pseudogrupo de Lie conduce naturalmente a variedades anidadas de dimensión reducida
Fundamentos Geométricos de Codificación Predictiva: Proporciona marco matemático riguroso basado en transformaciones residuales para codificación predictiva

Limitaciones

Supuesto de Localidad: Todas las construcciones son locales, las afirmaciones globales requieren condiciones de compatibilidad adicionales
Espacio Latente Complejo: Puede fallar cuando el espacio latente del modelo generativo es muy complejo
Desafíos de Implementación Práctica: Existe una brecha entre teoría e implementación práctica en redes neuronales

Direcciones Futuras

Generalización a Entrada Estocástica: Extender a entrada estocástica y analizar robustez
Desarrollo de Operadores de Lyapunov: Desarrollar operadores K efectivos para problemas de rastreo del mundo
Verificación Empírica: Probar arquitecturas equivariantes bajo simetría generativa controlada
Exactitud de Spencer: Establecer conexiones formales con exactitud de Spencer, espacios de módulos y garantías de integrabilidad en sistemas de aprendizaje prácticos

Evaluación Profunda

Fortalezas

Innovación Teórica: Combinación innovadora de teoría de pseudogrupos de Lie con teoría de agentes algorítmicos
Rigor Matemático: Proporciona formalización matemática rigurosa, conectando múltiples campos matemáticos
Unificación: Unifica compresión, simetría y aprendizaje jerárquico en un marco único
Orientación Práctica: Proporciona orientación teórica para diseño de redes equivariantes
Valor Interdisciplinario: Conecta matemáticas, aprendizaje automático, neurociencia computacional y otros campos

Insuficiencias

Verificación Experimental Insuficiente: Principalmente trabajo teórico, carece de verificación experimental suficiente
Complejidad: La formalización matemática es bastante compleja, lo que puede limitar aplicación práctica
Limitaciones de Supuestos: Depende del supuesto de que los datos son realmente generados por pseudogrupos de Lie
Detalles de Implementación Incompletos: Detalles insuficientes en la transición de teoría a algoritmo práctico

Impacto Potencial

Contribución Teórica: Proporciona nueva perspectiva para fundamentos matemáticos del aprendizaje profundo
Valor Metodológico: Proporciona orientación para diseño de arquitecturas neuronales conscientes de simetría
Impacto Interdisciplinario: Puede influir en neurociencia computacional, robótica y otros campos
Valor a Largo Plazo: El marco teórico establecido tiene valor de investigación a largo plazo

Escenarios de Aplicabilidad

Dominios con Simetría Explícita: Como robótica, visión por computadora con transformaciones geométricas
Datos Jerárquicos: Tipos de datos con estructura jerárquica natural
Tareas de Compresión: Aplicaciones que requieren compresión estructurada
Sistemas de Codificación Predictiva: Implementaciones de codificación predictiva que requieren fundamentos teóricos

Referencias

El artículo cita trabajo relacionado abundante, incluyendo:

Cover & Thomas (2006): Fundamentos de teoría de información algorítmica
Goldschmidt (1967), Seiler (2010): Teoría de Spencer de pseudogrupos de Lie
Poggio et al. (2016, 2020): Teoría de composicionalidad del aprendizaje profundo
Friston (2018): Teoría de codificación predictiva
Lynch & Park (2017): Métodos de grupo de Lie en robótica moderna

Evaluación General: Este es un trabajo altamente teorizado que intenta establecer un marco matemático basado en pseudogrupos de Lie para agentes algorítmicos. Aunque la formalización matemática es rigurosa e innovadora, requiere más verificación experimental para demostrar su valor práctico. Este trabajo proporciona nuevas herramientas matemáticas para entender simetría y estructura jerárquica en aprendizaje profundo, con importancia teórica significativa.