2025-11-13T00:34:10.513475

Compositional Symmetry as Compression: Lie Pseudogroup Structure in Algorithmic Agents

Ruffini
In the algorithmic (Kolmogorov) view, agents are programs that track and compress sensory streams using generative programs. We propose a framework where the relevant structural prior is simplicity (Solomonoff) understood as \emph{compositional symmetry}: natural streams are well described by (local) actions of finite-parameter Lie pseudogroups on geometrically and topologically complex low-dimensional configuration manifolds (latent spaces). Modeling the agent as a generic neural dynamical system coupled to such streams, we show that accurate world-tracking imposes (i) \emph{structural constraints} -- equivariance of the agent's constitutive equations and readouts -- and (ii) \emph{dynamical constraints}: under static inputs, symmetry induces conserved quantities (Noether-style labels) in the agent dynamics and confines trajectories to reduced invariant manifolds; under slow drift, these manifolds move but remain low-dimensional. This yields a hierarchy of reduced manifolds aligned with the compositional factorization of the pseudogroup, providing a geometric account of the ``blessing of compositionality'' in deep models. We connect these ideas to the Spencer formalism for Lie pseudogroups and formulate a symmetry-based, self-contained version of predictive coding in which higher layers receive only \emph{coarse-grained residual transformations} (prediction-error coordinates) along symmetry directions unresolved at lower layers.
academic

Simetría Composicional como Compresión: Estructura de Pseudogrupo de Lie en Agentes Algorítmicos

Información Básica

  • ID del Artículo: 2510.10586
  • Título: Compositional Symmetry as Compression: Lie Pseudogroup Structure in Algorithmic Agents
  • Autor: Giulio Ruffini (Neuroelectrics, Starlab, BCOM, Barcelona, España)
  • Clasificación: cs.LG cs.AI cs.IT math.IT q-bio.NC
  • Fecha de Publicación/Conferencia: Bajo Revisión - Proceedings Track 2025
  • Enlace del Artículo: https://arxiv.org/abs/2510.10586

Resumen

Este artículo, basado en el marco de la teoría de la información algorítmica (teoría de Kolmogorov), propone que los agentes inteligentes son programas que rastrean y comprimen flujos sensoriales mediante la generación de programas. Los autores presentan un marco que interpreta los priors estructurales relevantes como simetrías composicionales: los flujos de datos naturales pueden describirse adecuadamente mediante acciones locales de pseudogrupos de Lie de parámetros finitos en variedades de configuración de baja dimensión geométrica y topológicamente complejas. Al modelar agentes como sistemas dinámicos neurales universales acoplados a tales flujos de datos, el artículo demuestra que el rastreo preciso del mundo requiere: (1) restricciones estructurales—equivarianza de las ecuaciones constitutivas del agente y lecturas; (2) restricciones dinámicas—bajo entrada estática, la simetría induce cantidades conservadas en la dinámica del agente y restringe trayectorias a variedades invariantes de dimensión reducida. Esto produce una jerarquía de variedades de dimensión reducida alineada con la descomposición composicional del pseudogrupo, proporcionando una explicación geométrica de la "bendición de la composicionalidad" en modelos profundos.

Antecedentes de Investigación y Motivación

Problema Central

El problema central que este artículo aborda es: ¿Cómo construir un marco teórico basado en simetría para agentes algorítmicos que les permita comprimir y rastrear efectivamente flujos de datos naturales con estructura composicional?

Importancia de la Investigación

  1. Compresión y Descubrimiento de Estructura: Dentro del marco de la teoría de Kolmogorov, la tarea central del agente es construir modelos comprimidos para entender el entorno, mientras que la simetría proporciona un mecanismo de compresión estructurado natural
  2. Fundamentos Teóricos del Aprendizaje Profundo: Proporciona una explicación teórica matemática para la complejidad de muestra superior de los modelos profundos en tareas jerárquicas
  3. Fundamentos Geométricos de la Codificación Predictiva: Proporciona un marco teórico geométrico basado en simetría para la codificación predictiva

Limitaciones de Métodos Existentes

  1. Insuficiencia de Hipótesis de Variedad: Tener solo un prior de variedad sin estructura geométrica de cobertura adicional es insuficiente
  2. Falta de Teoría de Compresión Estructurada: Los métodos existentes carecen de un marco teórico unificado que integre simetría, compresión y aprendizaje jerárquico
  3. Falta de Fundamentos Matemáticos en Codificación Predictiva: La codificación predictiva tradicional carece de formalización matemática rigurosa

Contribuciones Principales

  1. Propone un marco de modelo generativo basado en pseudogrupos de Lie: Define modelos generativos como acciones locales de pseudogrupos de Lie de parámetros finitos en variedades de configuración
  2. Establece teoría de dinámica de rastreo del mundo con restricciones de simetría: Demuestra que el rastreo preciso requiere restricciones de equivarianza y cantidades conservadas tipo Noether
  3. Construye teoría geométrica de reducción dimensional jerárquica: Establece estructura jerárquica de variedades invariantes anidadas mediante descomposición composicional de pseudogrupos
  4. Proporciona implementación de codificación predictiva basada en simetría: Formaliza procesamiento predictivo jerárquico donde niveles superiores reciben solo transformaciones residuales coarse-grained
  5. Conecta con teoría formalista de Spencer: Vincula el complejo de Spencer de pseudogrupos de Lie con la estructura jerárquica del agente

Detalles del Método

Definición de Tarea

La tarea central estudiada en este artículo es construir agentes algorítmicos capaces de rastrear y comprimir flujos de datos sensoriales con simetría composicional. La entrada es un flujo de datos generado por un pseudogrupo de Lie, y la salida es la representación de estado interno del agente y su desempeño en rastreo del mundo.

Marco Teórico

1. Definición de Modelo Generativo

Definición 1 (Modelo Generativo): Un modelo generativo es un mapeo suave de una variedad de configuración M-dimensional C al espacio de observación R^X:

f: C → R^X, I = f(c)

Definición 2 (Modelo Generativo de Lie): Si existe un pseudogrupo de Lie G actuando sobre C y R^X tal que para cualquier c ∈ C, existe γ ∈ G satisfaciendo:

c = γ·c₀, f(c) = γ·I₀

entonces f se denomina modelo generativo de Lie.

2. Dinámica de Rastreo del Mundo

El estado de alta dimensión del agente x ∈ R^X obedece la ecuación de red neuronal:

ẋ = F(x; w, I_θ(t))  (2)

La restricción de rastreo del mundo es:

p(x(t)) ≈ I_θ(t)  (3)

3. Requisitos de Equivarianza

El rastreo efectivo requiere que la dinámica interna respete la misma acción de grupo:

∀γ ∈ G: f(γ·x; w, γ·I_θ) = γ·f(x; w, I_θ)
p(γ·x) = γ·p(x)  (4)

Puntos de Innovación Técnica

1. Estructura Recursiva de Simetría Composicional

Utilizando el mapeo exponencial del pseudogrupo de Lie, transformaciones complejas pueden descomponerse como:

γ = exp(∑ᵣₖ₌₁ θₖTᵏ)

Esto proporciona parametrización composicional recursiva, realizando compresión estructurada.

2. Cantidades Conservadas tipo Noether

Bajo entrada estática, la equivarianza conduce a invariancia de lectura: p(x) = const, cada canal de lectura define una cantidad conservada, y las trayectorias se restringen a hojas de espacio de fase (X-Y)-dimensional.

3. Coarse-graining Jerárquico

Mediante bandera de subpseudogrupo:

G = H₀ ⊃ H₁ ⊃ ... ⊃ H_L

Se construyen variedades anidadas de dimensión reducida:

M₀ ⊃ M₁ := M₀/H₁ ⊃ ... ⊃ M_L

4. Implementación de Capas Predictivas

Cada capa k predice Îₖ = γ̂ₖ·I₀, calculando residuos:

rₖ := γ̂ₖ⁻¹·I_θ(t) - I₀  (8)

Aplicando operador de coarse-graining:

mₖ→ₖ₊₁ := Cₖ→ₖ₊₁(rₖ)  (9)

Configuración Experimental

Prueba de Concepto: Modelo de Gato Blender

El artículo proporciona en el apéndice un ejemplo de implementación concreta, utilizando el rigging del personaje gato de Blender como aplicación práctica de la estructura jerárquica del pseudogrupo de Lie:

Mapeo de Estructura Jerárquica

  1. Nivel 1: Cámara y Lentes - SE(3) × R
  2. Nivel 2: Cuerpo Global/Raíz - SE(3)
  3. Nivel 3: Cadena Torácica/Espinal - R^n_spine
  4. Nivel 4: Extremidades/Garras/Cola - R^n_limb
  5. Nivel 5: Morfología Facial - R^d_face
  6. Nivel 6: Apariencia/Pelaje/Material - R^d_mat
  7. Nivel 7: Iluminación y Entorno - SE(3) × R^d_SH

Implementación de Acción Composicional

Utilizando el modelo de Producto de Exponenciales (Product of Exponentials, PoE):

T(θ) = (∏ₙ∈chain e^[Sₙ]θₙ) M

Resultados Experimentales

Verificación Teórica

  1. Restricciones de Equivarianza: Se demuestra que la compatibilidad entre restricción de rastreo e invariantes requiere equivarianza
  2. Leyes de Conservación: Bajo entrada estática, cada canal de lectura define una cantidad conservada
  3. Restricciones de Reducción Dimensional: Las trayectorias se restringen a hojas invariantes de baja dimensión
  4. Compatibilidad Jerárquica: El complejo de Spencer garantiza integrabilidad de restricciones jerárquicas

Implementación Conceptual

El ejemplo Blender demuestra:

  • Implementación práctica de descomposición de grupo local γ = γ^(7)γ^(6)...γ^(1)
  • Significado geométrico de espacios cociente anidados Mₖ = Mₖ₋₁/Hₖ
  • Mecanismo de propagación de residuos predictivos en direcciones de cociente

Trabajo Relacionado

Simetría y Aprendizaje Profundo

  • Redes Equivariantes de Grupo: Las restricciones de equivarianza de este artículo son espiritualmente similares a CNN equivariantes de grupo
  • Aprendizaje de Invariancia: Aprendizaje de grupo de Lie de invariancia visual por Miao & Rao (2007) y otros
  • Descubrimiento de Simetría: Métodos de inferencia de simetría por Moskalev et al. (2022) y otros

Aprendizaje de Variedades y Compresión

  • Hipótesis de Variedad: Extiende la hipótesis de variedad tradicional con estructura geométrica de cobertura
  • Representación Jerárquica: Relacionado con aprendizaje de representación jerárquica en modelos profundos
  • Teoría de Información Algorítmica: Teoría de compresión basada en complejidad de Kolmogorov

Codificación Predictiva

  • Codificación Predictiva Tradicional: Teoría de procesamiento predictivo por Friston (2018) y otros
  • Predicción Jerárquica: Este artículo proporciona formalización matemática basada en simetría

Conclusiones y Discusión

Conclusiones Principales

  1. Simetría como Compresión: La simetría composicional proporciona un mecanismo de compresión estructurado para datos naturales
  2. Necesidad de Equivarianza: El rastreo preciso del mundo requiere equivarianza de la dinámica del agente
  3. Geometría Jerárquica: La descomposición composicional del pseudogrupo de Lie conduce naturalmente a variedades anidadas de dimensión reducida
  4. Fundamentos Geométricos de Codificación Predictiva: Proporciona marco matemático riguroso basado en transformaciones residuales para codificación predictiva

Limitaciones

  1. Supuesto de Localidad: Todas las construcciones son locales, las afirmaciones globales requieren condiciones de compatibilidad adicionales
  2. Espacio Latente Complejo: Puede fallar cuando el espacio latente del modelo generativo es muy complejo
  3. Desafíos de Implementación Práctica: Existe una brecha entre teoría e implementación práctica en redes neuronales

Direcciones Futuras

  1. Generalización a Entrada Estocástica: Extender a entrada estocástica y analizar robustez
  2. Desarrollo de Operadores de Lyapunov: Desarrollar operadores K efectivos para problemas de rastreo del mundo
  3. Verificación Empírica: Probar arquitecturas equivariantes bajo simetría generativa controlada
  4. Exactitud de Spencer: Establecer conexiones formales con exactitud de Spencer, espacios de módulos y garantías de integrabilidad en sistemas de aprendizaje prácticos

Evaluación Profunda

Fortalezas

  1. Innovación Teórica: Combinación innovadora de teoría de pseudogrupos de Lie con teoría de agentes algorítmicos
  2. Rigor Matemático: Proporciona formalización matemática rigurosa, conectando múltiples campos matemáticos
  3. Unificación: Unifica compresión, simetría y aprendizaje jerárquico en un marco único
  4. Orientación Práctica: Proporciona orientación teórica para diseño de redes equivariantes
  5. Valor Interdisciplinario: Conecta matemáticas, aprendizaje automático, neurociencia computacional y otros campos

Insuficiencias

  1. Verificación Experimental Insuficiente: Principalmente trabajo teórico, carece de verificación experimental suficiente
  2. Complejidad: La formalización matemática es bastante compleja, lo que puede limitar aplicación práctica
  3. Limitaciones de Supuestos: Depende del supuesto de que los datos son realmente generados por pseudogrupos de Lie
  4. Detalles de Implementación Incompletos: Detalles insuficientes en la transición de teoría a algoritmo práctico

Impacto Potencial

  1. Contribución Teórica: Proporciona nueva perspectiva para fundamentos matemáticos del aprendizaje profundo
  2. Valor Metodológico: Proporciona orientación para diseño de arquitecturas neuronales conscientes de simetría
  3. Impacto Interdisciplinario: Puede influir en neurociencia computacional, robótica y otros campos
  4. Valor a Largo Plazo: El marco teórico establecido tiene valor de investigación a largo plazo

Escenarios de Aplicabilidad

  1. Dominios con Simetría Explícita: Como robótica, visión por computadora con transformaciones geométricas
  2. Datos Jerárquicos: Tipos de datos con estructura jerárquica natural
  3. Tareas de Compresión: Aplicaciones que requieren compresión estructurada
  4. Sistemas de Codificación Predictiva: Implementaciones de codificación predictiva que requieren fundamentos teóricos

Referencias

El artículo cita trabajo relacionado abundante, incluyendo:

  • Cover & Thomas (2006): Fundamentos de teoría de información algorítmica
  • Goldschmidt (1967), Seiler (2010): Teoría de Spencer de pseudogrupos de Lie
  • Poggio et al. (2016, 2020): Teoría de composicionalidad del aprendizaje profundo
  • Friston (2018): Teoría de codificación predictiva
  • Lynch & Park (2017): Métodos de grupo de Lie en robótica moderna

Evaluación General: Este es un trabajo altamente teorizado que intenta establecer un marco matemático basado en pseudogrupos de Lie para agentes algorítmicos. Aunque la formalización matemática es rigurosa e innovadora, requiere más verificación experimental para demostrar su valor práctico. Este trabajo proporciona nuevas herramientas matemáticas para entender simetría y estructura jerárquica en aprendizaje profundo, con importancia teórica significativa.