2025-11-13T00:34:10.513475

Compositional Symmetry as Compression: Lie Pseudogroup Structure in Algorithmic Agents

Ruffini
In the algorithmic (Kolmogorov) view, agents are programs that track and compress sensory streams using generative programs. We propose a framework where the relevant structural prior is simplicity (Solomonoff) understood as \emph{compositional symmetry}: natural streams are well described by (local) actions of finite-parameter Lie pseudogroups on geometrically and topologically complex low-dimensional configuration manifolds (latent spaces). Modeling the agent as a generic neural dynamical system coupled to such streams, we show that accurate world-tracking imposes (i) \emph{structural constraints} -- equivariance of the agent's constitutive equations and readouts -- and (ii) \emph{dynamical constraints}: under static inputs, symmetry induces conserved quantities (Noether-style labels) in the agent dynamics and confines trajectories to reduced invariant manifolds; under slow drift, these manifolds move but remain low-dimensional. This yields a hierarchy of reduced manifolds aligned with the compositional factorization of the pseudogroup, providing a geometric account of the ``blessing of compositionality'' in deep models. We connect these ideas to the Spencer formalism for Lie pseudogroups and formulate a symmetry-based, self-contained version of predictive coding in which higher layers receive only \emph{coarse-grained residual transformations} (prediction-error coordinates) along symmetry directions unresolved at lower layers.
academic

Simmetria Compositiva come Compressione: Struttura di Pseudogruppo di Lie negli Agenti Algoritmici

Informazioni Fondamentali

  • ID Articolo: 2510.10586
  • Titolo: Compositional Symmetry as Compression: Lie Pseudogroup Structure in Algorithmic Agents
  • Autore: Giulio Ruffini (Neuroelectrics, Starlab, BCOM, Barcellona, Spagna)
  • Classificazione: cs.LG cs.AI cs.IT math.IT q-bio.NC
  • Data di Pubblicazione/Conferenza: Under Review - Proceedings Track 2025
  • Link Articolo: https://arxiv.org/abs/2510.10586

Riassunto

Questo articolo, basato sul quadro della teoria algoritmica dell'informazione (teoria di Kolmogorov), propone che gli agenti intelligenti siano programmi che generano programmi per tracciare e comprimere i flussi sensoriali. L'autore presenta un quadro che interpreta i precedenti strutturali rilevanti come simmetrie compositive: i flussi di dati naturali possono essere ben descritti attraverso azioni locali di pseudogruppi di Lie a parametri finiti su varietà di configurazione a bassa dimensione geometricamente e topologicamente complesse. Modellando gli agenti come sistemi dinamici neurali universali accoppiati a tali flussi di dati, l'articolo dimostra che il tracciamento accurato del mondo richiede: (1) vincoli strutturali — equivarianza delle equazioni costitutive dell'agente e delle letture; (2) vincoli dinamici — con input statici, la simmetria induce quantità conservate nella dinamica dell'agente e limita le traiettorie a varietà invarianti a dimensione ridotta. Ciò produce una gerarchia di varietà a dimensione ridotta allineata con la decomposizione compositiva dello pseudogruppo, fornendo un'interpretazione geometrica della "benedizione della composizionalità" nei modelli profondi.

Contesto di Ricerca e Motivazione

Problema Centrale

Il problema centrale affrontato da questo articolo è: come costruire un quadro teorico basato sulla simmetria per agenti algoritmici intelligenti che consenta loro di comprimere e tracciare efficacemente flussi di dati naturali con struttura compositiva?

Importanza della Ricerca

  1. Compressione e Scoperta di Strutture: Nel quadro della teoria di Kolmogorov, il compito centrale di un agente è costruire modelli compressivi per comprendere l'ambiente, mentre la simmetria fornisce un meccanismo di compressione strutturato naturale
  2. Fondamenti Teorici dell'Apprendimento Profondo: Fornisce spiegazione teorica matematica per la superiorità della complessità campionaria dei modelli profondi su compiti gerarchici
  3. Fondamenti Geometrici della Codifica Predittiva: Fornisce un quadro teorico geometrico basato sulla simmetria per la codifica predittiva

Limitazioni degli Approcci Esistenti

  1. Insufficienza dell'Ipotesi di Varietà: Avere solo un precedente di varietà senza struttura geometrica di copertura aggiuntiva è insufficiente
  2. Mancanza di Teoria della Compressione Strutturata: Gli approcci esistenti mancano di un quadro teorico unificato che integri simmetria, compressione e apprendimento gerarchico
  3. Mancanza di Fondamenti Matematici della Codifica Predittiva: La codifica predittiva tradizionale manca di formalizzazione matematica rigorosa

Contributi Principali

  1. Propone un quadro di modello generativo basato su pseudogruppi di Lie: Definisce i modelli generativi come azioni locali di pseudogruppi di Lie a parametri finiti su varietà di configurazione
  2. Stabilisce una teoria dinamica del tracciamento del mondo con vincoli di simmetria: Dimostra che il tracciamento accurato richiede vincoli di equivarianza e quantità conservate di tipo Noether
  3. Costruisce una teoria geometrica della riduzione dimensionale gerarchica: Attraverso la decomposizione compositiva dello pseudogruppo, stabilisce una struttura gerarchica di varietà invarianti annidate
  4. Fornisce un'implementazione della codifica predittiva basata sulla simmetria: Formalizza l'elaborazione predittiva gerarchica, dove i livelli superiori ricevono solo trasformazioni residue a grana grossa
  5. Connette la formalizzazione di Spencer: Collega il complesso di Spencer dello pseudogruppo di Lie alla struttura gerarchica dell'agente

Dettagli del Metodo

Definizione del Compito

Il compito centrale studiato in questo articolo è costruire agenti algoritmici intelligenti in grado di tracciare e comprimere flussi di dati sensoriali con simmetrie compositive. L'input è un flusso di dati generato da uno pseudogruppo di Lie, l'output è la rappresentazione dello stato interno dell'agente e le prestazioni di tracciamento del mondo.

Quadro Teorico

1. Definizione del Modello Generativo

Definizione 1 (Modello Generativo): Un modello generativo è una mappatura liscia da una varietà di configurazione M-dimensionale C allo spazio di osservazione R^X:

f: C → R^X, I = f(c)

Definizione 2 (Modello Generativo di Lie): Se esiste uno pseudogruppo di Lie G che agisce su C e R^X, tale che per ogni c ∈ C esiste γ ∈ G soddisfacente:

c = γ·c₀, f(c) = γ·I₀

allora f è chiamato modello generativo di Lie.

2. Dinamica del Tracciamento del Mondo

Lo stato ad alta dimensione dell'agente x ∈ R^X segue l'equazione della rete neurale:

ẋ = F(x; w, I_θ(t))  (2)

Il vincolo di tracciamento del mondo è:

p(x(t)) ≈ I_θ(t)  (3)

3. Requisiti di Equivarianza

Il tracciamento efficace richiede che la dinamica interna rispetti la stessa azione di gruppo:

∀γ ∈ G: f(γ·x; w, γ·I_θ) = γ·f(x; w, I_θ)
p(γ·x) = γ·p(x)  (4)

Punti di Innovazione Tecnica

1. Struttura Ricorsiva della Simmetria Compositiva

Utilizzando la mappatura esponenziale dello pseudogruppo di Lie, le trasformazioni complesse possono essere decomposte come:

γ = exp(∑ᵣₖ₌₁ θₖTᵏ)

Ciò fornisce una parametrizzazione compositiva ricorsiva che realizza la compressione strutturata.

2. Quantità Conservate di Tipo Noether

Con input statici, l'equivarianza induce invarianza della lettura: p(x) = const, ogni canale di lettura definisce una quantità conservata, e le traiettorie sono limitate a fogli dello spazio delle fasi (X-Y)-dimensionale.

3. Coarse-Graining Gerarchico

Attraverso bandiere di pseudogruppi secondari:

G = H₀ ⊃ H₁ ⊃ ... ⊃ H_L

costruisce varietà annidate a dimensione ridotta:

M₀ ⊃ M₁ := M₀/H₁ ⊃ ... ⊃ M_L

4. Implementazione della Gerarchia Predittiva

Ogni livello k predice Îₖ = γ̂ₖ·I₀, calcolando il residuo:

rₖ := γ̂ₖ⁻¹·I_θ(t) - I₀  (8)

Applicando l'operatore di coarse-graining:

mₖ→ₖ₊₁ := Cₖ→ₖ₊₁(rₖ)  (9)

Configurazione Sperimentale

Prova di Concetto: Modello di Gatto Blender

L'articolo fornisce un esempio di implementazione concreta nell'appendice, utilizzando il rigging del personaggio gatto del software Blender come applicazione pratica della struttura gerarchica dello pseudogruppo di Lie:

Mappatura della Gerarchia

  1. Livello 1: Telecamera e Obiettivo - SE(3) × R
  2. Livello 2: Corpo Globale/Radice - SE(3)
  3. Livello 3: Catena Torso/Colonna Vertebrale - R^n_spine
  4. Livello 4: Arti/Artigli/Coda - R^n_limb
  5. Livello 5: Morfologia Facciale - R^d_face
  6. Livello 6: Aspetto/Pelo/Materiale - R^d_mat
  7. Livello 7: Illuminazione e Ambiente - SE(3) × R^d_SH

Implementazione dell'Azione Compositiva

Utilizzando il modello Product of Exponentials (PoE):

T(θ) = (∏ₙ∈chain e^[Sₙ]θₙ) M

Risultati Sperimentali

Verifica Teorica

  1. Vincoli di Equivarianza: Dimostra che la compatibilità tra vincoli di tracciamento e invarianti richiede equivarianza
  2. Leggi di Conservazione: Con input statici, ogni canale di lettura definisce una quantità conservata
  3. Vincoli di Riduzione Dimensionale: Le traiettorie sono limitate a foglie invarianti a bassa dimensione
  4. Compatibilità Gerarchica: Il complesso di Spencer garantisce l'integrabilità dei vincoli gerarchici

Implementazione Concettuale

L'esempio Blender dimostra:

  • L'implementazione pratica della decomposizione locale del gruppo γ = γ^(7)γ^(6)...γ^(1)
  • Il significato geometrico degli spazi quoziente annidati Mₖ = Mₖ₋₁/Hₖ
  • Il meccanismo di propagazione del residuo predittivo nelle direzioni quoziente

Lavori Correlati

Simmetria e Apprendimento Profondo

  • Reti Equivarianti di Gruppo: I vincoli di equivarianza di questo articolo sono spiritualmente simili alle CNN equivarianti di gruppo
  • Apprendimento di Invarianti: Lavori di Miao & Rao (2007) e altri sull'apprendimento di gruppi di Lie per invarianti visivi
  • Scoperta di Simmetrie: Metodi di inferenza di simmetria di Moskalev et al. (2022) e altri

Apprendimento di Varietà e Compressione

  • Ipotesi di Varietà: Estende l'ipotesi tradizionale di varietà aggiungendo struttura di copertura geometrica
  • Rappresentazione Gerarchica: Correlato all'apprendimento di rappresentazione gerarchica nei modelli profondi
  • Teoria Algoritmica dell'Informazione: Teoria della compressione basata sulla complessità di Kolmogorov

Codifica Predittiva

  • Codifica Predittiva Tradizionale: Teoria dell'elaborazione predittiva di Friston (2018) e altri
  • Codifica Predittiva Gerarchica: Questo articolo fornisce una formalizzazione matematica basata sulla simmetria

Conclusioni e Discussione

Conclusioni Principali

  1. La Simmetria è Compressione: La simmetria compositiva fornisce un meccanismo di compressione strutturato naturale per i dati
  2. Necessità dell'Equivarianza: Il tracciamento accurato del mondo richiede equivarianza nella dinamica dell'agente
  3. Geometria Gerarchica: La decomposizione compositiva dello pseudogruppo di Lie conduce naturalmente a varietà annidate a dimensione ridotta
  4. Fondamenti Geometrici della Codifica Predittiva: Fornisce un quadro matematico rigoroso basato su trasformazioni residue per la codifica predittiva

Limitazioni

  1. Assunzione di Località: Tutte le costruzioni sono locali, le affermazioni globali richiedono condizioni di compatibilità aggiuntive
  2. Spazi Latenti Complessi: Potrebbe fallire quando lo spazio latente del modello generativo è molto complesso
  3. Sfide di Implementazione Pratica: Esiste un divario tra la teoria e l'implementazione pratica in reti neurali

Direzioni Future

  1. Generalizzazione a Input Stocastici: Estendere a input stocastici e analizzare la robustezza
  2. Sviluppo di Operatori di Lyapunov: Sviluppare operatori K efficaci per problemi di tracciamento del mondo
  3. Verifica Empirica: Testare architetture equivarianti sotto simmetrie generative controllate
  4. Esattezza di Spencer: Stabilire connessioni formali con l'esattezza di Spencer, spazi di moduli e garanzie di integrabilità per sistemi di apprendimento pratico

Valutazione Approfondita

Punti di Forza

  1. Innovazione Teorica: Combinazione innovativa della teoria degli pseudogruppi di Lie con la teoria degli agenti algoritmici
  2. Rigore Matematico: Fornisce formalizzazione matematica rigorosa che connette molteplici campi matematici
  3. Unitarietà: Unifica compressione, simmetria e apprendimento gerarchico in un unico quadro
  4. Guida Pratica: Fornisce guida teorica per la progettazione di reti equivarianti
  5. Valore Interdisciplinare: Connette matematica, apprendimento automatico, neuroscienze computazionali e altri campi

Insufficienze

  1. Verifica Sperimentale Insufficiente: Principalmente lavoro teorico, manca di verifica sperimentale adeguata
  2. Complessità: La formalizzazione matematica è piuttosto complessa, potrebbe limitare l'applicazione pratica
  3. Limitazioni delle Assunzioni: Dipende dall'assunzione che i dati siano effettivamente generati da uno pseudogruppo di Lie
  4. Dettagli di Implementazione Mancanti: I dettagli dal passaggio dalla teoria all'algoritmo pratico non sono sufficientemente completi

Impatto

  1. Contributo Teorico: Fornisce una nuova prospettiva per i fondamenti matematici dell'apprendimento profondo
  2. Valore Metodologico: Fornisce guida per la progettazione di architetture neurali consapevoli della simmetria
  3. Impatto Interdisciplinare: Potrebbe influenzare neuroscienze computazionali, robotica e altri campi
  4. Valore a Lungo Termine: Il quadro teorico stabilito ha valore di ricerca a lungo termine

Scenari Applicabili

  1. Domini con Simmetrie Esplicite: Come robotica e trasformazioni geometriche in visione artificiale
  2. Dati Gerarchici: Tipi di dati con struttura gerarchica naturale
  3. Compiti di Compressione: Applicazioni che richiedono compressione strutturata
  4. Sistemi di Codifica Predittiva: Implementazioni di codifica predittiva che richiedono fondamenti teorici

Riferimenti Bibliografici

L'articolo cita lavori correlati ricchi, inclusi:

  • Cover & Thomas (2006): Fondamenti della teoria algoritmica dell'informazione
  • Goldschmidt (1967), Seiler (2010): Teoria di Spencer degli pseudogruppi di Lie
  • Poggio et al. (2016, 2020): Teoria della composizionalità nell'apprendimento profondo
  • Friston (2018): Teoria della codifica predittiva
  • Lynch & Park (2017): Metodi di gruppi di Lie nella robotica moderna

Valutazione Complessiva: Questo è un lavoro altamente teorico che tenta di stabilire un quadro matematico basato su pseudogruppi di Lie per agenti algoritmici intelligenti. Sebbene la formalizzazione matematica sia rigorosa e innovativa, richiede più verifica sperimentale per provare il suo valore pratico. Questo lavoro fornisce nuovi strumenti matematici per comprendere la simmetria e la struttura gerarchica nell'apprendimento profondo, con significato teorico importante.