2025-11-13T00:34:10.513475

Compositional Symmetry as Compression: Lie Pseudogroup Structure in Algorithmic Agents

Ruffini

In the algorithmic (Kolmogorov) view, agents are programs that track and compress sensory streams using generative programs. We propose a framework where the relevant structural prior is simplicity (Solomonoff) understood as \emph{compositional symmetry}: natural streams are well described by (local) actions of finite-parameter Lie pseudogroups on geometrically and topologically complex low-dimensional configuration manifolds (latent spaces). Modeling the agent as a generic neural dynamical system coupled to such streams, we show that accurate world-tracking imposes (i) \emph{structural constraints} -- equivariance of the agent's constitutive equations and readouts -- and (ii) \emph{dynamical constraints}: under static inputs, symmetry induces conserved quantities (Noether-style labels) in the agent dynamics and confines trajectories to reduced invariant manifolds; under slow drift, these manifolds move but remain low-dimensional. This yields a hierarchy of reduced manifolds aligned with the compositional factorization of the pseudogroup, providing a geometric account of the ``blessing of compositionality'' in deep models. We connect these ideas to the Spencer formalism for Lie pseudogroups and formulate a symmetry-based, self-contained version of predictive coding in which higher layers receive only \emph{coarse-grained residual transformations} (prediction-error coordinates) along symmetry directions unresolved at lower layers.

academic

Simmetria Compositiva come Compressione: Struttura di Pseudogruppo di Lie negli Agenti Algoritmici

Informazioni Fondamentali

ID Articolo: 2510.10586
Titolo: Compositional Symmetry as Compression: Lie Pseudogroup Structure in Algorithmic Agents
Autore: Giulio Ruffini (Neuroelectrics, Starlab, BCOM, Barcellona, Spagna)
Classificazione: cs.LG cs.AI cs.IT math.IT q-bio.NC
Data di Pubblicazione/Conferenza: Under Review - Proceedings Track 2025
Link Articolo: https://arxiv.org/abs/2510.10586

Riassunto

Questo articolo, basato sul quadro della teoria algoritmica dell'informazione (teoria di Kolmogorov), propone che gli agenti intelligenti siano programmi che generano programmi per tracciare e comprimere i flussi sensoriali. L'autore presenta un quadro che interpreta i precedenti strutturali rilevanti come simmetrie compositive: i flussi di dati naturali possono essere ben descritti attraverso azioni locali di pseudogruppi di Lie a parametri finiti su varietà di configurazione a bassa dimensione geometricamente e topologicamente complesse. Modellando gli agenti come sistemi dinamici neurali universali accoppiati a tali flussi di dati, l'articolo dimostra che il tracciamento accurato del mondo richiede: (1) vincoli strutturali — equivarianza delle equazioni costitutive dell'agente e delle letture; (2) vincoli dinamici — con input statici, la simmetria induce quantità conservate nella dinamica dell'agente e limita le traiettorie a varietà invarianti a dimensione ridotta. Ciò produce una gerarchia di varietà a dimensione ridotta allineata con la decomposizione compositiva dello pseudogruppo, fornendo un'interpretazione geometrica della "benedizione della composizionalità" nei modelli profondi.

Contesto di Ricerca e Motivazione

Problema Centrale

Il problema centrale affrontato da questo articolo è: come costruire un quadro teorico basato sulla simmetria per agenti algoritmici intelligenti che consenta loro di comprimere e tracciare efficacemente flussi di dati naturali con struttura compositiva?

Importanza della Ricerca

Compressione e Scoperta di Strutture: Nel quadro della teoria di Kolmogorov, il compito centrale di un agente è costruire modelli compressivi per comprendere l'ambiente, mentre la simmetria fornisce un meccanismo di compressione strutturato naturale
Fondamenti Teorici dell'Apprendimento Profondo: Fornisce spiegazione teorica matematica per la superiorità della complessità campionaria dei modelli profondi su compiti gerarchici
Fondamenti Geometrici della Codifica Predittiva: Fornisce un quadro teorico geometrico basato sulla simmetria per la codifica predittiva

Limitazioni degli Approcci Esistenti

Insufficienza dell'Ipotesi di Varietà: Avere solo un precedente di varietà senza struttura geometrica di copertura aggiuntiva è insufficiente
Mancanza di Teoria della Compressione Strutturata: Gli approcci esistenti mancano di un quadro teorico unificato che integri simmetria, compressione e apprendimento gerarchico
Mancanza di Fondamenti Matematici della Codifica Predittiva: La codifica predittiva tradizionale manca di formalizzazione matematica rigorosa

Contributi Principali

Propone un quadro di modello generativo basato su pseudogruppi di Lie: Definisce i modelli generativi come azioni locali di pseudogruppi di Lie a parametri finiti su varietà di configurazione
Stabilisce una teoria dinamica del tracciamento del mondo con vincoli di simmetria: Dimostra che il tracciamento accurato richiede vincoli di equivarianza e quantità conservate di tipo Noether
Costruisce una teoria geometrica della riduzione dimensionale gerarchica: Attraverso la decomposizione compositiva dello pseudogruppo, stabilisce una struttura gerarchica di varietà invarianti annidate
Fornisce un'implementazione della codifica predittiva basata sulla simmetria: Formalizza l'elaborazione predittiva gerarchica, dove i livelli superiori ricevono solo trasformazioni residue a grana grossa
Connette la formalizzazione di Spencer: Collega il complesso di Spencer dello pseudogruppo di Lie alla struttura gerarchica dell'agente

Dettagli del Metodo

Definizione del Compito

Il compito centrale studiato in questo articolo è costruire agenti algoritmici intelligenti in grado di tracciare e comprimere flussi di dati sensoriali con simmetrie compositive. L'input è un flusso di dati generato da uno pseudogruppo di Lie, l'output è la rappresentazione dello stato interno dell'agente e le prestazioni di tracciamento del mondo.

Quadro Teorico

1. Definizione del Modello Generativo

Definizione 1 (Modello Generativo): Un modello generativo è una mappatura liscia da una varietà di configurazione M-dimensionale C allo spazio di osservazione R^X:

f: C → R^X, I = f(c)

Definizione 2 (Modello Generativo di Lie): Se esiste uno pseudogruppo di Lie G che agisce su C e R^X, tale che per ogni c ∈ C esiste γ ∈ G soddisfacente:

c = γ·c₀, f(c) = γ·I₀

allora f è chiamato modello generativo di Lie.

2. Dinamica del Tracciamento del Mondo

Lo stato ad alta dimensione dell'agente x ∈ R^X segue l'equazione della rete neurale:

ẋ = F(x; w, I_θ(t))  (2)

Il vincolo di tracciamento del mondo è:

p(x(t)) ≈ I_θ(t)  (3)

3. Requisiti di Equivarianza

Il tracciamento efficace richiede che la dinamica interna rispetti la stessa azione di gruppo:

∀γ ∈ G: f(γ·x; w, γ·I_θ) = γ·f(x; w, I_θ)
p(γ·x) = γ·p(x)  (4)

Punti di Innovazione Tecnica

1. Struttura Ricorsiva della Simmetria Compositiva

Utilizzando la mappatura esponenziale dello pseudogruppo di Lie, le trasformazioni complesse possono essere decomposte come:

γ = exp(∑ᵣₖ₌₁ θₖTᵏ)

Ciò fornisce una parametrizzazione compositiva ricorsiva che realizza la compressione strutturata.

2. Quantità Conservate di Tipo Noether

Con input statici, l'equivarianza induce invarianza della lettura: p(x) = const, ogni canale di lettura definisce una quantità conservata, e le traiettorie sono limitate a fogli dello spazio delle fasi (X-Y)-dimensionale.

3. Coarse-Graining Gerarchico

Attraverso bandiere di pseudogruppi secondari:

G = H₀ ⊃ H₁ ⊃ ... ⊃ H_L

costruisce varietà annidate a dimensione ridotta:

M₀ ⊃ M₁ := M₀/H₁ ⊃ ... ⊃ M_L

4. Implementazione della Gerarchia Predittiva

Ogni livello k predice Îₖ = γ̂ₖ·I₀, calcolando il residuo:

rₖ := γ̂ₖ⁻¹·I_θ(t) - I₀  (8)

Applicando l'operatore di coarse-graining:

mₖ→ₖ₊₁ := Cₖ→ₖ₊₁(rₖ)  (9)

Configurazione Sperimentale

Prova di Concetto: Modello di Gatto Blender

L'articolo fornisce un esempio di implementazione concreta nell'appendice, utilizzando il rigging del personaggio gatto del software Blender come applicazione pratica della struttura gerarchica dello pseudogruppo di Lie:

Mappatura della Gerarchia

Livello 1: Telecamera e Obiettivo - SE(3) × R
Livello 2: Corpo Globale/Radice - SE(3)
Livello 3: Catena Torso/Colonna Vertebrale - R^n_spine
Livello 4: Arti/Artigli/Coda - R^n_limb
Livello 5: Morfologia Facciale - R^d_face
Livello 6: Aspetto/Pelo/Materiale - R^d_mat
Livello 7: Illuminazione e Ambiente - SE(3) × R^d_SH

Implementazione dell'Azione Compositiva

Utilizzando il modello Product of Exponentials (PoE):

T(θ) = (∏ₙ∈chain e^[Sₙ]θₙ) M

Risultati Sperimentali

Verifica Teorica

Vincoli di Equivarianza: Dimostra che la compatibilità tra vincoli di tracciamento e invarianti richiede equivarianza
Leggi di Conservazione: Con input statici, ogni canale di lettura definisce una quantità conservata
Vincoli di Riduzione Dimensionale: Le traiettorie sono limitate a foglie invarianti a bassa dimensione
Compatibilità Gerarchica: Il complesso di Spencer garantisce l'integrabilità dei vincoli gerarchici

Implementazione Concettuale

L'esempio Blender dimostra:

L'implementazione pratica della decomposizione locale del gruppo γ = γ^(7)γ^(6)...γ^(1)
Il significato geometrico degli spazi quoziente annidati Mₖ = Mₖ₋₁/Hₖ
Il meccanismo di propagazione del residuo predittivo nelle direzioni quoziente

Lavori Correlati

Simmetria e Apprendimento Profondo

Reti Equivarianti di Gruppo: I vincoli di equivarianza di questo articolo sono spiritualmente simili alle CNN equivarianti di gruppo
Apprendimento di Invarianti: Lavori di Miao & Rao (2007) e altri sull'apprendimento di gruppi di Lie per invarianti visivi
Scoperta di Simmetrie: Metodi di inferenza di simmetria di Moskalev et al. (2022) e altri

Apprendimento di Varietà e Compressione

Ipotesi di Varietà: Estende l'ipotesi tradizionale di varietà aggiungendo struttura di copertura geometrica
Rappresentazione Gerarchica: Correlato all'apprendimento di rappresentazione gerarchica nei modelli profondi
Teoria Algoritmica dell'Informazione: Teoria della compressione basata sulla complessità di Kolmogorov

Codifica Predittiva

Codifica Predittiva Tradizionale: Teoria dell'elaborazione predittiva di Friston (2018) e altri
Codifica Predittiva Gerarchica: Questo articolo fornisce una formalizzazione matematica basata sulla simmetria

Conclusioni e Discussione

Conclusioni Principali

La Simmetria è Compressione: La simmetria compositiva fornisce un meccanismo di compressione strutturato naturale per i dati
Necessità dell'Equivarianza: Il tracciamento accurato del mondo richiede equivarianza nella dinamica dell'agente
Geometria Gerarchica: La decomposizione compositiva dello pseudogruppo di Lie conduce naturalmente a varietà annidate a dimensione ridotta
Fondamenti Geometrici della Codifica Predittiva: Fornisce un quadro matematico rigoroso basato su trasformazioni residue per la codifica predittiva

Limitazioni

Assunzione di Località: Tutte le costruzioni sono locali, le affermazioni globali richiedono condizioni di compatibilità aggiuntive
Spazi Latenti Complessi: Potrebbe fallire quando lo spazio latente del modello generativo è molto complesso
Sfide di Implementazione Pratica: Esiste un divario tra la teoria e l'implementazione pratica in reti neurali

Direzioni Future

Generalizzazione a Input Stocastici: Estendere a input stocastici e analizzare la robustezza
Sviluppo di Operatori di Lyapunov: Sviluppare operatori K efficaci per problemi di tracciamento del mondo
Verifica Empirica: Testare architetture equivarianti sotto simmetrie generative controllate
Esattezza di Spencer: Stabilire connessioni formali con l'esattezza di Spencer, spazi di moduli e garanzie di integrabilità per sistemi di apprendimento pratico

Valutazione Approfondita

Punti di Forza

Innovazione Teorica: Combinazione innovativa della teoria degli pseudogruppi di Lie con la teoria degli agenti algoritmici
Rigore Matematico: Fornisce formalizzazione matematica rigorosa che connette molteplici campi matematici
Unitarietà: Unifica compressione, simmetria e apprendimento gerarchico in un unico quadro
Guida Pratica: Fornisce guida teorica per la progettazione di reti equivarianti
Valore Interdisciplinare: Connette matematica, apprendimento automatico, neuroscienze computazionali e altri campi

Insufficienze

Verifica Sperimentale Insufficiente: Principalmente lavoro teorico, manca di verifica sperimentale adeguata
Complessità: La formalizzazione matematica è piuttosto complessa, potrebbe limitare l'applicazione pratica
Limitazioni delle Assunzioni: Dipende dall'assunzione che i dati siano effettivamente generati da uno pseudogruppo di Lie
Dettagli di Implementazione Mancanti: I dettagli dal passaggio dalla teoria all'algoritmo pratico non sono sufficientemente completi

Impatto

Contributo Teorico: Fornisce una nuova prospettiva per i fondamenti matematici dell'apprendimento profondo
Valore Metodologico: Fornisce guida per la progettazione di architetture neurali consapevoli della simmetria
Impatto Interdisciplinare: Potrebbe influenzare neuroscienze computazionali, robotica e altri campi
Valore a Lungo Termine: Il quadro teorico stabilito ha valore di ricerca a lungo termine

Scenari Applicabili

Domini con Simmetrie Esplicite: Come robotica e trasformazioni geometriche in visione artificiale
Dati Gerarchici: Tipi di dati con struttura gerarchica naturale
Compiti di Compressione: Applicazioni che richiedono compressione strutturata
Sistemi di Codifica Predittiva: Implementazioni di codifica predittiva che richiedono fondamenti teorici

Riferimenti Bibliografici

L'articolo cita lavori correlati ricchi, inclusi:

Cover & Thomas (2006): Fondamenti della teoria algoritmica dell'informazione
Goldschmidt (1967), Seiler (2010): Teoria di Spencer degli pseudogruppi di Lie
Poggio et al. (2016, 2020): Teoria della composizionalità nell'apprendimento profondo
Friston (2018): Teoria della codifica predittiva
Lynch & Park (2017): Metodi di gruppi di Lie nella robotica moderna

Valutazione Complessiva: Questo è un lavoro altamente teorico che tenta di stabilire un quadro matematico basato su pseudogruppi di Lie per agenti algoritmici intelligenti. Sebbene la formalizzazione matematica sia rigorosa e innovativa, richiede più verifica sperimentale per provare il suo valore pratico. Questo lavoro fornisce nuovi strumenti matematici per comprendere la simmetria e la struttura gerarchica nell'apprendimento profondo, con significato teorico importante.