To answer the question about the growth rate of matrix products, the concepts of joint and generalized spectral radius were introduced in the 1960s. A common tool for finding the joint/generalized spectral radius is the so-called extremal norms and, in particular, the Barabanov norm. The goal of this paper is to try to combine the advantages of different approaches based on the concept of extremality in order to obtain results that are simpler for everyday use. It is shown how the Dranishnikov-Konyagin theorem on the existence of a special invariant body for a set of matrices can be used to construct a Barabanov norm. A modified max-relaxation algorithm for constructing Barabanov norms, which follows from this theorem, is described. Additional techniques are also described that simplify the construction of Barabanov norms under the assumption that
- ID Articolo: 2509.02230
- Titolo: Notes on Simplifying the Construction of Barabanov Norms
- Autore: Victor Kozyakin (Higher School of Modern Mathematics MIPT, Russia)
- Classificazione: math.RA (Anelli e Algebre), cs.NA (Analisi Numerica), math.NA (Analisi Numerica)
- Data di Pubblicazione: Settembre 2025 (arXiv v2: 9 novembre 2025)
- Link Articolo: https://arxiv.org/abs/2509.02230
Questo articolo affronta il problema del tasso di crescita dei prodotti di matrici, caratterizzato attraverso i concetti di raggio spettrale congiunto e raggio spettrale generalizzato. La norma di Barabanov, come norma estremale, rappresenta uno strumento essenziale per il calcolo dei raggi spettrali congiunto/generalizzato. L'articolo mira a combinare i vantaggi di diversi approcci basati sul concetto di estremità, ottenendo risultati più facili da utilizzare nella pratica quotidiana. L'articolo dimostra come utilizzare il teorema di Dranishnikov-Konyagin (riguardante l'esistenza di corpi invarianti speciali per insiemi di matrici) per costruire norme di Barabanov, descrive un algoritmo max-relaxation migliorato e fornisce tecniche aggiuntive per semplificare la costruzione della norma di Barabanov quando è nota una certa norma estremale.
In matematica, teoria del controllo, fisica e altri campi, è frequente la necessità di rispondere a domande sul tasso di crescita/decadimento dei prodotti di matrici (operatori). Quando l'insieme di matrici A contiene un solo elemento, il problema può essere risolto calcolando il raggio spettrale di quella matrice; tuttavia, quando A contiene più elementi, il problema diventa estremamente complesso, senza soluzioni algoritmiche o computazionalmente "semplici".
- Significato Teorico: Il raggio spettrale congiunto e il raggio spettrale generalizzato sono strumenti fondamentali per caratterizzare la stabilità dei sistemi dinamici discreti
- Applicazioni Pratiche: Ampia applicazione nei sistemi commutati, sistemi di funzioni iterate, analisi wavelet e altri campi
- Complessità Computazionale: Il calcolo di queste quantità è stato provato essere NP-difficile, e in alcuni casi addirittura indecidibile
- Teorema di Barabanov: Dimostra l'esistenza di norme estremali (in particolare, norme B), ma il metodo di costruzione dipende da processi limite computazionalmente non fattibili
- Teorema di Dranishnikov-Konyagin: Fornisce l'esistenza di corpi invarianti (DK-body), ma gli algoritmi di costruzione pratica non sono ampiamente utilizzati
- Strumenti Esistenti: Il pacchetto t-toolboxs di MATLAB è potente ma ha limitazioni:
- Principalmente orientato al calcolo del raggio spettrale; la costruzione di norme estremali richiede lavoro aggiuntivo
- Dipende da software commerciale (MATLAB e più plugin a pagamento)
- Volume considerevole (circa 15 MB)
Sviluppare un metodo basato su approcci geometrici, con algoritmi semplici e facili da utilizzare nella pratica quotidiana per costruire norme di Barabanov, in particolare fornendo algoritmi leggeri (circa 8 KB di codice) implementabili in ambienti software gratuiti (Python).
- Contributo Teorico: Stabilisce l'equivalenza tra il teorema di Barabanov e il teorema di Dranishnikov-Konyagin, fornendo un nuovo percorso dimostrativo attraverso la tecnica della polarità
- Miglioramento Algoritmico: Propone un algoritmo max-relaxation migliorato basato sulla rilassazione del guscio convesso (Convex Hull Relaxation, CHR) per costruire il corpo di Dranishnikov-Konyagin, e successivamente ottenere la norma di Barabanov attraverso l'operazione di polarità
- Vantaggi Computazionali: Il nuovo algoritmo non richiede il calcolo di matrici inverse, quindi ha un ambito di applicazione più ampio (inclusi i casi di matrici singolari)
- Tecniche di Semplificazione: Fornisce lemmi aggiuntivi (Lemmi 4.3-4.5) per semplificare la costruzione della norma B quando è nota una norma estremale
- Codice di Implementazione: Fornisce un'implementazione Python completa (circa 150 righe di codice), dipendente da pacchetti software gratuiti, facilitando l'applicazione pratica
Dato un insieme di matrici irriducibile A={A1,…,Am}, l'obiettivo è:
- Input: Insieme di matrici A
- Output:
- Raggio spettrale congiunto ρ(A)
- Norma di Barabanov ∥⋅∥ che soddisfa maxi∥Aix∥=ρ(A)∥x∥
- Corpo di Dranishnikov-Konyagin M che soddisfa ρM=conv(⋃iAiM)
Per insiemi di matrici non singolari irriducibili, il teorema di Barabanov può essere equivalentemente espresso come: esiste un corpo convesso simmetrico rispetto al centro S (sfera unitaria della norma B) che soddisfa:
S=ρ⋂iAi−1S
Utilizzo delle proprietà della teoria della polarità:
- Per un insieme X⊂Rd, la sua polarità è definita come:
X∘={x′∈Rd:sup{∣⟨x,x′⟩∣:x∈X}≤1}
- Proprietà chiave: (AX)∘=(AT)−1X∘
Attraverso l'operazione di polarità, si trasforma la forma del teorema di Barabanov nella forma del teorema di Dranishnikov-Konyagin e viceversa, provando così l'equivalenza dei due teoremi.
Inizializzazione: Dato un corpo convesso simmetrico rispetto al centro M0, vettore e=0, funzione di media γ(t,s)
Passi Iterativi:
CHR1: Calcolare
ρn+=min{ρ:conv(⋃iAiMn)⊆ρMn}ρn−=max{ρ:ρMn⊆conv(⋃iAiMn)}
CHR2: Impostare γn=γ(ρn−,ρn+), definire il nuovo corpo:
Mn+1=conv{Mn,γn−1⋃iAiMn}
Calibrazione: Mn+1∙=μn+1Mn+1, dove μn+1 è tale che e∈∂Mn+1∙
Per qualsiasi insieme di matrici irriducibile e funzione di media, la sequenza prodotta dall'algoritmo CHR:
- {ρn±} converge a ρ(A)
- {Mn∙} converge in metrica di Hausdorff a un certo DK-body
- ρn− è monotonicamente crescente, ρn+ è monotonicamente decrescente, fornendo stime di errore a posteriori
Attraverso l'operazione di polarità si stabilisce la relazione duale tra il DK-body e la sfera unitaria della norma B:
M=S∘⇔S=M∘
Questa dualità consente di costruire indirettamente la norma B attraverso la costruzione del DK-body.
Per semplificare il calcolo, si utilizza la norma poligonale (sfera unitaria come poliedro convesso):
- Tutte le trasformazioni geometriche si semplificano in trasformazioni lineari dei vertici del poliedro e calcolo del guscio convesso
- In Python può essere implementato efficientemente utilizzando pacchetti come shapely, pyhull, ecc.
- Evita le difficoltà del calcolo diretto della funzione norma
L'algoritmo CHR utilizza la formula:
Mn+1=conv{Mn,γn−1⋃iAiMn}
senza necessità di calcolare Ai−1, rendendo l'algoritmo applicabile a matrici singolari.
Se è nota la norma estremale ∥⋅∥0, è possibile convergere monotonicamente alla norma B attraverso semplice iterazione:
∥x∥n+1=ρ1maxi∥Aix∥n
senza necessità di complessi processi max-relaxation.
Esempio 3.3:
A1=0.576[0.901.11],A2=0.8[11.000.9]
Raggio spettrale congiunto: ρ=1.098668
Esempio 4.9 (Insieme di matrici simmetriche):
A1=[1.1000.7],A2=[10.20.21]
Raggio spettrale: ρ(A1)=1.1, ρ(A2)=1.2, ρ(A)=1.2
Ambiente Software:
- Python 3.13.5
- matplotlib 3.10.5
- numpy 2.3.1
- shapely 2.1.1
Parametri Algoritmici:
- Tolleranza di convergenza:
TOL = 0.0000001 - Corpo iniziale: vertici del quadrato unitario
- Funzione di media: γ(t,s)=(t+s)/2
Flusso di Calcolo:
- Inizializzare il poligono M0
- Iterare CHR1-CHR2 fino a quando ρn+/ρn−−1<TOL
- Ottenere la sfera unitaria della norma B attraverso l'operazione di polarità:
barnorm_sphere = polar_polygon(hull) - Visualizzare i risultati
Risultati di Calcolo dell'Esempio 3.3:
- L'algoritmo converge in circa 10-20 iterazioni
- Calcolo preciso di ρ=1.098668
- La Figura 1 mostra il DK-body (linea continua nera) e la sfera unitaria della norma B (linea continua verde)
- ρ−1A1M e ρ−1A2M sono rappresentati rispettivamente con linea tratteggiata rossa e linea tratto-punto blu
- Verifica della relazione ρM=conv(A1M∪A2M)
Risultati di Calcolo dell'Esempio 4.9 (Figura 2):
- Caso di insieme di matrici simmetriche
- La norma euclidea è una norma estremale (sfera unitaria è un cerchio)
- La sfera unitaria della norma B presenta caratteristiche "angolari" (non è un'ellisse)
- Il DK-body presenta anche una struttura poliedrica
- Verifica delle proprietà speciali dell'insieme di matrici simmetriche
Velocità di Convergenza:
- Il numero di iterazioni è tipicamente tra 10-30
- Il tempo di calcolo di ogni iterazione è principalmente speso nel calcolo del guscio convesso
- Il tempo di calcolo totale è tipicamente a livello di secondi (per problemi 2D)
Stabilità Numerica:
- La sequenza {ρn−} è monotonicamente crescente, {ρn+} è monotonicamente decrescente
- Fornisce stime di errore a posteriori affidabili: ρn−≤ρ(A)≤ρn+
- L'approssimazione poligonale evita la perdita di precisione numerica
Osservazione 1: Per insiemi di matrici non simmetrici (Esempio 3.3), sia la sfera unitaria della norma B che il DK-body presentano una struttura poliedrica non ellittica, riflettendo l'asimmetria dell'insieme di matrici.
Osservazione 2: Anche per insiemi di matrici simmetrici (Esempio 4.9), la norma B può avere una sfera unitaria "angolosa", in contrasto con la forma ellittica liscia della norma estremale (norma euclidea). Ciò indica che la norma B cattura informazioni strutturali più raffinate.
Osservazione 3: I punti di confine del DK-body corrispondono alle direzioni di traiettoria di crescita più rapida, il che ha importanza significativa nella teoria del controllo.
Anni 1960:
- Rota & Strang 29 introducono il concetto di raggio spettrale congiunto
- Daubechies & Lagarias 8 introducono il concetto di raggio spettrale generalizzato
Fine degli Anni 1980:
- Barabanov 1-3 propone il metodo geometrico, provando l'esistenza della norma B
- Inaugura il metodo di analisi utilizzando insiemi invarianti e norme speciali
Anni 1990:
- Dranishnikov & Konyagin 25-27 propongono la teoria del DK-body
- Lagarias & Wang 22 propongono la congettura di finitezza (successivamente smentita)
Anni 2000 ad Oggi:
- Protasov 27 studia in dettaglio la norma DKP
- Guglielmi & Protasov 9 sviluppano algoritmi di calcolo preciso
- Jungers 12 sintetizza sistematicamente la teoria e le applicazioni
- Mejstrik 23,24 sviluppa il toolbox t-toolboxs
Rispetto al Lavoro Originale di Barabanov:
- Fornisce algoritmi più costruttivi
- Evita il processo limite diretto attraverso il DK-body
Rispetto al Lavoro di Protasov:
- Stabilisce esplicitamente il collegamento tra la norma B e la norma DKP
- Fornisce un quadro di calcolo unificato
Rispetto a t-toolboxs:
- Più focalizzato sulla costruzione della norma piuttosto che sul calcolo del raggio spettrale
- Codice più leggero (150 righe vs 15MB)
- Utilizza software gratuito (Python vs MATLAB)
- Più adatto per l'insegnamento e lo sviluppo rapido di prototipi
Rispetto all'Algoritmo max-relaxation 19,20:
- Evita il calcolo di matrici inverse
- Ambito di applicazione più ampio (incluse matrici singolari)
- Fornisce una nuova prospettiva teorica attraverso la tecnica di polarità
- Unificazione Teorica: Il teorema di Barabanov e il teorema di Dranishnikov-Konyagin sono essenzialmente equivalenti, potendo essere trasformati reciprocamente attraverso l'operazione di polarità
- Fattibilità Algoritmica: L'algoritmo CHR fornisce un metodo pratico per costruire il DK-body e la norma B, con:
- Convergenza garantita
- Stime di errore a posteriori
- Complessità computazionale relativamente bassa
- Semplicità di Implementazione: L'implementazione basata su norme poligonali richiede solo circa 150 righe di codice Python, dipendente da librerie standard open-source
- Estensione Teorica: Fornisce lemmi per semplificare la costruzione della norma B da una norma estremale nota, particolarmente utile in casi speciali (come insiemi di matrici simmetriche)
- Limitazioni Dimensionali:
- L'algoritmo è principalmente dimostrato in casi 2D
- La complessità del calcolo del guscio convesso aumenta significativamente in dimensioni elevate (esponenziale)
- L'articolo non fornisce analisi dettagliate delle prestazioni in casi ad alta dimensione
- Velocità di Convergenza:
- Sebbene la convergenza sia garantita, non è fornita un'analisi teorica della velocità di convergenza
- La velocità di convergenza effettiva dipende dalle proprietà dell'insieme di matrici e dalla scelta del corpo iniziale
- Caso di Matrici Singolari:
- Sebbene si affermi la capacità di gestire matrici singolari, i dettagli tecnici (Osservazione 2.4) non sono completamente sviluppati
- Richiede un trattamento teorico più attento
- Completezza Teorica:
- La prova del Teorema 3.2 fornisce solo uno "schema di prova" (Osservazione 3.4), ammettendo la necessità di chiarire i dettagli tecnici
- Alcuni lemmi (come 4.3-4.5) hanno utilità pratica limitata dalla necessità di conoscere preventivamente ρ(A)
- Precisione Numerica:
- La precisione dell'approssimazione poligonale dipende dal numero di vertici
- Non è discusso il compromesso tra precisione e costo computazionale
Direzioni di ricerca suggerite dall'articolo:
- Ottimizzazione Algoritmica:
- Migliorare l'efficienza computazionale in casi ad alta dimensione
- Studiare strategie di raffinamento della griglia adattiva
- Perfezionamento Teorico:
- Completare la prova di tutti i dettagli tecnici del Teorema 3.2
- Analizzare la velocità di convergenza
- Estensione Applicativa:
- Applicare il metodo alla progettazione di sistemi di controllo specifici
- Studiare l'applicazione nell'analisi della stabilità dei sistemi commutati
- Sviluppo Software:
- Sviluppare un pacchetto Python più completo
- Fornire strumenti di visualizzazione interattiva
- Elegante Unificazione: Attraverso la tecnica di polarità stabilisce l'equivalenza tra i due teoremi classici di Barabanov e Dranishnikov-Konyagin, fornendo una nuova prospettiva teorica
- Metodo Costruttivo: Trasforma i teoremi di esistenza in algoritmi calcolabili, con importante valore teorico e pratico
- Rigore Matematico: Sebbene alcuni dettagli di prova necessitino di perfezionamento, il percorso argomentativo principale è chiaro e rigoroso
- Evitare le Matrici Inverse: Questo è un importante progresso tecnico che amplia l'ambito di applicabilità del metodo
- Strategia della Norma Poligonale: Trasforma il calcolo astratto della norma in operazioni geometriche concrete, mantenendo l'eleganza teorica e facilitando l'implementazione
- Garanzia di Convergenza: Fornisce convergenza monotona e stime di errore a posteriori, aumentando l'affidabilità dell'algoritmo
- Implementazione Leggera: 150 righe di codice implementano la funzionalità principale, riducendo significativamente la barriera di ingresso
- Compatibilità Open-Source: Completamente basato su Python e librerie open-source, facilitando la condivisione accademica e l'insegnamento
- Supporto Visualizzazione: Fornisce chiare rappresentazioni grafiche, aiutando la comprensione di concetti astratti
- Valore Didattico: Il codice è semplice e chiaro, adatto come caso di studio didattico
- Struttura Chiara: La catena logica dalla motivazione alla teoria, algoritmo e implementazione è completa
- Revisione Storica: La rassegna dello sviluppo del campo è dettagliata, aiutando i lettori a comprendere il contesto
- Esempi Abbondanti: L'uso di esempi concreti per illustrare concetti astratti aumenta la leggibilità
- Prove Mancanti: Il Teorema 3.2 ammette di fornire solo uno "schema di prova", necessitando di "chiarire i dettagli tecnici" (Osservazione 3.4)
- Caso Singolare: Il trattamento delle matrici singolari (Osservazione 2.4) è solo "omesso (calcoli più complessi)", mancando di argomentazione completa
- Utilità Pratica dei Lemmi 4.3-4.5: Questi risultati richiedono di conoscere preventivamente ρ(A), limitando l'utilità pratica (l'Osservazione 4.6 stessa lo ammette)
- Limitazione Dimensionale: Tutti gli esperimenti utilizzano matrici 2×2, mancando di casi ad alta dimensione
- Analisi Prestazioni: Manca un'analisi quantitativa sistematica del tempo di calcolo, utilizzo di memoria e velocità di convergenza
- Confronto con t-toolboxs: Sebbene critichi le limitazioni di t-toolboxs, non fornisce confronti diretti di prestazioni
- Casi Limite: Mancano test su insiemi di matrici patologiche, matrici quasi singolari e altri casi difficili
- Scalabilità: La complessità del calcolo del guscio convesso è esponenziale nello spazio ad alta dimensione, limitando seriamente l'applicabilità pratica
- Controllo della Precisione: Il compromesso tra precisione dell'approssimazione poligonale e costo computazionale non è discusso
- Sensibilità all'Inizializzazione: Non è studiato l'impatto della scelta del corpo iniziale sulla velocità di convergenza
- Definizione di "Semplificazione": Il titolo enfatizza "simplifying", ma principalmente è la semplicità dell'implementazione algoritmica, non la semplificazione teorica
- Promesse Eccessive: L'affermazione che sia "adatto all'uso quotidiano degli studenti" potrebbe esagerare l'usabilità del metodo
- Qualità del Codice: Sebbene il codice in appendice sia funzionalmente completo, manca di documentazione e gestione degli errori
- Valore Teorico: Medio-alto. Stabilisce il collegamento tra due teoremi classici, ma non è un progresso fondamentale
- Valore del Metodo: Elevato. Fornisce algoritmi pratici e implementazione open-source, riducendo le barriere di ingresso
- Valore Didattico: Alto. Il codice semplice e gli esempi chiari sono molto adatti all'insegnamento
- Attualmente: Principalmente adatto allo sviluppo rapido di prototipi e dimostrazioni didattiche per problemi a bassa dimensione (2D-3D)
- Potenziale: Se risolvesse il problema della scalabilità ad alta dimensione, potrebbe avere applicazioni più ampie nella progettazione di sistemi di controllo
- Limitazioni: Per applicazioni industriali su larga scala, rimane necessaria la dipendenza da strumenti più maturi come t-toolboxs
- Eccellente: Fornisce codice Python completo (Appendice A), dipendente da librerie standard
- Repository GitHub: Il codice è pubblicamente disponibile su https://github.com/kozyakin/barnorm_via_dkbody
- Documentazione: I commenti nel codice sono limitati, ma la logica principale è chiara
- Estensibilità: La struttura del codice facilita modifiche e estensioni
- Insegnamento e Apprendimento:
- Comprendere i concetti di raggio spettrale congiunto e norma di Barabanov
- Imparare l'applicazione di metodi geometrici nell'analisi matriciale
- Come caso di studio per corsi di analisi numerica
- Sviluppo Rapido di Prototipi:
- Analisi di insiemi di matrici a bassa dimensione (2D-3D)
- Verifica di idee algoritmiche
- Dimostrazioni di visualizzazione
- Ricerca Teorica:
- Esplorare proprietà di classi speciali di matrici
- Verificare congetture teoriche
- Sviluppare varianti di nuovi algoritmi
- Applicazioni Industriali ad Alta Dimensione: Il costo computazionale è proibitivo quando la dimensione supera 5
- Calcolo in Tempo Reale: L'algoritmo iterativo non è adatto a scenari che richiedono risposte rapide
- Requisiti di Alta Precisione: La precisione dell'approssimazione poligonale è limitata
- Con t-toolboxs: Questo metodo può servire come alternativa leggera per analisi preliminari e insegnamento
- Con Analisi Teorica: Può essere utilizzato per verificare risultati teorici e fornire esempi numerici
- Con Altri Algoritmi: Può servire come metodo di inizializzazione per algoritmi più complessi
Teoria Fondamentale:
- 1-3 N.E. Barabanov (1988): Articoli originali sulla norma di Barabanov
- 25-27 Dranishnikov, Konyagin, Protasov: Teoria del DK-body
- 29 Rota & Strang (1960): Lavoro fondamentale sul raggio spettrale congiunto
Sviluppo Algoritmico:
- 19-20 V. Kozyakin (2010): Algoritmo max-relaxation
- 23-24 T. Mejstrik (2020, 2025): Toolbox t-toolboxs
Fondamenti Teorici:
- 11 Horn & Johnson (2013): Manuale standard di analisi matriciale
- 28 Robertson & Robertson (1964): Teoria della polarità negli spazi vettoriali topologici
Questo è un articolo con valore pratico nel campo del calcolo del raggio spettrale congiunto e della norma di Barabanov. I suoi contributi principali risiedono nell'unificazione di due teoremi classici attraverso la tecnica di polarità e nella fornitura di un algoritmo leggero e facile da implementare. L'articolo è particolarmente adatto all'insegnamento e all'analisi rapida di problemi a bassa dimensione, ma ha ancora spazio per miglioramenti nella scalabilità ad alta dimensione e nella completezza teorica. Per i ricercatori e gli studenti che desiderano comprendere i concetti e i metodi fondamentali in questo campo, questo è un eccellente materiale di riferimento.