To answer the question about the growth rate of matrix products, the concepts of joint and generalized spectral radius were introduced in the 1960s. A common tool for finding the joint/generalized spectral radius is the so-called extremal norms and, in particular, the Barabanov norm. The goal of this paper is to try to combine the advantages of different approaches based on the concept of extremality in order to obtain results that are simpler for everyday use. It is shown how the Dranishnikov-Konyagin theorem on the existence of a special invariant body for a set of matrices can be used to construct a Barabanov norm. A modified max-relaxation algorithm for constructing Barabanov norms, which follows from this theorem, is described. Additional techniques are also described that simplify the construction of Barabanov norms under the assumption that
- ID del Artículo: 2509.02230
- Título: Notes on Simplifying the Construction of Barabanov Norms
- Autor: Victor Kozyakin (Higher School of Modern Mathematics MIPT, Rusia)
- Clasificación: math.RA (Anillos y Álgebras), cs.NA (Análisis Numérico), math.NA (Análisis Numérico)
- Fecha de Publicación: Septiembre de 2025 (arXiv v2: 9 de noviembre de 2025)
- Enlace del Artículo: https://arxiv.org/abs/2509.02230
Este artículo estudia el problema de la tasa de crecimiento de productos de matrices, que se caracteriza mediante los conceptos de radio espectral conjunto y radio espectral generalizado. La norma de Barabanov, como norma extremal, es una herramienta importante para calcular los radios espectrales conjunto/generalizado. El artículo tiene como objetivo combinar las ventajas de diferentes métodos basados en conceptos de extremalidad para obtener resultados más fáciles de usar en la práctica diaria. El artículo muestra cómo utilizar el teorema de Dranishnikov-Konyagin (sobre la existencia de invariantes especiales para conjuntos de matrices) para construir normas de Barabanov, describe un algoritmo mejorado de max-relajación, y proporciona técnicas adicionales para simplificar la construcción de normas de Barabanov cuando se conoce alguna norma extremal.
En matemáticas, teoría de control, física y otros campos, frecuentemente es necesario responder preguntas sobre la tasa de crecimiento/decaimiento de productos de matrices (operadores). Cuando el conjunto de matrices A contiene solo un elemento, el problema puede resolverse calculando el radio espectral de esa matriz; sin embargo, cuando A contiene múltiples elementos, el problema se vuelve extremadamente complejo, sin algoritmos o respuestas "simples" desde el punto de vista computacional.
- Significado Teórico: El radio espectral conjunto y el radio espectral generalizado son herramientas fundamentales para caracterizar la estabilidad de sistemas dinámicos discretos
- Aplicaciones Prácticas: Tienen aplicaciones amplias en sistemas conmutados, sistemas de funciones iteradas, análisis de wavelets y otros campos
- Complejidad Computacional: Se ha demostrado que el cálculo de estas cantidades es un problema NP-hard, e incluso indecidible en ciertos casos
- Teorema de Barabanov: Demuestra la existencia de normas extremales (en particular, normas B), pero el método de construcción depende de procesos límite computacionalmente inviables
- Teorema de Dranishnikov-Konyagin: Proporciona la existencia de invariantes (cuerpo DK), pero los algoritmos de construcción práctica no se utilizan ampliamente
- Herramientas Existentes: El paquete t-toolboxs de MATLAB es potente pero tiene limitaciones:
- Se enfoca principalmente en el cálculo del radio espectral; la construcción de normas extremales requiere trabajo adicional
- Depende de software comercial (MATLAB y múltiples complementos pagos)
- Tamaño considerable (aproximadamente 15 MB)
Desarrollar un método basado en técnicas geométricas, algorítmicamente simple y fácil de usar en la práctica diaria para construir normas de Barabanov, proporcionando en particular un algoritmo ligero (aproximadamente 8 KB de código) que pueda implementarse en entornos de software libre (Python).
- Contribución Teórica: Establece la equivalencia entre el teorema de Barabanov y el teorema de Dranishnikov-Konyagin, proporcionando una nueva ruta de demostración mediante técnicas de polaridad
- Mejora Algorítmica: Propone un algoritmo mejorado de max-relajación basado en relajación de casco convexo (Convex Hull Relaxation, CHR) para construir cuerpos de Dranishnikov-Konyagin, y luego obtener normas de Barabanov mediante operaciones de polaridad
- Ventajas Computacionales: El nuevo algoritmo no requiere calcular matrices inversas, por lo que tiene un rango de aplicabilidad más amplio (incluyendo el caso de matrices singulares)
- Técnicas de Simplificación: Proporciona lemas adicionales (Lemas 4.3-4.5) para simplificar la construcción de normas B cuando se conoce alguna norma extremal
- Código de Implementación: Proporciona una implementación completa en Python (aproximadamente 150 líneas de código) que depende de paquetes de software libre, facilitando la aplicación práctica
Dado un conjunto de matrices irreducible A={A1,…,Am}, el objetivo es:
- Entrada: Conjunto de matrices A
- Salida:
- Radio espectral conjunto ρ(A)
- Norma de Barabanov ∥⋅∥ que satisface maxi∥Aix∥=ρ(A)∥x∥
- Cuerpo de Dranishnikov-Konyagin M que satisface ρM=conv(⋃iAiM)
Para conjuntos de matrices no singulares e irreducibles, el teorema de Barabanov puede expresarse equivalentemente como: existe un cuerpo convexo centralmente simétrico S (la bola unitaria de la norma B) que satisface:
S=ρ⋂iAi−1S
Utilización de propiedades de la teoría de polaridad:
- Para un conjunto X⊂Rd, su polar se define como:
X∘={x′∈Rd:sup{∣⟨x,x′⟩∣:x∈X}≤1}
- Propiedad clave: (AX)∘=(AT)−1X∘
Mediante la operación de polaridad, se convierte la forma del teorema de Barabanov a la forma del teorema de Dranishnikov-Konyagin y viceversa, demostrando así la equivalencia de ambos teoremas.
Inicialización: Dado un cuerpo convexo centralmente simétrico M0, vector e=0, función de promediación γ(t,s)
Pasos de Iteración:
CHR1: Calcular
ρn+=min{ρ:conv(⋃iAiMn)⊆ρMn}ρn−=max{ρ:ρMn⊆conv(⋃iAiMn)}
CHR2: Establecer γn=γ(ρn−,ρn+), definir el nuevo cuerpo:
Mn+1=conv{Mn,γn−1⋃iAiMn}
Calibración: Mn+1∙=μn+1Mn+1, donde μn+1 satisface e∈∂Mn+1∙
Para cualquier conjunto de matrices irreducible y función de promediación, la secuencia producida por el algoritmo CHR:
- {ρn±} converge a ρ(A)
- {Mn∙} converge en la métrica de Hausdorff a algún cuerpo DK
- ρn− es monótonamente creciente, ρn+ es monótonamente decreciente, proporcionando estimaciones de error a posteriori
Mediante operaciones de polaridad se establece una relación dual entre cuerpos DK y bolas unitarias de normas B:
M=S∘⇔S=M∘
Esta dualidad permite construir normas B de manera indirecta mediante la construcción de cuerpos DK.
Para simplificar el cálculo, se utilizan normas poligonales (cuya bola unitaria es un poliedro convexo):
- Todas las transformaciones geométricas se simplifican a transformaciones lineales de vértices de poliedros y cálculos de casco convexo
- En Python puede implementarse eficientemente utilizando paquetes como shapely, pyhull, etc.
- Se evita la dificultad de calcular directamente funciones de norma
El algoritmo CHR utiliza la fórmula:
Mn+1=conv{Mn,γn−1⋃iAiMn}
sin necesidad de calcular Ai−1, lo que permite que el algoritmo sea aplicable a matrices singulares.
Si se conoce una norma extremal ∥⋅∥0, puede converger monótonamente a la norma B mediante iteración simple:
∥x∥n+1=ρ1maxi∥Aix∥n
sin necesidad de procesos complejos de max-relajación.
Ejemplo 3.3:
A1=0.576[0.901.11],A2=0.8[11.000.9]
Radio espectral conjunto: ρ=1.098668
Ejemplo 4.9 (Conjunto de matrices simétricas):
A1=[1.1000.7],A2=[10.20.21]
Radio espectral: ρ(A1)=1.1, ρ(A2)=1.2, ρ(A)=1.2
Entorno de Software:
- Python 3.13.5
- matplotlib 3.10.5
- numpy 2.3.1
- shapely 2.1.1
Parámetros del Algoritmo:
- Tolerancia de convergencia:
TOL = 0.0000001 - Cuerpo inicial: vértices del cuadrado unitario
- Función de promediación: γ(t,s)=(t+s)/2
Flujo de Cálculo:
- Inicializar polígono M0
- Iterar aplicando CHR1-CHR2 hasta que ρn+/ρn−−1<TOL
- Obtener la bola unitaria de la norma B mediante operación de polaridad:
barnorm_sphere = polar_polygon(hull) - Visualizar resultados
Resultados de Cálculo del Ejemplo 3.3:
- El algoritmo converge en aproximadamente 10-20 iteraciones
- Calcula con precisión ρ=1.098668
- La Figura 1 muestra el cuerpo DK (línea sólida negra) y la bola unitaria de la norma B (línea sólida verde)
- ρ−1A1M y ρ−1A2M se representan respectivamente con línea punteada roja y línea de puntos y rayas azul
- Se verifica la relación ρM=conv(A1M∪A2M)
Resultados de Cálculo del Ejemplo 4.9 (Figura 2):
- Caso de conjunto de matrices simétricas
- La norma euclidiana es una norma extremal (la bola unitaria es un círculo)
- La bola unitaria de la norma B presenta características "angulares" (no es una elipse)
- El cuerpo DK también presenta estructura poligonal
- Se verifican las propiedades especiales del conjunto de matrices simétricas
Velocidad de Convergencia:
- El número de iteraciones típicamente está entre 10-30
- El tiempo de cálculo en cada iteración se gasta principalmente en el cálculo del casco convexo
- El tiempo de cálculo total típicamente está en el rango de segundos (para problemas 2D)
Estabilidad Numérica:
- La secuencia {ρn−} es monótonamente creciente, {ρn+} es monótonamente decreciente
- Proporciona estimaciones de error a posteriori confiables: ρn−≤ρ(A)≤ρn+
- La aproximación poligonal evita pérdida de precisión numérica
Observación 1: Para conjuntos de matrices no simétricas (Ejemplo 3.3), tanto la bola unitaria de la norma B como el cuerpo DK presentan estructura poligonal no elíptica, reflejando la asimetría del conjunto de matrices.
Observación 2: Incluso para conjuntos de matrices simétricas (Ejemplo 4.9), la norma B puede tener una bola unitaria con características "angulares", en contraste con la forma elíptica suave de la norma extremal (norma euclidiana). Esto indica que la norma B captura información de estructura más fina.
Observación 3: Los puntos fronterizos del cuerpo DK corresponden a direcciones de trayectoria de crecimiento más rápido, lo que tiene importancia significativa en teoría de control.
Años 1960:
- Rota & Strang 29 introducen el concepto de radio espectral conjunto
- Daubechies & Lagarias 8 introducen el concepto de radio espectral generalizado
Finales de los años 1980:
- Barabanov 1-3 propone métodos geométricos, demostrando la existencia de normas B
- Inaugura métodos de análisis utilizando conjuntos invariantes y normas especiales
Años 1990:
- Dranishnikov & Konyagin 25-27 proponen la teoría de cuerpos DK
- Lagarias & Wang 22 proponen la conjetura de finitud (posteriormente refutada)
Años 2000 hasta el presente:
- Protasov 27 estudia en detalle las normas DKP
- Guglielmi & Protasov 9 desarrollan algoritmos de cálculo exacto
- Jungers 12 resume sistemáticamente la teoría y aplicaciones
- Mejstrik 23,24 desarrolla el paquete de herramientas t-toolboxs
En comparación con el trabajo original de Barabanov:
- Proporciona algoritmos más constructivos
- Evita procesos límite directos mediante cuerpos DK
En comparación con el trabajo de Protasov:
- Establece explícitamente la conexión entre normas B y normas DKP
- Proporciona un marco computacional unificado
En comparación con t-toolboxs:
- Se enfoca más en la construcción de normas que en el cálculo del radio espectral
- Código más ligero (150 líneas vs 15MB)
- Utiliza software libre (Python vs MATLAB)
- Más adecuado para desarrollo rápido de prototipos y enseñanza
En comparación con el algoritmo de max-relajación 19,20:
- Evita el cálculo de matrices inversas
- Rango de aplicabilidad más amplio (incluyendo matrices singulares)
- Proporciona nueva perspectiva teórica mediante técnicas de polaridad
- Unificación Teórica: El teorema de Barabanov y el teorema de Dranishnikov-Konyagin son esencialmente equivalentes, pudiendo convertirse mutuamente mediante operaciones de polaridad
- Viabilidad del Algoritmo: El algoritmo CHR proporciona un método práctico para construir cuerpos DK y normas B, con:
- Convergencia garantizada
- Estimaciones de error a posteriori
- Complejidad computacional relativamente baja
- Facilidad de Implementación: La implementación basada en normas poligonales requiere solo aproximadamente 150 líneas de código Python, dependiendo de bibliotecas estándar de código abierto
- Extensión Teórica: Proporciona lemas para simplificar la construcción de normas B a partir de normas extremales conocidas, particularmente útil en casos especiales (como conjuntos de matrices simétricas)
- Restricción de Dimensionalidad:
- El algoritmo se demuestra principalmente en casos 2D
- La complejidad del cálculo del casco convexo en espacios de alta dimensión aumenta significativamente (exponencialmente)
- El artículo no proporciona análisis detallado de rendimiento en casos de alta dimensión
- Velocidad de Convergencia:
- Aunque se garantiza la convergencia, no se proporciona análisis teórico de la velocidad de convergencia
- La velocidad de convergencia real depende de las propiedades del conjunto de matrices y la elección del cuerpo inicial
- Caso de Matrices Singulares:
- Aunque se afirma que puede manejar matrices singulares, los detalles técnicos (Observación 2.4) no se desarrollan completamente
- Requiere tratamiento teórico más cuidadoso
- Completitud Teórica:
- La prueba del Teorema 3.2 solo proporciona un "esquema de prueba" (Observación 3.4), reconociendo la necesidad de aclarar detalles técnicos
- Algunos lemas (como 4.3-4.5) tienen utilidad práctica limitada por la necesidad de conocer previamente ρ(A)
- Precisión Numérica:
- La precisión de la aproximación poligonal depende del número de vértices
- No se discute el equilibrio entre precisión y costo computacional
Direcciones de investigación sugeridas por el artículo:
- Optimización de Algoritmos:
- Mejorar la eficiencia computacional en casos de alta dimensión
- Investigar estrategias de refinamiento de malla adaptativa
- Perfeccionamiento Teórico:
- Completar la prueba de todos los detalles técnicos del Teorema 3.2
- Analizar la velocidad de convergencia
- Extensión de Aplicaciones:
- Aplicar el método al diseño de sistemas de control específicos
- Investigar aplicaciones en análisis de estabilidad de sistemas conmutados
- Desarrollo de Software:
- Desarrollar un paquete Python más completo
- Proporcionar herramientas de visualización interactiva
- Unificación Elegante: Mediante técnicas de polaridad, establece la equivalencia entre los dos teoremas clásicos de Barabanov y Dranishnikov-Konyagin, proporcionando una nueva perspectiva teórica
- Método Constructivo: Convierte teoremas de existencia en algoritmos computables, con valor teórico y práctico importante
- Rigor Matemático: Aunque algunos detalles de prueba necesitan perfeccionamiento, la ruta de argumentación principal es clara y rigurosa
- Evitar Matrices Inversas: Este es un avance técnico importante que expande el rango de aplicabilidad del método
- Estrategia de Normas Poligonales: Convierte el cálculo abstracto de normas en operaciones geométricas concretas, manteniendo la elegancia teórica mientras facilita la implementación
- Garantía de Convergencia: Proporciona convergencia monótona y estimaciones de error a posteriori, mejorando la confiabilidad del algoritmo
- Implementación Ligera: 150 líneas de código implementan la funcionalidad principal, reduciendo significativamente la barrera de entrada
- Amigable con Código Abierto: Completamente basado en Python y bibliotecas de código abierto, facilitando el intercambio académico y la enseñanza
- Soporte de Visualización: Proporciona visualización gráfica clara, ayudando a entender conceptos abstractos
- Valor Educativo: El código es simple y claro, adecuado como caso de estudio para enseñanza
- Estructura Clara: La cadena lógica de motivación a teoría, algoritmo e implementación es completa
- Revisión Histórica: La revisión del desarrollo del campo es detallada, ayudando a los lectores a entender el contexto
- Ejemplos Abundantes: Mediante ejemplos concretos se ilustran conceptos abstractos, mejorando la legibilidad
- Pruebas Faltantes: El Teorema 3.2 reconoce solo proporcionar un "esquema de prueba", necesitando "aclarar detalles técnicos" (Observación 3.4)
- Casos Singulares: El tratamiento de matrices singulares (Observación 2.4) solo "omite (cálculos más complejos)", careciendo de argumentación completa
- Utilidad Práctica de Lemas 4.3-4.5: Estos resultados requieren conocer previamente ρ(A), limitando su utilidad práctica (la propia Observación 4.6 lo reconoce)
- Restricción de Dimensionalidad: Todos los experimentos son con matrices 2×2, careciendo de casos de alta dimensión
- Análisis de Rendimiento: No hay análisis cuantitativo sistemático de tiempo de cálculo, uso de memoria, velocidad de convergencia
- Comparación con t-toolboxs: Aunque critica las limitaciones de t-toolboxs, no proporciona comparación directa de rendimiento
- Casos Límite: Carece de pruebas de matrices mal condicionadas, matrices casi singulares y otros casos difíciles
- Escalabilidad: La complejidad del cálculo del casco convexo en espacios de alta dimensión es exponencial, limitando severamente la aplicabilidad práctica
- Control de Precisión: El equilibrio entre precisión de aproximación poligonal y costo computacional no se discute
- Sensibilidad de Inicialización: No se investiga el impacto de la elección del cuerpo inicial en la velocidad de convergencia
- Definición de "Simplificación": El título enfatiza "simplifying", pero principalmente es simplicidad en la implementación del algoritmo, no simplificación teórica
- Promesas Excesivas: Afirmar que es "adecuado para uso diario de estudiantes" puede exagerar la facilidad de uso del método
- Calidad del Código: Aunque el código en el apéndice es funcionalmente completo, carece de documentación de comentarios y manejo de errores
- Valor Teórico: Medio-alto. Establece conexión entre dos teoremas clásicos, pero no es un avance fundamental
- Valor del Método: Alto. Proporciona algoritmo práctico e implementación de código abierto, reduciendo barreras de entrada
- Valor Educativo: Alto. El código simple y ejemplos claros son muy adecuados para enseñanza
- Actual: Principalmente adecuado para desarrollo rápido de prototipos y demostración educativa de problemas de baja dimensión (2D-3D)
- Potencial: Si se resuelve el problema de escalabilidad en alta dimensión, podría tener aplicaciones más amplias en diseño de sistemas de control
- Limitación: Para aplicaciones industriales a gran escala, aún se requieren herramientas más maduras como t-toolboxs
- Excelente: Proporciona código Python completo (Apéndice A), dependiendo de bibliotecas estándar
- Repositorio GitHub: El código está disponible públicamente en https://github.com/kozyakin/barnorm_via_dkbody
- Documentación: Los comentarios del código son limitados, pero la lógica principal es clara
- Extensibilidad: La estructura del código facilita modificaciones y extensiones
- Enseñanza y Aprendizaje:
- Entender conceptos de radio espectral conjunto y norma de Barabanov
- Aprender aplicaciones de métodos geométricos en análisis de matrices
- Caso de estudio para cursos de análisis numérico
- Desarrollo Rápido de Prototipos:
- Análisis de conjuntos de matrices de baja dimensión (2D-3D)
- Verificación de ideas de algoritmos
- Demostración de visualización
- Investigación Teórica:
- Explorar propiedades de clases especiales de matrices
- Verificar conjeturas teóricas
- Desarrollar variantes de nuevos algoritmos
- Aplicaciones Industriales de Alta Dimensión: Cuando la dimensión excede 5, el costo computacional es demasiado alto
- Cálculo en Tiempo Real: Los algoritmos iterativos no son adecuados para escenarios que requieren respuesta rápida
- Requisitos de Alta Precisión: La precisión de la aproximación poligonal es limitada
- Con t-toolboxs: Este método puede servir como alternativa ligera para análisis preliminar y enseñanza
- Con Análisis Teórico: Puede usarse para verificar resultados teóricos y proporcionar ejemplos numéricos
- Con Otros Algoritmos: Puede servir como método de inicialización, proporcionando punto de partida para algoritmos más complejos
Teoría Fundamental:
- 1-3 N.E. Barabanov (1988): Artículos originales sobre normas de Barabanov
- 25-27 Dranishnikov, Konyagin, Protasov: Teoría de cuerpos DK
- 29 Rota & Strang (1960): Trabajo pionero sobre radio espectral conjunto
Desarrollo de Algoritmos:
- 19-20 V. Kozyakin (2010): Algoritmo de max-relajación
- 23-24 T. Mejstrik (2020, 2025): Paquete de herramientas t-toolboxs
Fundamentos Teóricos:
- 11 Horn & Johnson (2013): Libro de texto estándar de análisis de matrices
- 28 Robertson & Robertson (1964): Teoría de polaridad en espacios vectoriales topológicos
Este es un artículo con valor práctico en el campo del cálculo de radios espectrales conjuntos y normas de Barabanov. Sus principales contribuciones radican en unificar dos teoremas clásicos mediante técnicas de polaridad y proporcionar un algoritmo ligero y fácil de implementar. El artículo es particularmente adecuado para enseñanza y análisis rápido de problemas de baja dimensión, aunque aún hay espacio para mejora en escalabilidad de alta dimensión y completitud teórica. Para investigadores y estudiantes que deseen entender conceptos y métodos fundamentales en este campo, este es un excelente material de referencia.