This work is concerned with variational analysis of so-called spectral functions and spectral sets of matrices that only depend on eigenvalues of the matrix. Based on our previous work [H. T. Bùi, M. N. Bùi, and C. Clason, Convex analysis in spectral decomposition systems, arXiv 2503.14981] on convex analysis of such functions, we consider the question in the abstract framework of spectral decomposition systems, which covers a wide range of previously studied settings, including eigenvalue decomposition of Hermitian matrices and singular value decomposition of rectangular matrices, and allows deriving new results in more general settings such as normal decomposition systems and signed singular value decompositions. The main results characterize Fréchet and limiting normal cones to spectral sets as well as Fréchet, limiting, and Clarke subdifferentials of spectral functions in terms of the reduced functions. For the latter, we also characterize Fréchet differentiability. Finally, we obtain a generalization of Lidski\uı's theorem on the spectrum of additive perturbations of Hermitian matrices to arbitrary spectral decomposition systems.
- Papier-ID: 2510.11433
- Titel: Variationsanalyse in Spektralzerlegungssystemen
- Autoren: Hòa T. Bùi (Curtin University), Minh N. Bùi (University of Graz), Christian Clason (University of Graz)
- Klassifizierung: math.OC (Optimierung und Steuerung)
- Veröffentlichungsdatum: 13. Oktober 2025 (arXiv-Preprint)
- Papier-Link: https://arxiv.org/abs/2510.11433
Dieses Papier untersucht die Variationsanalyse von Spektralfunktionen und Spektralmengen, die nur von den Eigenwerten einer Matrix abhängen. Basierend auf früheren Arbeiten der Autoren zur konvexen Analyse solcher Funktionen wird das Problem im abstrakten Rahmen von Spektralzerlegungssystemen betrachtet. Dieser Rahmen umfasst eine breite Palette bereits untersuchter Einstellungen, einschließlich der Eigenzerlegung hermitescher Matrizen und der Singularwertzerlegung rechteckiger Matrizen, und ermöglicht es, neue Ergebnisse in allgemeineren Einstellungen wie normalen Zerlegungssystemen und vorzeichenbehafteter Singularwertzerlegung abzuleiten. Die Hauptergebnisse charakterisieren die Fréchet- und Grenznormalkegel von Spektralmengen sowie die Fréchet-, Grenz- und Clarke-Subdifferenziale von Spektralfunktionen durch reduzierte Funktionen. Für letztere wird auch die Fréchet-Differenzierbarkeit charakterisiert. Schließlich wird eine Verallgemeinerung des Lidskiĭ-Theorems über das Spektrum additiver Störungen hermitescher Matrizen auf beliebige Spektralzerlegungssysteme erhalten.
- Praktische Anforderungen: Viele praktisch relevante Optimierungsprobleme werden natürlicherweise in Matrixform statt in Vektorform formuliert, wie nichtnegativer Matrixfaktorisierung, Matrixvervollständigung, Niedrigrangapproximation und Operatorlernen.
- Basisinvarianz: Bei Anwendungen wie Operatorlernen interessiert man sich für die Optimierung endlichdimensionaler linearer Operatoren statt ihrer spezifischen Matrixdarstellung, was erfordert, dass die Zielfunktion unter Basiswechsel invariant bleibt.
- Universalität von Spektralfunktionen: Unter angemessenen Annahmen werden solche invarianten Funktionen vollständig durch ihre Abhängigkeit von Eigenwerten (oder Singularwerten) charakterisiert, wie beispielsweise die Kernnorm einer Matrix.
Spektralfunktionen sind in zahlreichen Anwendungen allgegenwärtig:
- Robuste Matrixschätzung
- Signalverarbeitung
- Kegeloptimierung
- Semidefinite Programmierung
- Nichtlineare Elastizität
- Gehirnnetzwerkanalyse
Obwohl viele solcher Probleme als konvexe Probleme formuliert werden können, ist dies nicht immer der Fall. Beispiele:
- Minimierung von Schatten-p-Normen (0 < p < 1) bei Niedrigrangmatrixvervollständigung
- Mathematische Programmierung mit semidefiniten Komplementaritätsbeschränkungen (SDCMPCC)
Die Hauptherausforderung bestehender Arbeiten besteht darin, dass invariante Funktionen nur von der Menge der Eigenwerte und nicht von ihrer Ordnung abhängen, und dass verschiedene Arbeiten isoliert spezifische Einstellungen behandeln.
Dieses Papier zielt darauf ab, Ergebnisse zu Fréchet-, Grenz- und Clarke-Subdifferenzialen sowie Fréchet-Differenzierbarkeit in einem einheitlichen Rahmen zu vereinen, der alle diese Einstellungen umfasst und es ermöglicht, Ergebnisse für noch nicht abgedeckte Einstellungen und Objekte leichter abzuleiten.
- Einheitlicher theoretischer Rahmen: Etablierung eines abstrakten Rahmens für Spektralzerlegungssysteme, der verschiedene zuvor isoliert untersuchte Einstellungen vereint (hermitesche Matrizen, rechteckige Matrizen, euklidische Jordan-Algebren usw.).
- Charakterisierung der Variationsgeometrie: Vollständige Charakterisierung der Fréchet- und Grenznormalkegel von Spektralmengen:
N#(X;γ−1(D))={Λay∣y∈NF(γ(X);D) und a∈AX}
- Subdifferenzialformeln: Etablierung einer vollständigen Charakterisierung der Fréchet- und Grenz-Subdifferenziale von Spektralfunktionen:
∂#(φ∘γ)(X)={Λay∣y∈∂#φ(γ(X)) und a∈AX}
- Charakterisierung der Differenzierbarkeit: Vollständige Charakterisierung der Fréchet-Differenzierbarkeit von Spektralfunktionen und ihrer Ableitungen.
- Clarke-Subdifferenzial: Darstellung des Clarke-Subdifferenzials von Spektralfunktionen.
- Verallgemeinertes Lidskiĭ-Theorem: Verallgemeinerung des klassischen Lidskiĭ-Theorems auf beliebige Spektralzerlegungssysteme.
Definition 2.1 (Spektralzerlegungssystem): Ein Spektralzerlegungssystem des euklidischen Raums ℌ ist ein Quadrupel 𝔖 = (𝒳, S, γ, (Λₐ)ₐ∈A), wobei:
- 𝒳 ein euklidischer Raum ist
- S eine Gruppe ist, die durch lineare Isometrien auf 𝒳 wirkt
- γ:ℌ → 𝒳 die Spektralabbildung ist
- (Λₐ)ₐ∈A eine Familie linearer Isometrien von 𝒳 nach ℌ ist
mit drei Kompatibilitätsbedingungen:
- A Es existiert eine S-invariante Abbildung τ:𝒳 → 𝒳 mit τ(x) ∈ S·x und γ ∘ Λₐ = τ
- B Für jedes X ∈ ℌ existiert a ∈ A mit X = Λₐγ(X)
- C Verallgemeinerte von-Neumann-Spurungleichung: ⟨X|Y⟩ ≤ ⟨γ(X)|γ(Y)⟩
Definition 2.3:
- Spektralfunktion: Φ:ℌ → -∞,+∞ ist eine Spektralfunktion genau dann, wenn γ(X) = γ(Y) ⇒ Φ(X) = Φ(Y)
- Spektralmenge: D ⊂ ℌ ist eine Spektralmenge genau dann, wenn ihre Indikatorfunktion eine Spektralfunktion ist
Schlüsselcharakterisierung (Proposition 2.4): Eine Funktion Φ ist eine Spektralfunktion genau dann, wenn es eine S-invariante Funktion φ gibt, so dass Φ = φ ∘ γ.
- Geometrische Methode: Übertragung von Normalkegelergebnissen von Spektralmengen zu Subdifferenzialen von Spektralfunktionen durch Standardtechniken zum Epigraphen.
- Produktraumtechnik: Verwendung von Produktraum-Spektralzerlegungssystemen (Beispiel 2.14) zur Behandlung von Epigraphen.
- Kompaktheitargument: Verwendung der Abgeschlossenheit von {Λₐ}ₐ∈A in Annahme 2.2 zur Etablierung von Kompaktheit durch Proposition 2.18.
Dieses Papier ist hauptsächlich eine theoretische Arbeit, die die Universalität des Rahmens durch mehrere konkrete Beispiele verifiziert:
- Eigenzerlegung hermitescher Matrizen (Beispiel 2.11)
- Singularwertzerlegung rechteckiger Matrizen (Beispiel 2.12)
- Euklidische Jordan-Algebren (Beispiel 2.10)
- Normale Zerlegungssysteme (Beispiel 2.8)
- Vorzeichenbehaftete Singularwertzerlegung (Beispiel 2.13)
- Nachweis, dass jedes konkrete Beispiel die Definition eines Spektralzerlegungssystems erfüllt
- Verifikation, dass die Abgeschlossenheitsannahme (Annahme 2.2) in allen Beispielen erfüllt ist
- Demonstration, wie bekannte spezifische Ergebnisse aus der allgemeinen Theorie zurückgewonnen werden
Theorem 4.1 (Subdifferenzialcharakterisierung): Sei φ:𝒳 → -∞,+∞ S-invariant, dann:
- Fréchet-Subdifferenzial: ∂F(φ ∘ γ)(X) = {Λₐy | y ∈ ∂Fφ(γ(X)) und a ∈ A_X}
- Grenz-Subdifferenzial: ∂L(φ ∘ γ)(X) = {Λₐy | y ∈ ∂Lφ(γ(X)) und a ∈ A_X}
Korollar 4.8 (Differenzierbarkeitscharakterisierung): φ ∘ γ ist bei Λₐx Fréchet-differenzierbar genau dann, wenn φ bei x Fréchet-differenzierbar ist, in welchem Fall:
∇(φ∘γ)(Λax)=Λa(∇φ(x))
Proposition 4.11 (Clarke-Subdifferenzial):
∂C(φ∘γ)(X)=conv{Λay∣y∈∂Cφ(γ(X)) und a∈AX}
Theorem 5.1 (Verallgemeinertes Lidskiĭ-Theorem): Wenn S eine endliche Gruppe ist, dann:
γ(X+Y)−γ(X)∈conv(S⋅γ(Y))
Die Ergebnisse dieses Papiers vereinen mehrere bekannte Ergebnisse:
- Ergebnisse von Lewis 31 zu hermiteschen Matrizen
- Ergebnisse von Lewis-Sendov 34,35 zu Singularwerten
- Ergebnisse von Lourenço-Takeda 37 zu euklidischen Jordan-Algebren
- Klassisches Lidskiĭ-Theorem und seine verschiedenen Verallgemeinerungen
- Variationsanalyse in normalen Zerlegungssystemen (Lösung eines offenen Problems aus 33)
- Nichtkonvexer Fall der vorzeichenbehafteten Singularwertzerlegung
- Eigenwerte symmetrischer Funktionen: Lewis 28,31 analysierte Fréchet-Differenzierbarkeit und Clarke-Subdifferenziale
- Vorzeichenbehaftete symmetrische Funktionen von Singularwerten: Serie von Arbeiten von Lewis-Sendov 34,35
- Euklidische Jordan-Algebren: 52,1,37,51 und weitere Arbeiten
- Lie-Theorie-Rahmen: Berezin-Gel'fand 5, Tam 53 und andere
- Einheitlichkeit: Erstmalige Vereinigung aller dieser Einstellungen in einem einzigen Rahmen
- Universalität: Fähigkeit, zuvor nicht abgedeckte Einstellungen zu behandeln
- Vereinfachung: Umgehung matrixabhängiger Beweistechniken durch geometrische Methoden
- Vollständigkeit: Gleichzeitige Behandlung von Fréchet-, Grenz- und Clarke-Subdifferenzialen
- Theoretische Vereinigung: Erfolgreiche Etablierung eines abstrakten Rahmens für Spektralzerlegungssysteme, der verschiedene Einstellungen der Variationsanalyse vereint.
- Vollständige Charakterisierung: Bereitstellung vollständiger Charakterisierungen verschiedener variationsanalytischer Objekte von Spektralfunktionen und Spektralmengen.
- Methodische Innovation: Bereitstellung eleganterer Beweise als bestehende Arbeiten durch geometrische Methoden und Produktraumtechniken.
- Endlichkeitsannahme: Die Verallgemeinerung des Lidskiĭ-Theorems erfordert, dass die Gruppe S endlich ist.
- Abgeschlossenheitsbedingung: Zusätzliche Abgeschlossenheitsannahme erforderlich (Annahme 2.2).
- Clarke-Subdifferenzial: Unklar, ob die Konvexhüllenoperation weggelassen werden kann.
- Anwendungen: Verwendung von Subdifferenzialdarstellungen für notwendige Optimalitätsbedingungen in konkreten Matrixoptimierungsproblemen.
- Metrische Regularität: Charakterisierung der Lipschitz-Eigenschaften von Lösungsabbildungen.
- Zweite-Ordnung-Analyse: Verallgemeinerung von Ergebnissen der zweiten Variationsanalyse für Spektralfunktionen.
- Theoretische Tiefe: Etablierung eines tiefgreifenden abstrakten Rahmens mit starkem theoretischem Wert.
- Starke Einheitlichkeit: Erfolgreiche Vereinigung mehrerer scheinbar unabhängiger Forschungsbereiche.
- Technische Innovation: Verwendung geometrischer Methoden vereinfacht komplexe technische Beweise.
- Vollständige Ergebnisse: Systematische Behandlung verschiedener Subdifferenzialkonzepte.
- Klare Darstellung: Gut organisiertes Papier mit klaren Definitionen und Theoremformulierungen.
- Hohe Abstraktheit: Der theoretische Rahmen ist relativ abstrakt und möglicherweise nicht leicht verständlich und anwendbar.
- Rechnerische Komplexität: Die praktische Berechnung von Subdifferenzialen kann immer noch schwierig sein.
- Wenige Anwendungsbeispiele: Mangel an konkreten numerischen Beispielen und Anwendungen.
- Akademischer Wert: Bereitstellung wichtiger theoretischer Werkzeuge für Variationsanalyse und Matrixoptimierung.
- Vereinigungsfunktion: Vereinigung verstreuter Forschungsergebnisse in einem einzigen Rahmen.
- Inspirationswirkung: Kann ähnliche Vereinigungsarbeiten in anderen Bereichen inspirieren.
- Matrixoptimierung: Theoretische Analyse von Problemen wie semidefiniter Programmierung und Matrixvervollständigung.
- Nichtglatte Optimierung: Nichtkonvexe Optimierungsprobleme mit Spektralfunktionen.
- Variationsanalyse: Theoretische Forschung, die die Berechnung von Subdifferenzialen komplexer Funktionen erfordert.
Das Papier zitiert 55 verwandte Literaturquellen, hauptsächlich einschließlich:
- Klassische Lehrbücher der Variationsanalyse: Rockafellar & Wets 48, Mordukhovich 42
- Spektralfunktionsanalyse: Serie von Arbeiten von Lewis 28,31,34,35
- Euklidische Jordan-Algebren: Faraut & Korányi 19, verwandte Anwendungsarbeiten
- Matrixanalyse: Horn & Johnson 22, Bhatia 6
Dieses Papier ist ein wichtiger theoretischer Beitrag im Bereich der Variationsanalyse. Durch den abstrakten Rahmen von Spektralzerlegungssystemen werden mehrere Forschungsrichtungen erfolgreich vereint und eine solide theoretische Grundlage für die weitere Entwicklung des Feldes geschaffen.