We consider the Schr{ö}dinger bridge problem in discrete time, where the pathwise cost is replaced by a sum of quadratic functions, taking the form of a linear quadratic regulator (LQR) cost. This cost comprises potential terms that act as attractors and kinetic terms that control the diffusion of the process. When the two boundary marginals are Gaussian, we show that the LQR-Schr{ö}dinger bridge problem can be solved in closed form. We follow the dynamic programming principle, interpreting the Kantorovich potentials as cost-to-go functions. Under the LQR-Gaussian assumption, these potentials can be propagated exactly in a backward and forward passes, leading to a system of dual Riccati equations, well known in estimation and control. This system converges rapidly in practice. We then show that the optimal process is Markovian and compute its transition kernel in closed form as well as the Gaussian marginals. Through numerical experiments, we demonstrate that this approach can be used to construct complex, non-homogeneous Gaussian processes with acceleration and loops, given well-chosen attractive potentials. Moreover, this approach allows extending the Bures transport between Gaussian distributions to more complex geometries with negative curvature.
- Papier-ID: 2506.17273
- Titel: The LQR-Schrödinger Bridge
- Autor: Marc Lambert (INRIA - Ecole Normale Supérieure - PSL Research university, DGA - French Procurement Agency)
- Klassifizierung: math.OC (Optimierung und Steuerung)
- Veröffentlichungsdatum: 24. November 2025 (arXiv v2)
- Papierlink: https://arxiv.org/abs/2506.17273
Dieses Papier untersucht das Schrödinger-Brückenproblem in diskreter Zeit, wobei die Pfadkosten durch eine Summe quadratischer Funktionen ersetzt werden, die formal dem Kostenfunktional des linearen quadratischen Reglers (LQR) ähnelt. Das Kostenfunktional enthält einen Potentialterm als Attraktor und einen kinetischen Term zur Kontrolle der Diffusion des Prozesses. Wenn beide Randverteilungen Gaußverteilungen sind, zeigen die Autoren, dass das LQR-Schrödinger-Brückenproblem in geschlossener Form gelöst werden kann. Durch Anwendung des dynamischen Programmierungsprinzips wird die Kantorovich-Potentialfunktion als Kosten-zu-Ziel-Funktion interpretiert. Unter der LQR-Gauß-Annahme können diese Potentialfunktionen durch Vorwärts- und Rückwärtsdurchläufe exakt propagiert werden, was zu einem dualen Riccati-Gleichungssystem führt, das in Schätzung und Steuerung weit verbreitet ist. Dieses System konvergiert in der Praxis schnell. Die Autoren zeigen weiter, dass der optimale Prozess Markovsch ist, und berechnen in geschlossener Form seinen Übergangskern sowie die Gaußschen Randverteilungen. Durch numerische Experimente demonstrieren die Autoren, dass die Methode zur Konstruktion komplexer inhomogener Gaußprozesse mit Beschleunigungs- und Zykleneigenschaften verwendet werden kann, sowie die Bures-Transportierung zwischen Gaußverteilungen auf komplexere Geometrien mit negativer Krümmung erweitert.
Das Schrödinger-Brückenproblem stammt aus Schrödinger's bahnbrechender Arbeit von 1931 und zielt darauf ab, den wahrscheinlichsten stochastischen Prozess zu bestimmen, gegeben die Beobachtungen von Randverteilungen zu zwei Zeitpunkten (Anfangszeit p₀ und Endzeit pₖ). Dies ist ein optimales Transportproblem mit Entropie-Regularisierung.
- Theoretische Bedeutung: Das Schrödinger-System ist eng mit entropie-regularisiertem optimalem Transport und dem Sinkhorn-Algorithmus verbunden und ist ein Kernproblem der modernen optimalen Transporttheorie
- Anwendungswert: Breite Anwendungen in Steuerungstheorie, Pfadplanung, Kovarianzsteuerung und anderen Bereichen
- Rechnerische Effizienz: Die Suche nach speziellen Fällen, die effizient gelöst werden können, ist für praktische Anwendungen entscheidend
- Referenzmesseinschränkung: Wenn das Referenzmaß eine Brownsche Bewegung ist, kann der Sinkhorn-Algorithmus effizient verwendet werden, aber wenn das Referenzmaß ein linearer stochastischer Prozess ist, wird das Problem komplexer
- Rechenkomplexität: Bestehende Methoden wie Chen et al. (2016) und Bakolas (2016) leiten zwar Vorwärts-Rückwärts-Riccati-Gleichungen ab, aber ihre Vorwärtsgleichung beschreibt die Entwicklung der Zustandskovarianzmatrix des geschlossenen Systems und nicht die Entwicklung der Kantorovich-Potentialfunktion
- Modellierungsflexibilität: Es fehlt eine Methode zur direkten Kontrolle der Prozessgeometrie durch Pfadkosten
Dieses Papier schlägt eine Alternative vor: Anstatt das Referenzmaß durch einen linearen stochastischen Prozess anzugeben, wird die gemeinsame Verteilung durch Pfad-LQR-Kosten definiert. Diese Einstellung ermöglicht nicht nur die Kontrolle der Zustandskovarianz bis zum Endzustand, sondern kann sie auch entlang eines bestimmten Pfads oder Kanals lenken und bietet einen flexibleren Modellierungsrahmen.
- Theoretischer Beitrag: Vorschlag einer neuen Formulierung des LQR-Schrödinger-Brückenproblems, wobei das Referenzmaß durch Pfad-LQR-Kosten (mit Potential- und kinetischen Termen) definiert wird
- Geschlossene Lösung: Beweis, dass unter der Annahme von Gaußschen Randverteilungen und LQR-quadratischen Kosten die Kantorovich-Potentialfunktion exakt propagiert werden kann, was zu einem dualen diskreten algebraischen Riccati-Gleichungssystem führt:
- Rückwärtsgleichung: Pk⊖=Qk/ε+Pk+1⊖−Pk+1⊖(Rk/ε+Pk+1⊖)−1Pk+1⊖
- Vorwärtsgleichung: Pk+1⊕−1=εRk−1+Pk⊕−1−Pk⊕−1(εQk−1+Pk⊕−1)Pk⊕−1
- Charakterisierung des optimalen Prozesses: Beweis, dass der optimale Prozess Markovsch ist, und geschlossene Berechnung seines Übergangskerns und der Gaußschen Randverteilungen
- Geometrische Erweiterung: Demonstration, dass die Methode die Bures-Transportierung zwischen Gaußverteilungen auf komplexere Geometrien mit negativer Krümmung erweitern kann
- Anwendungsdemonstration: Numerische Experimente validieren, dass die Methode komplexe inhomogene Gaußprozesse mit Pfadverfolgung, Hindernisvermeidung und zyklischen Trajektorien konstruieren kann
Eingaben:
- Anfangs- und End-Gaußrandverteilungen: p0=N(μ0,Σ0), pK=N(μK,ΣK)
- LQR-Kostenparameter: Potentialmatrix Qk, Kontrollpunkte xk∗, kinetische Matrix Rk
- Temperaturparameter ε>0
Ausgaben:
- Optimale Pfadverteilung p∗(x0,...,xK)
- Übergangskern p∗(xk+1∣xk)
- Gaußsche Randverteilungen zu Zwischenzeitpunkten
Nebenbedingungen:
- Randnebenbedingungen: ∫p(x0,...,xK)dx1...dxK=p0(x0), ∫p(x0,...,xK)dx0...dxK−1=pK(xK)
Die Pfadkosten werden als Summe paarweiser Terme definiert:
ℓ(x0,...,xK)=∑k=0K−1ℓk(xk,xk+1)
wobei die Einstufen-Kosten wie folgt definiert sind:
ℓk(xk,xk+1)=21(xk−xk∗)TQk(xk−xk∗)+21(xk+1−xk)TRk(xk+1−xk)
- Potentialterm (linker Term): Zieht den Prozess durch die Strafmatrix Qk in die Nähe der Kontrollpunkte xk∗
- Kinetischer Term (rechter Term): Begrenzt die Diffusion des Prozesses durch die Strafmatrix Rk
Die duale Form des Schrödinger-Brückenproblems:
minp∈P(p0,pK)εKL(p∥exp(−ℓ/ε))
Die optimale Lösung hat Gibbs-Form:
p∗(x0,...,xK)∝φ0(x0)r(x0,...,xK)φK(xK)
wobei φ0,φK Gibbs-Potentialfunktionen sind und r=exp(−ℓ/ε) das nicht normalisierte Referenzmaß ist.
Unter der Gaußannahme sind Kantorovich-Potentialfunktionen quadratische Formen, die durch symmetrische positiv definite Matrizen dargestellt werden können:
- Anfangspotential: φ0=N(α0,P0−1)
- Endpotential: φK=N(αK,PK−1)
- Vorwärts-Propagationspotential: φk⊕=N(αk⊕,Pk⊕−1)
- Rückwärts-Propagationspotential: φk⊖=N(αk⊖,Pk⊖−1)
Rückwärtspropagation (Gleichung 1):
P_k^⊖ = Q_k/ε + P_{k+1}^⊖ - P_{k+1}^⊖(R_k/ε + P_{k+1}^⊖)^{-1}P_{k+1}^⊖}
mit entsprechender Drift-Aktualisierung:
αk⊖=αk+1⊖+Pk⊖−1Qk/ε(xk∗−αk+1⊖)
Vorwärtspropagation (Gleichung 2):
Pk+1⊕−1=εRk−1+Pk⊕−1−Pk⊕−1(εQk−1+Pk⊕−1)Pk⊕−1
mit entsprechender Drift-Aktualisierung:
αk+1⊕=(Qk/ε+Pk⊕)−1(Qk/εxk∗+Pk⊕αk⊕)
Die Vorwärtsgleichung zeigt die Dualität mit der Rückwärtsgleichung: Die Rollen von R und Q sind vertauscht. Dies bietet eine neue Interpretation der Kalman-Dualität:
- Qk−1 kann als Unsicherheit (Kovarianz) der Vorinformation interpretiert werden
- Wenn Qk−1=0, kann die Trajektorie an der Position xk∗ perfekt vorhergesagt werden
- Andernfalls kann nur die Nachbarschaft um xk∗ geschätzt werden
Der optimale Übergangskern hat eine geschlossene Lösung:
p∗(xk+1∣xk)=N(xk+1∣xk+βk+Kkxk,Sk−1)
wobei:
- Sk=Rk/ε+Pk+1⊖
- Kk=Sk−1Rk/ε (LQR-Verstärkung)
- β_k = S_k^{-1}P_{k+1}^⊖} α_{k+1} (Driftterm)
- Chen et al. (2016): Die Vorwärtsgleichung beschreibt die Entwicklung der Zustandskovarianzmatrix des geschlossenen Systems
- Dieses Papier: Die Vorwärtsgleichung beschreibt die Entwicklung der Vorwärts-Kantorovich-Potentialfunktion, wobei die Pfadkosten zusätzliche Kopplungen einführen
Experimente werden im zweidimensionalen Raum (d=2) mit synthetischen Gaußverteilungsdaten durchgeführt.
- Randverteilungen:
- Anfangs- und End-Gaußverteilungen N(μ0,Σ0) und N(μK,ΣK) werden als rote Ellipsen dargestellt
- Potentialfunktionen werden als N(μ0,Σ0−1) und N(μK,ΣK−1) initialisiert
- Anzahl der Pfadpunkte: K+1∈[15,100], abhängig von Visualisierungsanforderungen
- Temperaturparameter:
- Kalte Temperatur: ε=0.001 (benötigt etwa 5 Iterationen)
- Warme Temperatur: ε=1 (konvergiert normalerweise in 1 Iteration)
- Kostenmatrizen:
- Diffusionsmatrix: Rk=rI (diagonal konstant)
- Potentialmatrix: Qk=qI (diagonal konstant oder zu bestimmten Zeiten 0)
Mehrere typische Szenarien wurden entworfen, um die Methodenleistung zu testen:
- Optimaler Transport: Verifikation der Beziehung zum Bures-Transport
- Wellenpfadverfolgung: Verwendung dichter Kontrollpunkte
- Sägezahnform: Hindernisvermeidungsszenario
- Scoubidou: Zyklische Trajektorie
- Verdrehtes Hindernis: Nicht-isotrope Potentialmatrix
Brownsche Brücke (warme Temperatur):
- Parameter: ε=1, q=0, r=100
- Ergebnis: Standardmäßige Brownsche Brücke zwischen zwei Dirac-Maßen, Pfad ist ein stochastischer Prozess
- Wenn ε→0, schrumpft es zur euklidischen Geodäte
Geometrie mit negativer Krümmung (kalte Temperatur):
- Parameter: ε=0.001, q=0.3, r=10
- Ergebnis: Transport zwischen zwei Gaußverteilungen; nach Hinzufügen eines mittleren Anziehungspotentials weicht die Geodäte vom Bures-Transport ab und zeigt Eigenschaften negativer Krümmung
- Validiert, dass die Methode auf komplexere Geometrien erweitert werden kann
Kalte-Temperatur-Szenario (ε=0.001):
- Wellenpfad (r=1, q=10, K=15):
- Verwendung von K dicht platzierten Kontrollpunkten zur Führung
- Der Prozess ist fast sicher, die Kovarianz nimmt aufgrund hoher Potentialwerte ab
- Demonstriert präzise Pfadverfolgungsfähigkeit
- Sägezahnform (r=10, q=0.1, K=100):
- Verwendung von 2 Kontrollpunkten zur Führung des Gaußprozesses
- Erfolgreiche Hindernisvermeidung
- Scoubidou (r=10, q=0.2, K=100):
- Verwendung von 3 Kontrollpunkten
- Bildet zyklische Trajektorienstruktur
- Verdrehtes Hindernis (r=10, q=0.2, K=200):
- Verwendung eines Kontrollpunkts mit nicht-isotroper Potentialmatrix
- Gaußsche Randkovarianz verdreht sich in der Nähe des Potentials
- Demonstriert Kovarianzsteuerungsfähigkeit
Warme-Temperatur-Szenario (ε=1):
- Bei gleichen Parametern ist der Prozess diffusiver
- Einschränkung durch Kontrollpunkte wird schwächer
- Wellenpfad ist nicht mehr deterministisch
- Diffusion in anderen Szenarien nimmt deutlich zu
- Schnelle Konvergenz: Bei warmer Temperatur oder großem K konvergiert normalerweise in 1 Iteration; bei kalter Temperatur und kleinem K benötigt etwa 5 Iterationen
- Temperatureffekt:
- Kalte Temperatur: Prozess ist nahezu deterministisch, Potentialeffekt ist signifikant, Kovarianz nimmt ab
- Warme Temperatur: Prozess ist stark diffusiv, Potentialbeschränkung wird schwächer
- Potentialsteuerung:
- Hoher q-Wert: Starke Anziehungskraft, Kovarianz nimmt ab, Trajektorie ist deterministischer
- Niedriger q-Wert: Schwache Beschränkung, behält mehr Zufälligkeit
- Nicht-isotropes Qk: Kann Kovarianzform und -richtung steuern
- Geometrische Flexibilität:
- Wenn Qk=0, wird die Bures-Geodäte wiederhergestellt
- Aktivierung des Potentials erzeugt Geometrie mit negativer Krümmung
- Durch strategische Platzierung von Attraktoren und Potentialstärke können komplexe Trajektorien entworfen werden
- Schrödinger (1931): Bahnbrechende Arbeit, die die Maximum-Entropie-Methode zur Bestimmung des wahrscheinlichsten Prozesses bei gegebenen Randverteilungen vorschlägt
- Léonard (2001, 2014): Kantorovich-Duale Formulierung und theoretische Grundlagen
- Peyré & Cuturi (2019): Verbindung zwischen entropie-regularisiertem optimalem Transport und Sinkhorn-Algorithmus
- Sinkhorn (1964), Cuturi (2013): Effiziente Lösung diskreter optimaler Transportprobleme
- Levy et al. (1990): Modellierung und Schätzung diskreter Gaußscher gegenseitiger Prozesse
- Jamison (1975), Beghi (1996): Doob-Transformation und Konditionierung von Markov-Prozessen
- Chen et al. (2016): Beweis, dass die Schrödinger-Brücke einem stochastischen Kontrollproblem mit quadratischen Kosten entspricht, Ableitung von Vorwärts-Rückwärts-Riccati-Gleichungen
- Bakolas (2016): Optimale Kovarianzsteuerung unter integralen quadratischen Zustandsbeschränkungen
- Bunne et al. (2022): Geschlossene Lösung der Schrödinger-Brücke zwischen Gaußmaßen
- Kalman (1960): Grundlegende Arbeiten zu LQR-Steuerung und Riccati-Gleichungen
- Hotz & Skelton (1985): Kovarianzsteuerungstheorie
- Okamoto & Tsiotras (2019): Stochastische Fahrzeugpfadplanung mit Kovarianzführung
- Ziebart et al. (2010): Maximum-Kausal-Entropie-Prinzip
- Haarnoja et al. (2018): Soft-Actor-Critic-Algorithmus
- Lambert et al. (2024): Variationelle dynamische Programmierung
- Einheitlicher Rahmen: Vereinigt LQR-Steuerung, optimalen Transport und Schrödinger-Brücke in einem Rahmen
- Geschlossene Lösung: Erhält vollständig analytische Lösungen unter Gaußannahmen
- Rechnerische Effizienz: Riccati-Gleichungen können effizient gelöst werden, schnelle Konvergenz
- Modellierungsflexibilität: Der Potentialterm bietet zusätzliche Steuerungsfreiheit zur Gestaltung komplexer Geometrien
- Neue theoretische Erkenntnisse: Offenbart neue Interpretation der Kalman-Dualität
- Theoretische Ergebnisse: Erfolgreiche Integration von LQR-Steuerungsideen in den optimalen Transportrahmen mit vollständig geschlossener Lösung in der Gauß-LQR-Einstellung
- Algorithmuseffizienz: Die abgeleiteten dualen Riccati-Gleichungen ermöglichen exakte Implementierung ohne Approximation mit schneller praktischer Konvergenz
- Geometrische Reichhaltigkeit: Die Einführung des Potentialterms erzeugt reichhaltige geometrische Strukturen, die durch strategische Platzierung von Attraktoren die Kovarianz von Gaußverteilungen steuern, verformen oder reduzieren können
- Anwendungspotential: Die Methode kann für Pfadverfolgung, Kovarianzführung, Hindernisvermeidung und andere praktische Probleme verwendet werden
- Annahme der Geschwindigkeitskontrollierbarkeit: Die aktuellen Ergebnisse sind auf Einstellungen beschränkt, in denen die Geschwindigkeit direkt steuerbar ist (uk∝xk+1−xk); die Erweiterung auf Kanalsteuerung bleibt zukünftiger Arbeit vorbehalten
- Diskrete Zeit: Die Ergebnisse werden nur für diskrete Zeit abgeleitet; die Verallgemeinerung auf kontinuierliche Zeit erfordert weitere Forschung
- Gaußannahme: Die Methode hängt von der Gaußianität der Randverteilungen ab; die Verallgemeinerung auf nicht-Gaußsche Fälle ist herausfordernd
- Experimentelle Validierung: Numerische Experimente werden hauptsächlich im zweidimensionalen Raum durchgeführt; die Leistung in hohen Dimensionen erfordert weitere Verifikation
- Steuerungserweiterung: Integration von Vorinformationen des Prozesses (wie bekannte passive Dynamik), Beschränkung der Optimierung auf Steuerungsrichtlinien p(u∣x)
- Kontinuierliche Zeit: Verallgemeinerung auf kontinuierliche Zeiteinstellung
- Nicht-Gaußsche Fälle: Erkundung von Approximationsmethoden für nicht-Gaußsche Randverteilungen
- Anwendungsentwicklung: Praktische Anwendungen in Roboterpfadplanung, Finanzmodellierung und anderen Bereichen
- Theoretische Vertiefung: Weitere Untersuchung der durch das Potential induzierten geometrischen Strukturen und ihrer Eigenschaften
- Signifikanter theoretischer Beitrag:
- Schlägt neue Perspektive auf das Schrödinger-Brückenproblem vor, wobei das Referenzmaß durch LQR-Kosten definiert wird
- Offenbart tiefe Verbindungen der dualen Riccati-Gleichungen und bietet neue Interpretation der Kalman-Dualität
- Vollständige geschlossene Lösung ist theoretisch elegant und rechnerisch effizient
- Methodologische Innovation:
- Die Einführung des Potentialterms ist eine Schlüsselinnovation, die zusätzliche Modellierungsfreiheit bietet
- Geschickte Kombination von dynamischer Programmierung, optimalem Transport und Steuerungstheorie
- Rekursives Normalisierungsverfahren ist prägnant und effektiv
- Mathematische Strenge:
- Ableitungsprozess ist klar und vollständig, schrittweise Verfeinerung von allgemeiner Schrödinger-Brücke zur LQR-Gauß-Einstellung
- Vollständige Nutzung von Gaußverteilungseigenschaften (Produkt-, Faltungsformeln)
- Anwendung der Woodbury-Formel zeigt technische Kompetenz
- Gutes Experimentdesign:
- Szenariodesign ist zielgerichtet und zeigt vielfältige Fähigkeiten der Methode
- Temperaturparametervergleich zeigt klar unterschiedliche Verhaltensmuster
- Visualisierung ist intuitiv und effektiv
- Hohe Schreibqualität:
- Symbolsystem ist klar (besonders Notation im Stil probabilistischer grafischer Modelle)
- Logische Struktur ist angemessen, schrittweise Progression von einfach zu komplex
- Verbindungen zu verwandten Arbeiten sind ausreichend diskutiert
- Experimentelle Einschränkungen:
- Validierung nur im zweidimensionalen Raum; numerische Stabilität und Recheneffizienz in hohen Dimensionen sind unbekannt
- Fehlende quantitative Vergleiche mit anderen Methoden (wie Chen et al. 2016)
- Keine theoretischen Konvergenzgarantien bereitgestellt (obwohl praktisch schnelle Konvergenz beobachtet wird)
- Theoretische Einschränkungen:
- Starke Annahme der Geschwindigkeitskontrollierbarkeit, die den Anwendungsbereich einschränkt
- Diskrete Zeiteinstellung; Verallgemeinerung auf kontinuierliche Zeit ist nicht trivial
- Gaußannahme schränkt die Universalität der Methode ein
- Technische Details:
- Bedingung P0⊖≺Σ0−1 in der Potentialfunktionsaktualisierung wird nicht ausreichend diskutiert
- Numerische Stabilitätsprobleme (wie Matrixinversion) werden nicht detailliert analysiert
- Auswirkungen der Initialisierungsstrategie werden nicht systematisch untersucht
- Anwendungsleitfaden:
- Fehlende systematische Anleitung zur Parameterauswahl (Qk, Rk, ε) für spezifische Anwendungen
- Designprinzipien für Kontrollpunkte xk∗ werden nicht ausreichend diskutiert
- Schnittstelle zu praktischen Steuerproblemen benötigt mehr Erklärung
- Theoretische Auswirkungen:
- Bietet neue Forschungsperspektive für das Schrödinger-Brückenproblem
- Vertieft Verbindungen zwischen optimalem Transport und Steuerungstheorie
- Könnte Approximationsmethodenforschung für nicht-Gaußsche Fälle inspirieren
- Methodische Auswirkungen:
- Bietet effizienten implementierbaren Algorithmus (Code ist open-source)
- Kann als Baseline oder Komponente für andere Methoden dienen
- Reife numerische Methoden für Riccati-Gleichungen können direkt angewendet werden
- Anwendungsauswirkungen:
- Roboterpfadplanung: Kovarianzführung und Hindernisvermeidung
- Finanzmodellierung: Konditionierung stochastischer Prozesse
- Maschinelles Lernen: Generative Modelle und variationelle Inferenz
- Steuerungstechnik: Entwurf inhomogener Systeme
- Reproduzierbarkeit:
- Algorithmusbeschreibung ist klar und leicht zu implementieren
- Code ist auf GitHub open-source
- Experimentelle Einrichtung ist detailliert und kann verifiziert werden
- Am besten geeignet:
- Optimale Transportprobleme zwischen Gaußverteilungen
- Pfadplanung mit Kovarianzsteuerungsanforderungen
- Stochastische Steuerung mit Pfadbeschränkungen
- Modellierung inhomogener Gaußprozesse
- Vielversprechend:
- Als Initialisierung oder Approximation für nicht-Gaußsche Fälle
- Kombination mit Partikelmethoden zur Behandlung multimodaler Verteilungen
- Online-adaptive Steuerung (durch iterative Aktualisierung)
- Nicht geeignet:
- Nicht-Gaußsche Randverteilungen (Erweiterung erforderlich)
- Probleme, die Kanalsteuerung erfordern (aktuelle Version)
- Extrem hochdimensionale Probleme (Matrixoperationskomplexität)
- Schrödinger-Brückenfundamentale:
- Léonard, C. (2014). A survey of the Schrödinger problem and some of its connections with optimal transport.
- Chen, Y., Georgiou, T. T., & Pavon, M. (2021). Stochastic control liaisons: Richard Sinkhorn meets Gaspard Monge on a Schrödinger bridge.
- Optimaler Transport:
- Peyré, G., & Cuturi, M. (2019). Computational optimal transport: With applications to data science.
- Villani, C. (2008). Optimal Transport: Old and New.
- Steuerungstheorie:
- Kalman, R. E. (1960). Contributions to the theory of optimal control.
- Lancaster, P., & Rodman, L. (2002). Algebraic Riccati Equations.
- Verwandte Methoden:
- Chen, Y., Georgiou, T. T., & Pavon, M. (2016). Optimal steering of a linear stochastic system to a final probability distribution.
- Bunne, C., et al. (2022). The Schrödinger bridge between Gaussian measures has a closed form.
Gesamtbewertung: Dies ist eine hochwertige theoretische Arbeit, die erfolgreich den LQR-Rahmen der Steuerungstheorie mit dem Schrödinger-Brückenproblem der optimalen Transportierung verbindet und unter Gaußannahmen eine elegante geschlossene Lösung erhält. Die Ableitung der dualen Riccati-Gleichungen und die neue Interpretation der Kalman-Dualität haben wichtigen theoretischen Wert. Obwohl numerische Experimente auf niedrige Dimensionen beschränkt sind, demonstrieren sie effektiv die Flexibilität und das Potenzial der Methode. Die Haupteinschränkungen liegen in der Gaußannahme und der Annahme der Geschwindigkeitskontrollierbarkeit, aber als Spezialfall bildet diese Arbeit eine solide Grundlage für die Forschung an allgemeineren Problemen. Die Veröffentlichung des Codes erhöht seinen praktischen Wert und seine Reproduzierbarkeit.