2025-11-24T10:52:18.721112

Lyapunov and Riccati Equations from a Positive System Perspective

Wu, Lin

This paper presents a new interpretation of the Lyapunov and Riccati equations from the perspective of positive system theory. We show it is possible to construct positive systems related to these equations, and then certain conclusions -- such as the existence and uniqueness of solutions -- can be drawn from positive systems theory. Specifically, under standard observability assumptions, a strictly positive linear system can be constructed for Lyapunov equations, leading to exponential convergence in Hilbert metric to the Perron-Frobenius vector -- closely related to the solution of the Lyapunov equation. For algebraic Riccati equations, homogeneous strictly positive systems can be constructed, which exhibit more complex dynamical behaviors. While the existence and uniqueness of the solution can still be proven, only asymptotic convergence can be obtained.

academic

Lyapunov and Riccati Equations from a Positive System Perspective

基本信息

论文ID: 2511.17243
标题: Lyapunov and Riccati Equations from a Positive System Perspective
作者: Dongjun Wu (Lund University), Yankai Lin (Wuhan Institute of Technology)
分类: math.OC (Optimization and Control)
发表时间: 2025年11月24日提交至arXiv
论文链接: https://arxiv.org/abs/2511.17243

摘要

本文从正系统理论（positive system theory）的视角对Lyapunov方程和Riccati方程提出了全新的解释。研究表明，可以构造与这些方程相关的正系统，并从正系统理论推导出解的存在性和唯一性等结论。具体而言，在标准可观性假设下，可以为Lyapunov方程构造严格正线性系统，在Hilbert度量下指数收敛到Perron-Frobenius向量，该向量与Lyapunov方程的解密切相关。对于代数Riccati方程，可以构造齐次严格正系统，虽然系统表现出更复杂的动力学行为，但仍能证明解的存在性和唯一性，只是收敛性从指数收敛降为渐近收敛。

研究背景与动机

1. 要解决的问题

Lyapunov方程和代数Riccati方程是控制理论的基石，广泛应用于系统分析、模型降阶、稳定化和最优控制。虽然这些方程的性质（如解的存在性、唯一性和数值计算）已被广泛研究，但传统方法存在局限性：

Lyapunov方程有显式解（连续时间为积分形式，离散时间为无穷级数），但Riccati方程很少有显式解
两类方程通常需要不同的处理方法，缺乏统一框架

2. 问题的重要性

这两类方程是线性系统理论的核心，其解的性质直接影响控制系统的稳定性分析和最优控制设计。建立统一的理论框架不仅有助于深化理论理解，还能为数值算法提供新的思路。

3. 现有方法的局限

Pates (2024)的方法：将Lyapunov方程视为紧凸集上的不动点问题，利用Brouwer不动点定理证明解的存在性。但该技术无法直接扩展到Riccati方程，且Brouwer定理无法保证唯一性
传统方法：Lyapunov方程和Riccati方程分别处理，缺乏统一的动力系统视角

4. 研究动机

本文提出通过构造动力系统来统一处理这两类方程，利用正系统理论的强大工具来分析解的性质。关键创新是引入辅助变量（标量线性函数）将方程齐次化，使其适用于正系统框架。

核心贡献

建立新的理论联系：首次将正系统理论与经典控制方程（Lyapunov和Riccati方程）联系起来，提供了全新的理论视角
齐次化技术：提出通过引入标量值线性函数（如tr(P)）来齐次化方程的关键技术步骤，使得非齐次方程可以在正系统框架下统一处理
构造正动力系统：
- 对Lyapunov方程构造严格正线性系统，证明指数收敛性
- 对代数Riccati方程构造齐次严格正系统，证明渐近收敛性
统一的求解框架：将方程的解表征为适当构造的正动力系统的稳态，提供了动力系统视角下的求解方法
收敛性分析：利用Hilbert度量分析动力系统的收敛性质，为数值算法提供理论保证

方法详解

任务定义

连续时间Lyapunov方程： $A^\top P + PA + C^\top C = 0$

离散时间Lyapunov方程： $A^\top QA - Q + C^\top C = 0$

离散时间代数Riccati方程： $P = A^\top PA - A^\top PB(R+B^\top PB)^{-1}B^\top PA + C^\top C$

连续时间代数Riccati方程： $A^\top P + PA - PBR^{-1}B^\top P + C^\top C = 0$

其中， $P, Q \in \mathbb{S}^n_+$ （半正定矩阵集）， $A, B, C, R$ 为已知矩阵。

核心方法架构

1. 正系统理论预备知识

锥（Cone）定义：本文主要使用两类锥：

正象限： $\mathbb{R}^n_+ = \{x \in \mathbb{R}^n : x_i \geq 0, \forall i\}$
半正定矩阵集： $\mathbb{S}^n_+ = \{X \in \mathbb{R}^{n\times n} : X \succeq 0\}$

Hilbert度量：对于锥 $K$ 中的 $x, y \neq 0$ ，定义 $d_H(x,y) = \ln\frac{M(x/y)}{m(x/y)}$ 其中 $M(x/y) = \inf\{\lambda : x \leq \lambda y\}$ ， $m(x/y) = \sup\{\mu : \mu y \leq x\}$

关键定理（Theorem 1 - 非线性Perron-Frobenius理论）：设 $K$ 为正规锥， $F: V \to V$ 为连续、齐次、保序映射，则存在 $x^* \in K\setminus\{0\}$ 使得 $F(x^*) = \rho(F)x^*$ 。若 $F$ 为强保序，则 $x^*$ 在正标量意义下唯一，且 $d_H(F^k(x), x^*) \to 0$ ；若 $F$ 还是线性的，收敛是指数的。

2. Lyapunov方程的正系统方法

连续时间情况：

步骤1：构造线性化系统 考虑简单的线性方程 $Ap + c = 0$ （ $A$ 为Metzler矩阵， $c \geq 0$ ）。传统方法构造动力系统 $\dot{x} = Ax + c$ ，但这不是齐次的。通过"线性化"技巧： $\dot{x} = (A + \alpha c\mathbf{1}^\top)x$ 其中 $\alpha > 0$ 是调节参数， $\mathbf{1}$ 为全1向量。

步骤2：对Lyapunov方程构造正系统 $\dot{P} = A^\top P + PA + \alpha\text{tr}(P)C^\top C \quad (5)$

关键引理（Lemma 1）：若 $(A,C)$ 可观，则系统(5)在 $\mathbb{S}^n_+$ 上严格正。

证明思路：解的表达式为 $P(t) = e^{A^\top t}P_0e^{At} + \alpha\int_0^t \text{tr}(P(s))e^{A^\top(t-s)}C^\top Ce^{A(t-s)}ds$ 若存在 $v \neq 0$ 使得 $P(t)v = 0$ ，则 $Ce^{As}v = 0$ 对所有 $s \in [0,t]$ 成立，这与可观性矛盾。因此 $P(t) \succ 0$ 。

步骤3：参数调节与解的构造 由Corollary 1，存在唯一的 $P^* \succ 0$ 和 $\lambda \in \mathbb{R}$ 使得 $A^\top P^* + P^*A + \alpha\text{tr}(P^*)C^\top C = \lambda P^*$

对于 $A$ 的特征向量 $v$ （特征值 $\eta$ ），有 $\lambda = 2\text{Re}(\eta) + \alpha\text{tr}(P^*)\frac{\|Cv\|^2}{v^*P^*v}$

当 $\alpha$ 足够小时， $\lambda < 0$ （因为 $A$ 稳定）
当 $\alpha$ 足够大时， $\lambda > 0$ （因为 $\|Cv\|^2 \neq 0$ ）
由连续性，存在 $\alpha > 0$ 使得 $\lambda = 0$

此时 $P^\# = \frac{P^*}{\alpha\text{tr}(P^*)}$ 即为Lyapunov方程的唯一正定解。

收敛性：系统(5)在Hilbert度量下指数收敛： $d_H(P(t), P^\#) \leq ke^{-\lambda t}d_H(P_0, P^\#)$

离散时间情况：

构造迭代系统 $X_{k+1} = F(X_k) = A^\top X_k A + \alpha\text{tr}(X_k)C^\top C$

类似的分析表明，在可观性和Schur稳定性假设下，存在唯一解且系统指数收敛。

3. 代数Riccati方程的正系统方法

离散时间情况：

步骤1：构造齐次系统 $X_{k+1} = F(X_k) = A^\top S(X_k)A + \alpha\text{tr}(X_k)C^\top C$ 其中 $S(X) := X - XB(\alpha\text{tr}(X)R + B^\top XB)^{-1}B^\top X$

关键引理（Lemma 3）：算子 $F$ 是连续、齐次、保序和凹的。若 $(A,C)$ 可观，则 $F^n$ 强保序。

证明要点：

保序性来自Schur补的单调性（Lemma 6）
凹性是Schur补的已知性质
强保序性通过递归论证：若 $v^\top X_{k+1}v = 0$ ，则 $Cv = 0$ 且 $v^\top A^\top X_k Av = 0$ ，递归 $n$ 步后得到 $\text{col}(C, CA, \ldots, CA^{n-1})v = 0$ 由可观性得 $v = 0$ ，因此 $F^n(X) \in \text{Int}\mathbb{S}^n_+$

步骤2：参数调节

当 $\alpha$ 小时，若 $A$ 是Schur稳定的（可通过可控性假设保证），则 $\rho(F) < 1$
当 $\alpha \to \infty$ 时， $\rho(F) \to \infty$ （由可观性）
由锥谱半径的连续性，存在 $\alpha > 0$ 使得 $\rho(F) = 1$

此时 $P = \frac{X^*}{\alpha\text{tr}(X^*)}$ 为Riccati方程的唯一正定解。

收敛性：在Hilbert度量下渐近收敛（非指数）： $d_H(X_k, P) \to 0 \text{ as } k \to \infty$

连续时间情况：

构造系统 $\dot{P} = \alpha A^\top P + \alpha PA - \frac{1}{\text{tr}(P)}PBR^{-1}B^\top P + \alpha^2\text{tr}(P)C^\top C$

等价地， $\dot{P} = A_\alpha(t)^\top P + PA_\alpha(t) + \alpha^2\text{tr}(P)C^\top C$ 其中 $A_\alpha(t) = \alpha A - \frac{1}{2\text{tr}(P)}BR^{-1}B^\top P(t)$

关键引理（Lemma 4）：若 $(A,C)$ 可观，则系统严格正。

类似的参数调节论证表明，存在 $\alpha > 0$ 使得系统有唯一的稳态解 $P$ ，且在Hilbert度量下渐近收敛。

技术创新点

齐次化技巧：引入 $\text{tr}(P)$ 作为标量化因子，将原本非齐次的方程转化为齐次动力系统，这是应用正系统理论的关键
统一框架：通过构造正动力系统，将Lyapunov方程和Riccati方程纳入统一的分析框架
参数调节方法：通过调节参数 $\alpha$ 使锥谱半径达到特定值（Lyapunov方程为0，Riccati方程为1），巧妙地构造出原方程的解
Hilbert度量分析：利用Hilbert度量而非传统的欧氏度量来分析收敛性，更适合正系统的几何结构
可观性的新作用：揭示了可观性在保证系统严格正性中的关键作用，为经典假设提供了新的几何解释

实验设置

理论验证

本文主要是理论工作，通过数值示例验证理论结果：

示例1（图1）：对于简单线性方程 $Ap + c = 0$ ，展示了矩阵 $A + \alpha c\mathbf{1}^\top$ 的最大特征值随 $\alpha$ 变化的曲线，验证了存在 $\alpha$ 使得特征值为0。

示例2（图2）：对于离散时间Lyapunov方程，展示了算子 $L(X) = A^\top XA + \alpha\text{tr}(X)C^\top C$ 的锥谱半径随 $\alpha$ 变化的曲线，当 $A$ 为Schur稳定且 $(A,C)$ 可观时，存在 $\alpha$ 使得谱半径为1。

数值观察

参数连续性：图1和图2清晰展示了谱半径/特征值关于参数 $\alpha$ 的连续性，支持了理论中关于中间值定理的应用
收敛行为：虽然论文未给出详细的收敛曲线，但理论保证了Lyapunov方程的指数收敛和Riccati方程的渐近收敛

实验结果

主要结果

定理性结果：

Fact 1（连续时间Lyapunov方程）：若 $(A,C)$ 可观且 $A$ 稳定，则存在唯一正定解 $P^\#$ ，且构造的动力系统在Hilbert度量下指数收敛到 $P^\#$
Fact 2（离散时间Lyapunov方程）：若 $A$ 是Schur稳定且 $(A,C)$ 可观，则存在唯一正定解 $Q$ ，且系统指数收敛
Fact 3（离散时间Riccati方程）：若 $(A,B)$ 可控且 $(A,C)$ 可观，则存在唯一正定解 $P$ ，且系统在Hilbert度量下渐近收敛
Fact 4（连续时间Riccati方程）：若 $(A,B)$ 可控且 $(A,C)$ 可观，则存在唯一正定解 $P$ ，且系统渐近收敛

关键发现

可观性与可控性的对偶作用（Remark 5）：
- 可观性倾向于增加锥谱半径
- 可控性倾向于减小锥谱半径
- 两者缺一不可，共同保证解的存在性和唯一性
收敛性差异：
- Lyapunov方程：线性系统 → 指数收敛
- Riccati方程：非线性齐次系统 → 渐近收敛（但非指数）
扩展性：方法可以扩展到更一般的Lyapunov方程，如：
- 随机系统： $A^\top P + PA + \sum_{i=1}^r A_i^\top PA_i + C^\top C = 0$
- 奇异系统： $A^\top PE + E^\top PA + C^\top C = 0$

正控制系统中的Riccati方程（Section 4.3）

对于正控制系统的Bellman方程： $p = s + A^\top p - E^\top|r + B^\top p|$

在假设 $H1$ （存在稳定化增益）和 $H2$ （类似可观性条件）下，通过构造系统 $p_{k+1} = \alpha(1^\top p_k)s + A^\top p_k - E^\top|\alpha(1^\top p_k)r + B^\top p_k|$

证明了解的存在性和唯一性，展示了方法在正系统最优控制中的应用。

结论与讨论

主要结论

理论统一：成功地将Lyapunov方程和代数Riccati方程纳入正系统理论框架，提供了统一的分析方法
解的性质：在标准假设（可观性、可控性、稳定性）下，证明了解的存在性、唯一性和收敛性
收敛特性：
- Lyapunov方程：指数收敛（线性系统）
- Riccati方程：渐近收敛（非线性齐次系统）
方法论贡献：齐次化技术为处理代数方程提供了新的工具

局限性

收敛速度：对于Riccati方程，只能保证渐近收敛而非指数收敛，这在数值实现中可能导致较慢的收敛速度
参数选择：虽然理论保证了存在合适的 $\alpha$ ，但论文未提供如何高效选择 $\alpha$ 的算法
数值实验缺失：论文主要是理论工作，缺乏大规模数值实验来验证方法的实际效率和与现有算法的比较
扩展性：对于时变系统、非线性系统等更一般情况的扩展尚未探讨
误差界：论文未量化迭代算法的误差界和收敛率的具体常数

未来方向

论文明确指出的研究方向：

时变方程：扩展到时变Lyapunov和Riccati方程
误差界量化：为提出的迭代方法建立精确的误差界
算法实现：开发高效的数值算法，包括参数 $\alpha$ 的自适应选择策略
应用拓展：探索在模型预测控制、鲁棒控制等领域的应用

深度评价

优点

理论创新性强：
- 首次建立正系统理论与经典控制方程的深刻联系
- 齐次化技术具有普适性，可能启发其他代数方程的研究
- 为经典假设（可观性、可控性）提供了新的几何解释
方法统一性：
- 用同一框架处理Lyapunov和Riccati方程
- 连续时间和离散时间系统的统一处理
- 可扩展到更一般的方程形式
数学严谨性：
- 证明完整、逻辑清晰
- 充分利用了正系统理论的深刻结果（Perron-Frobenius理论、Hilbert度量）
- 所有关键引理都有详细证明
理论洞察深刻：
- 揭示了可观性和可控性在谱半径调节中的对偶作用
- 解释了Lyapunov和Riccati方程收敛性差异的本质原因
- 为动力系统视角下理解代数方程提供了新范式
写作清晰：
- 从简单例子（线性方程）逐步过渡到复杂情况
- 结构清晰，逻辑递进
- 符号系统统一，便于理解

不足

实用性有待验证：
- 缺乏与现有数值算法（如Bartels-Stewart算法、Newton迭代）的效率比较
- 未提供参数 $\alpha$ 的实际选择策略
- 收敛常数 $k, \lambda$ 未给出估计方法
数值实验不足：
- 仅有两个简单的数值示例
- 缺乏高维系统、病态系统等复杂情况的测试
- 未验证理论收敛率与实际收敛率的一致性
Riccati方程的收敛性：
- 只能保证渐近收敛，无法给出收敛速度的定量估计
- 对于实际应用，指数收敛更为理想
假设条件：
- 依赖标准的可观性、可控性和稳定性假设
- 未讨论假设不满足时的情况
计算复杂度：
- 未分析算法的计算复杂度
- 每次迭代需要计算矩阵迹，可能增加计算成本
推广性：
- 对于非齐次方程、约束优化问题等的推广尚不明确
- 时变、随机、非线性情况的扩展需要进一步研究

影响力

理论贡献：
- 为控制理论和正系统理论之间建立了新的桥梁
- 可能启发其他代数方程的动力系统方法研究
- 齐次化技术具有方法论价值
学术价值：
- 为Lyapunov和Riccati方程提供了新的理论视角
- 深化了对可观性、可控性等经典概念的理解
- 可能激发后续关于正系统理论应用的研究
实用价值：
- 短期内实用价值有限（需要进一步算法开发）
- 长期可能为大规模系统、分布式计算提供新思路
- 在正系统最优控制中有直接应用（Section 4.3）
可复现性：
- 理论证明完整，易于验证
- 算法描述清晰，但缺少实现细节
- 建议作者公开代码以促进研究

适用场景

理论研究：
- 研究代数方程的动力系统性质
- 探索正系统理论的新应用
- 分析控制系统的几何结构
特定应用：
- 正系统的最优控制（如流行病模型、交通网络）
- 大规模稀疏系统（正系统结构可能带来计算优势）
- 分布式优化（Hilbert度量适合分析一致性）
教学用途：
- 展示正系统理论的威力
- 说明代数方程与动力系统的联系
- 作为高级控制理论课程的补充材料

参考文献（关键文献）

16 Lemmens & Nussbaum (2012): Nonlinear Perron-Frobenius Theory - 本文的主要理论工具来源
19 Pates (2024): Lyapunov equations: a (fixed) point of view - 直接的对比工作
21 Rantzer & Valcher (2018): A tutorial on positive systems and large scale control - 正系统理论综述
20 Rantzer (2022): Explicit solution to bellman equation for positive systems - 正系统最优控制
8 Bushell (1973): Hilbert's metric and positive contraction mappings - Hilbert度量的经典参考

总体评价：这是一篇理论创新性很强的工作，成功地将正系统理论应用于经典控制方程的分析，提供了全新的理论视角和统一框架。齐次化技术具有方法论价值，可能启发其他领域的研究。主要不足在于实用性尚待验证，需要后续工作在算法实现和数值实验方面进行补充。对于理论研究者和对正系统理论感兴趣的学者，这是一篇值得深入阅读的论文。

Lyapunov and Riccati Equations from a Positive System Perspective

Lyapunov and Riccati Equations from a Positive System Perspective

基本信息

摘要

研究背景与动机

1. 要解决的问题

2. 问题的重要性

3. 现有方法的局限

4. 研究动机

核心贡献

方法详解

任务定义

核心方法架构

1. 正系统理论预备知识

2. Lyapunov方程的正系统方法

3. 代数Riccati方程的正系统方法

技术创新点

实验设置

理论验证

数值观察

实验结果

主要结果

关键发现

正控制系统中的Riccati方程（Section 4.3）

相关工作

1. Lyapunov和Riccati方程的经典理论

2. 不动点方法

3. 正系统理论

4. 值迭代方法

5. 正系统中的Riccati方程

结论与讨论

主要结论

局限性

未来方向

深度评价

优点

不足

影响力

适用场景

参考文献（关键文献）