In this work, we study data-driven stabilization of linear time-invariant systems using prior knowledge of system-theoretic properties, specifically stabilizability and controllability. To formalize this, we extend the concept of data informativity by requiring the existence of a controller that stabilizes all systems consistent with the data and the prior knowledge. We show that if the system is controllable, then incorporating this as prior knowledge does not relax the conditions required for data-driven stabilization. Remarkably, however, we show that if the system is stabilizable, then using this as prior knowledge leads to necessary and sufficient conditions that are weaker than those for data-driven stabilization without prior knowledge. In other words, data-driven stabilization is easier if one knows that the underlying system is stabilizable. We also provide new data-driven control design methods in terms of linear matrix inequalities that complement the conditions for informativity.
Data-Driven Stabilization Using Prior Knowledge on Stabilizability and Controllability 论文ID : 2510.25452标题 : Data-Driven Stabilization Using Prior Knowledge on Stabilizability and Controllability作者 : Amir Shakouri, Henk J. van Waarde, Tren M.J.T. Baltussen, W.P.M.H. (Maurice) Heemels单位 : University of Groningen (Shakouri, van Waarde), Eindhoven University of Technology (Baltussen, Heemels)分类 : math.OC (Optimization and Control), cs.SY, eess.SY (Systems and Control)发表时间 : arXiv v2, 2025年10月30日论文链接 : https://arxiv.org/abs/2510.25452v2 本文研究了利用系统理论性质(特别是可镇定性和可控性)作为先验知识的线性时不变系统数据驱动镇定问题。作者扩展了数据信息性概念,要求存在一个控制器能够镇定所有与数据和先验知识一致的系统。研究表明:(1) 若系统可控,将此作为先验知识并不能放松数据驱动镇定的条件;(2) 若系统可镇定,则使用该先验知识能够得到比无先验知识更弱的充要条件。换言之,如果已知底层系统可镇定,则数据驱动镇定更容易实现。文章还提供了基于线性矩阵不等式(LMI)的新型数据驱动控制设计方法。
本文要解决的是:如何在有限数据条件下,结合系统的可镇定性或可控性先验知识,设计镇定控制器?
传统数据驱动控制假设系统参数完全未知,但对于大多数物理系统,这种假设过于保守。实际中,我们常常掌握一些先验知识(如质量、弹簧常数等物理量的范围,或从系统结构可推断的可控性/可镇定性)。
降低数据需求 :直接从数据设计控制器可能需要大量数据才能满足持续激励条件,但结合先验知识可能用更少数据实现镇定实际可行性 :某些情况下仅从数据无法设计镇定控制器(如状态数据秩亏),但加入先验知识可能使设计变得可行理论完备性 :系统理论性质(可控性、可镇定性)是控制理论的基础概念,但在数据驱动框架下尚未得到充分研究数据驱动控制 :现有工作(如De Persis & Tesi 2019, van Waarde et al. 2020)主要研究无先验知识情况,需要满足严格的数据条件(如持续激励、状态数据满秩)先验知识整合 :已有研究仅限于参数界约束12-14 或部分参数已知15 ,未涉及系统理论性质非凸性挑战 :可镇定和可控系统集合是非凸的,不同于现有工作考虑的凸系统集在许多实际应用中,可以从系统结构推断出可控性或可镇定性(结构可控性理论),但这类先验知识在数据驱动控制中尚未被利用。本文填补了这一理论空白。
本文的主要贡献包括:
理论框架扩展 :将数据信息性(data informativity)概念扩展至包含先验知识,提出Σ_pk-informativity定义(Definition 3)可控性先验的等价性定理 (Theorem 5):证明了利用可控性作为先验知识等价于无先验知识情况,即可控性先验不能放松数据条件 可镇定性先验的优势定理 (Theorems 14, 15):当状态数据满秩(rank X⁻ = n)时,可镇定性先验不提供额外帮助 当状态数据秩亏(rank X⁻ < n)时,可镇定性先验显著放松条件,给出充要条件 可计算的设计方法 (Proposition 16):提供基于LMI的镇定控制器计算方法,可从Σ_stab-informative数据直接求解理论洞察 :揭示了看似矛盾的现象——更强的性质(可控性)不能帮助放松条件,而较弱的性质(可镇定性)却可以,这是因为在某些情况下所有数据一致系统都不可控系统模型 :考虑离散时间LTI系统
x(t+1) = A_true x(t) + B_true u(t)
其中 x(t)∈ℝⁿ 是状态,u(t)∈ℝᵐ 是输入,系统矩阵(A_true, B_true)未知。
数据 :从时间0到T收集的输入-状态数据
D := ([u(0),...,u(T-1)], [x(0),...,x(T)])
定义数据矩阵:
U⁻ = u(0),...,u(T-1) X⁻ = x(0),...,x(T-1) X⁺ = x(1),...,x(T) 数据一致系统集 :
Σ_D := {(A,B) | X⁺ = AX⁻ + BU⁻}
目标 :找到反馈增益K使得A+BK对所有(A,B)∈Σ_D∩Σ_pk都是Schur稳定的(所有特征值模长<1)
Definition 3 (Σ_pk-informativity for stabilization) :
数据D称为Σ_pk-informative for stabilization,如果存在K∈ℝᵐˣⁿ使得A+BK对所有(A,B)∈Σ_D∩Σ_pk都是Schur稳定的。
先验知识集合 :
Σ_cont:所有可控系统对的集合 Σ_stab:所有可镇定系统对的集合 Theorem 5(核心结果) :假设(A_true, B_true)∈Σ_cont,则以下等价:
(a) 数据D是Σ_cont-informative for stabilization (b) 数据D是informative for stabilization(无先验知识) 证明思路 :
(b)⇒(a)显然成立 (a)⇒(b)的关键:
若Σ_D⊆Σ_cont,结论显然 若存在不可控的(Ā,B̄)∈Σ_D,利用Lemma 7 (参数化系统族在几乎所有点可控)和Lemma 9 (矩阵束稳定性)证明镇定K也能镇定(Ā,B̄) 关键引理 :
Lemma 7 :若(M,N)可控,则(M+αM₀, N+αN₀)对除至多n²个α值外都可控Lemma 9 :若M+δN对所有δ∈[ε,∞)\F(F有限)都Schur,则N幂零且M+δN对所有δ∈ℝ都Schur若数据Σ_stab-informative且K是镇定增益,则:
(a) (A₀+B₀K)R(A,B) = {0} 对所有(A,B)∈Σ_D∩Σ_stab和(A₀,B₀)∈Σ⁰_D(b) 若rank X⁻ < n,则imX⁻;U⁻ = im X⁻ × ℝᵐ(c) im X⁺ ⊆ im X⁻(d) im X⁻是A-不变的且包含im BRemark 11 :条件(a)是无先验知识情况下A₀+B₀K=0的放松版本;条件(b)-(d)在rank X⁻ = n时自动满足,但在秩亏情况下非平凡。
Theorem 14 :若(A_true,B_true)∈Σ_stab且rank X⁻ = n,则:
Σ_stab-informativity ⟺ informativity(无先验知识) 证明思路 :
若真系统可控,由Theorem 5得结论 若真系统不可控,构造K̂使得对所有(A,B)∈Σ_D有A+BK̂ = A_true+B_true K̂,然后证明后者Schur Theorem 15 :若(A_true,B_true)∈Σ_stab且rank X⁻ < n,则数据D是Σ_stab-informative当且仅当:
(a) im X⁺ ⊆ im X⁻(b) imX⁻;U⁻ = im X⁻ × ℝᵐ关键引理(Lemma 17) :若条件(a)(b)成立,则对所有(A,B)∈Σ_D∩Σ_stab,变换矩阵S满足:
SAS⁻¹ = [A₁₁ A₁₂] SB = [B₁]
[0 A₂₂] [0]
其中(A₁₁,B₁)可镇定,A₂₂ Schur,且A₁₁ B₁ = X̂⁺X̂⁻;U⁻ †
这提供了数据驱动的类Kalman分解。
Proposition 16 :若数据Σ_stab-informative且rank X⁻ = r < n:
(a) 存在Θ∈ℝᵀˣʳ使得LMI可行:
X̂⁻Θ = Θᵀ X̂⁻ᵀ
[X̂⁻Θ X̂⁺Θ ] > 0
[Θᵀ X̂⁺ᵀ X̂⁻Θ ]
(b) 若Θ满足(11),取K = K₁ K₂ S,其中:
K₁ = U⁻Θ(X̂⁻Θ)⁻¹ K₂∈ℝᵐˣ⁽ⁿ⁻ʳ⁾任意
则A+BK对所有(A,B)∈Σ_D∩Σ_stab都Schur 设计步骤 :
计算X⁻的QR分解得到S和X̂⁻ 求解LMI (11)得到Θ 计算K₁ = U⁻Θ(X̂⁻Θ)⁻¹ 任选K₂,构造K = K₁ K₂ S 系统描述 (Figure 2):
3个串联水箱,流体从水箱3流向水箱2再到水箱1 状态:x_i为水箱i的液位高度(i=1,2,3) 控制输入:u为水箱2与储液池之间的流速 结构特性:由于单向流动,x₃不可控 连续时间模型 :
其中:
A_c = [-0.6 0.5 0 ] B_c = [0 ]
[0.5 -0.5 0.5 ] [1 ]
[0 0 -0.5 ] [0 ]
离散化 (采样时间0.1s):
A_true = [0.9429 0.0473 0.0012] B_true = [0.0024]
[0.0473 0.9524 0.0476] [0.0976]
[0 0 0.9512] [0 ]
开环实验 (T=5):
t 0 1 2 3 4 5 u(t) 1 0 -1 0 1 x₁ 1 1.04 1.0778 1.1086 1.1334 1.1575 x₂ 2 2.0498 2.0015 1.8597 1.8237 1.8881 x₃ 0 0 0 0 0 0
数据特性 :rank X⁻ = 2 < 3(秩亏)
使用MATLAB + YALMIP + MOSEK求解LMI (11) 得到Θ(5×2矩阵) 计算K₁ = -2.7728 -9.7123 取K₂ = 0,得到K = -2.7728 -9.7123 0 实验设置 :
1000个随机场景 每个场景:从t=0到t=100模拟系统 输入和初始条件从泊松分布(λ=1)独立采样 分析不同样本数T = 3, 4, 5, 10, 100的数据信息性 评价指标 :
系统辨识信息性(rankX⁻ᵀ U⁻ᵀ = n+m) 无先验知识的镇定信息性 Σ_stab-informative T 系统辨识信息性 镇定信息性(无先验) Σ_stab-镇定信息性 3 0% 8.1% 42% 4 62.4% 63.2% 99.4% 5 62.8% 63.2% 99.8% 10 63.2% 63.2% 100% 100 63.2% 63.2% 100%
T=3时的显著优势 :无法进行系统辨识(T < n+m) 仅8.1%数据可用于无先验镇定 42%数据可用于Σ_stab-镇定 (5倍提升)T≥4时的收敛行为 :系统辨识和无先验镇定信息性稳定在63.2% 这是因为约36.8%的随机数据不满足必要条件 T≥10时的完全覆盖 :100%数据都是Σ_stab-informative 显著展示了可镇定性先验的强大作用 对于给定的T=5数据:
X⁻不满秩,Proposition 2失效(无法用于无先验镇定) 但满足Theorem 15条件 成功求解LMI得到镇定增益K De Persis & Tesi (2019) :首次提出从数据直接设计镇定反馈的LMI方法,需要持续激励条件van Waarde et al. (2020) :提出数据信息性框架,给出充要条件,不需要唯一辨识噪声情况 :van Waarde et al. (2020), Li et al. (2026)研究了噪声数据下的控制器综合参数界约束 :Berberich et al. (2022)研究了线性分式表示的先验知识部分参数已知 :Huang et al. (2025)研究了多项式系统的密度函数方法本文创新 :首次研究系统理论性质(可控性/可镇定性)作为先验知识稳定性约束 :van Gestel et al. (2002), Lacy & Bernstein (2003)特征值约束 :Miller & De Callafon (2013)正性/无源性 :De Santis & Farina (2002), Goethals et al. (2003)本文区别 :关注控制器设计而非辨识,且处理非凸先验知识集Jia et al. (2020)等研究了从系统结构推断可控性,本文可视为将这些结构信息用于数据驱动控制的桥梁。
可控性先验的无效性 :若已知系统可控,该先验不能放松数据驱动镇定的条件(Theorem 5)可镇定性先验的有效性 :状态数据满秩时无帮助(Theorem 14) 状态数据秩亏时显著放松条件(Theorem 15) 反直觉现象 :更强的性质(可控性)无益,更弱的性质(可镇定性)有益——原因在于可能所有数据一致系统都不可控实用设计方法 :提供了基于LMI的可计算控制器设计方法(Proposition 16)Example 4的启示 :
Σ_D = {([1 α], [1]) | α,β∈ℝ}
([0 β], [0])
rank X⁻ = 1 < 2,数据不informative 但Σ_D∩Σ_stab中所有系统可被K=-1 0 镇定 关键:不可控系统的自主部分β必须稳定(|β|<1) Lemma 17的意义 :提供了数据驱动的系统分解,无需知道系统矩阵:
可镇定部分:(A₁₁,B₁)可从数据直接恢复 稳定自主部分:A₂₂不影响镇定性 无噪声假设 :当前理论仅适用于无噪声数据,噪声情况下的扩展是开放问题离线数据 :需要预先收集完整数据集,不适用于在线学习场景线性系统 :仅考虑LTI系统,非线性系统扩展具有挑战性二元先验 :仅考虑"可镇定"或"不可镇定",未考虑可达子空间维数的上界等更细粒度先验Schur稳定性 :仅考虑稳定性,未涉及性能指标(如H∞范数)噪声鲁棒性 :扩展至噪声数据,可能需要结合鲁棒控制技术(如S-lemma)可达子空间维数界 :研究"rank R(A,B) ≤ r"作为先验知识的情况性能优化 :结合可镇定性先验设计最优控制器(如LQR)在线学习 :发展自适应算法,在线更新控制器非线性扩展 :研究双线性或多项式系统的类似理论实际应用 :在机器人、电力系统等领域验证方法非凸先验的处理 :首次在数据驱动控制中处理非凸先验知识集(可镇定/可控系统集非凸),技术难度高充要条件 :Theorem 15给出秩亏情况的充要条件,理论完备反直觉结果 :揭示了可控性无益但可镇定性有益的现象,提供深刻洞察Lemma 7 (参数化可控性):利用Kalman矩阵的多项式性质,证明可控性在"几乎处处"成立Lemma 9 (矩阵束分析):通过迹的多项式性质推导幂零性,技术巧妙Lemma 17 (数据驱动分解):无需知道系统矩阵即可实现分解,创新性强LMI可解 :Proposition 16提供标准凸优化问题,可用现有工具求解参数自由度 :K₂的任意性提供设计灵活性数值验证 :三水箱示例清晰展示方法有效性Monte Carlo分析 :1000场景统计充分多样本数分析 :系统研究T从3到100的影响物理系统 :三水箱系统具有实际意义且结构可控性清晰定义精确,定理陈述清楚 例子(Example 4, 6)帮助理解 符号系统一致 Remark 19的问题 :Σ_stab-informative不保证二次镇定(quadratic stabilization),可能限制实际应用保守性分析缺失 :未量化可镇定性先验相比无先验能节省多少数据必要性证明不完整 :Theorem 10(b)-(d)的必要性证明依赖(a),但(a)本身的必要性证明较复杂单一案例 :仅三水箱系统,缺乏多样性(如高维系统、不同结构)无噪声对比 :未比较噪声情况下方法的鲁棒性计算复杂度 :未分析LMI求解的计算时间随n,T的变化失败案例 :未展示不满足Theorem 15条件的数据示例K₂选择 :Proposition 16(b)中K₂任意,但未给出选择指导(如优化性能)数据效率 :未与基于模型的方法比较数据效率扩展性 :未讨论多输入多输出(MIMO)系统的特殊考虑未与最新的深度强化学习方法比较 未讨论与自适应控制的关系 缺少与鲁棒控制(如μ-synthesis)的联系 先验获取 :未讨论如何在实践中验证系统可镇定(可能需要部分辨识)失败处理 :若LMI (11)不可行怎么办?闭环数据 :仅考虑开环数据,闭环数据情况未涉及理论基础 :为数据驱动控制整合系统理论性质奠定基础,开辟新研究方向方法论 :处理非凸先验的技术可推广至其他系统性质(如无源性、正性)桥梁作用 :连接结构可控性理论与数据驱动控制降低数据需求 :Monte Carlo实验显示数据需求可降低至1/5(T=3时)秩亏情况 :为实践中常见的秩亏数据提供解决方案开源代码 :提供GitHub代码,可复现性强机器人 :关节不可控时的镇定控制电力系统 :部分发电机不可控的电网稳定过程控制 :化工过程中的多水箱、换热器系统航空航天 :卫星姿态控制(某些模态不可控但可镇定)理论门槛高 :需要深厚的控制理论背景,限制传播实际验证不足 :缺少真实系统实验,工业界接受度存疑噪声敏感性 :无噪声假设限制直接应用结构已知系统 :可从结构推断可镇定性(如网络化系统)秩亏数据 :初始条件导致X⁻秩亏但系统可镇定低数据环境 :数据采集成本高(如航天、医疗)安全关键系统 :需要理论保证的镇定性高噪声环境 :当前理论不适用非线性系统 :需要其他方法时变系统 :LTI假设不满足性能要求严格 :仅保证稳定性,不保证性能结合鲁棒方法 :扩展至有界噪声情况性能优化 :在镇定约束下优化LQR成本在线更新 :发展递推算法实验验证 :在实际系统上验证(如无人机、工业过程)这是一篇高质量的理论控制论文 ,在数据驱动控制领域做出了重要贡献。主要亮点是:
首次系统研究系统理论性质作为先验知识 揭示了可控性与可镇定性的本质区别 提供完整的充要条件和可计算方法 主要不足是实验验证不够充分,噪声鲁棒性未考虑。
推荐指数 :⭐⭐⭐⭐☆ (4/5)
理论深度:⭐⭐⭐⭐⭐ 实用价值:⭐⭐⭐⭐ 实验充分性:⭐⭐⭐ 写作质量:⭐⭐⭐⭐⭐ 创新性:⭐⭐⭐⭐⭐ 适合发表在控制领域顶级期刊(如IEEE TAC, Automatica),对数据驱动控制和系统理论研究者有重要参考价值。
3 H. J. van Waarde et al., "Data informativity: A new perspective on data-driven analysis and control," IEEE TAC, 2020. (数据信息性框架的奠基工作)
4 C. De Persis & P. Tesi, "Formulas for data-driven control: Stabilization, optimality, and robustness," IEEE TAC, 2019. (首个数据驱动镇定LMI方法)
12 J. Berberich et al., "Combining prior knowledge and data for robust controller design," IEEE TAC, 2022. (参数界先验知识)
25 J. Jia et al., "A unifying framework for strong structural controllability," IEEE TAC, 2020. (结构可控性理论)
27 H. J. van Waarde & M. K. Camlibel, "A matrix Finsler's lemma with applications to data-driven control," CDC, 2021. (二次镇定理论)