2025-11-14T19:58:11.731798

Data-Driven Stabilization Using Prior Knowledge on Stabilizability and Controllability

Shakouri, van Waarde, Baltussen et al.
In this work, we study data-driven stabilization of linear time-invariant systems using prior knowledge of system-theoretic properties, specifically stabilizability and controllability. To formalize this, we extend the concept of data informativity by requiring the existence of a controller that stabilizes all systems consistent with the data and the prior knowledge. We show that if the system is controllable, then incorporating this as prior knowledge does not relax the conditions required for data-driven stabilization. Remarkably, however, we show that if the system is stabilizable, then using this as prior knowledge leads to necessary and sufficient conditions that are weaker than those for data-driven stabilization without prior knowledge. In other words, data-driven stabilization is easier if one knows that the underlying system is stabilizable. We also provide new data-driven control design methods in terms of linear matrix inequalities that complement the conditions for informativity.
academic

Data-Driven Stabilization Using Prior Knowledge on Stabilizability and Controllability

基本信息

  • 论文ID: 2510.25452
  • 标题: Data-Driven Stabilization Using Prior Knowledge on Stabilizability and Controllability
  • 作者: Amir Shakouri, Henk J. van Waarde, Tren M.J.T. Baltussen, W.P.M.H. (Maurice) Heemels
  • 单位: University of Groningen (Shakouri, van Waarde), Eindhoven University of Technology (Baltussen, Heemels)
  • 分类: math.OC (Optimization and Control), cs.SY, eess.SY (Systems and Control)
  • 发表时间: arXiv v2, 2025年10月30日
  • 论文链接: https://arxiv.org/abs/2510.25452v2

摘要

本文研究了利用系统理论性质(特别是可镇定性和可控性)作为先验知识的线性时不变系统数据驱动镇定问题。作者扩展了数据信息性概念,要求存在一个控制器能够镇定所有与数据和先验知识一致的系统。研究表明:(1) 若系统可控,将此作为先验知识并不能放松数据驱动镇定的条件;(2) 若系统可镇定,则使用该先验知识能够得到比无先验知识更弱的充要条件。换言之,如果已知底层系统可镇定,则数据驱动镇定更容易实现。文章还提供了基于线性矩阵不等式(LMI)的新型数据驱动控制设计方法。

研究背景与动机

要解决的核心问题

本文要解决的是:如何在有限数据条件下,结合系统的可镇定性或可控性先验知识,设计镇定控制器?

传统数据驱动控制假设系统参数完全未知,但对于大多数物理系统,这种假设过于保守。实际中,我们常常掌握一些先验知识(如质量、弹簧常数等物理量的范围,或从系统结构可推断的可控性/可镇定性)。

问题的重要性

  1. 降低数据需求:直接从数据设计控制器可能需要大量数据才能满足持续激励条件,但结合先验知识可能用更少数据实现镇定
  2. 实际可行性:某些情况下仅从数据无法设计镇定控制器(如状态数据秩亏),但加入先验知识可能使设计变得可行
  3. 理论完备性:系统理论性质(可控性、可镇定性)是控制理论的基础概念,但在数据驱动框架下尚未得到充分研究

现有方法的局限性

  1. 数据驱动控制:现有工作(如De Persis & Tesi 2019, van Waarde et al. 2020)主要研究无先验知识情况,需要满足严格的数据条件(如持续激励、状态数据满秩)
  2. 先验知识整合:已有研究仅限于参数界约束12-14或部分参数已知15,未涉及系统理论性质
  3. 非凸性挑战:可镇定和可控系统集合是非凸的,不同于现有工作考虑的凸系统集

研究动机

在许多实际应用中,可以从系统结构推断出可控性或可镇定性(结构可控性理论),但这类先验知识在数据驱动控制中尚未被利用。本文填补了这一理论空白。

核心贡献

本文的主要贡献包括:

  1. 理论框架扩展:将数据信息性(data informativity)概念扩展至包含先验知识,提出Σ_pk-informativity定义(Definition 3)
  2. 可控性先验的等价性定理(Theorem 5):证明了利用可控性作为先验知识等价于无先验知识情况,即可控性先验不能放松数据条件
  3. 可镇定性先验的优势定理(Theorems 14, 15):
    • 当状态数据满秩(rank X⁻ = n)时,可镇定性先验不提供额外帮助
    • 当状态数据秩亏(rank X⁻ < n)时,可镇定性先验显著放松条件,给出充要条件
  4. 可计算的设计方法(Proposition 16):提供基于LMI的镇定控制器计算方法,可从Σ_stab-informative数据直接求解
  5. 理论洞察:揭示了看似矛盾的现象——更强的性质(可控性)不能帮助放松条件,而较弱的性质(可镇定性)却可以,这是因为在某些情况下所有数据一致系统都不可控

方法详解

任务定义

系统模型:考虑离散时间LTI系统

x(t+1) = A_true x(t) + B_true u(t)

其中 x(t)∈ℝⁿ 是状态,u(t)∈ℝᵐ 是输入,系统矩阵(A_true, B_true)未知。

数据:从时间0到T收集的输入-状态数据

D := ([u(0),...,u(T-1)], [x(0),...,x(T)])

定义数据矩阵:

  • U⁻ = u(0),...,u(T-1)
  • X⁻ = x(0),...,x(T-1)
  • X⁺ = x(1),...,x(T)

数据一致系统集

Σ_D := {(A,B) | X⁺ = AX⁻ + BU⁻}

目标:找到反馈增益K使得A+BK对所有(A,B)∈Σ_D∩Σ_pk都是Schur稳定的(所有特征值模长<1)

核心概念

Definition 3 (Σ_pk-informativity for stabilization): 数据D称为Σ_pk-informative for stabilization,如果存在K∈ℝᵐˣⁿ使得A+BK对所有(A,B)∈Σ_D∩Σ_pk都是Schur稳定的。

先验知识集合

  • Σ_cont:所有可控系统对的集合
  • Σ_stab:所有可镇定系统对的集合

可控性作为先验知识(Section III)

Theorem 5(核心结果):假设(A_true, B_true)∈Σ_cont,则以下等价:

  • (a) 数据D是Σ_cont-informative for stabilization
  • (b) 数据D是informative for stabilization(无先验知识)

证明思路

  1. (b)⇒(a)显然成立
  2. (a)⇒(b)的关键:
    • 若Σ_D⊆Σ_cont,结论显然
    • 若存在不可控的(Ā,B̄)∈Σ_D,利用Lemma 7(参数化系统族在几乎所有点可控)和Lemma 9(矩阵束稳定性)证明镇定K也能镇定(Ā,B̄)

关键引理

  • Lemma 7:若(M,N)可控,则(M+αM₀, N+αN₀)对除至多n²个α值外都可控
  • Lemma 9:若M+δN对所有δ∈[ε,∞)\F(F有限)都Schur,则N幂零且M+δN对所有δ∈ℝ都Schur

可镇定性作为先验知识(Section IV)

A. 必要条件(Theorem 10)

若数据Σ_stab-informative且K是镇定增益,则:

  • (a) (A₀+B₀K)R(A,B) = {0} 对所有(A,B)∈Σ_D∩Σ_stab和(A₀,B₀)∈Σ⁰_D
  • (b) 若rank X⁻ < n,则imX⁻;U⁻ = im X⁻ × ℝᵐ
  • (c) im X⁺ ⊆ im X⁻
  • (d) im X⁻是A-不变的且包含im B

Remark 11:条件(a)是无先验知识情况下A₀+B₀K=0的放松版本;条件(b)-(d)在rank X⁻ = n时自动满足,但在秩亏情况下非平凡。

B. 满秩情况(Theorem 14)

Theorem 14:若(A_true,B_true)∈Σ_stab且rank X⁻ = n,则:

  • Σ_stab-informativity ⟺ informativity(无先验知识)

证明思路

  1. 若真系统可控,由Theorem 5得结论
  2. 若真系统不可控,构造K̂使得对所有(A,B)∈Σ_D有A+BK̂ = A_true+B_true K̂,然后证明后者Schur

C. 秩亏情况(Theorem 15,核心结果)

Theorem 15:若(A_true,B_true)∈Σ_stab且rank X⁻ < n,则数据D是Σ_stab-informative当且仅当:

  • (a) im X⁺ ⊆ im X⁻
  • (b) imX⁻;U⁻ = im X⁻ × ℝᵐ

关键引理(Lemma 17):若条件(a)(b)成立,则对所有(A,B)∈Σ_D∩Σ_stab,变换矩阵S满足:

SAS⁻¹ = [A₁₁  A₁₂]    SB = [B₁]
         [0    A₂₂]          [0]

其中(A₁₁,B₁)可镇定,A₂₂ Schur,且A₁₁ B₁ = X̂⁺X̂⁻;U⁻

这提供了数据驱动的类Kalman分解。

控制器设计方法(Proposition 16)

Proposition 16:若数据Σ_stab-informative且rank X⁻ = r < n:

(a) 存在Θ∈ℝᵀˣʳ使得LMI可行:

X̂⁻Θ = Θᵀ X̂⁻ᵀ
[X̂⁻Θ    X̂⁺Θ  ] > 0
[Θᵀ X̂⁺ᵀ  X̂⁻Θ  ]

(b) 若Θ满足(11),取K = K₁ K₂S,其中:

  • K₁ = U⁻Θ(X̂⁻Θ)⁻¹
  • K₂∈ℝᵐˣ⁽ⁿ⁻ʳ⁾任意 则A+BK对所有(A,B)∈Σ_D∩Σ_stab都Schur

设计步骤

  1. 计算X⁻的QR分解得到S和X̂⁻
  2. 求解LMI (11)得到Θ
  3. 计算K₁ = U⁻Θ(X̂⁻Θ)⁻¹
  4. 任选K₂,构造K = K₁ K₂S

实验设置

数值示例:三水箱系统

系统描述(Figure 2):

  • 3个串联水箱,流体从水箱3流向水箱2再到水箱1
  • 状态:x_i为水箱i的液位高度(i=1,2,3)
  • 控制输入:u为水箱2与储液池之间的流速
  • 结构特性:由于单向流动,x₃不可控

连续时间模型

ẋ = A_c x + B_c u

其中:

A_c = [-0.6  0.5   0  ]    B_c = [0  ]
      [0.5  -0.5  0.5 ]          [1  ]
      [0     0   -0.5 ]          [0  ]

离散化(采样时间0.1s):

A_true = [0.9429  0.0473  0.0012]    B_true = [0.0024]
         [0.0473  0.9524  0.0476]             [0.0976]
         [0      0       0.9512]              [0     ]

实验数据

开环实验(T=5):

t012345
u(t)10-101
x₁11.041.07781.10861.13341.1575
x₂22.04982.00151.85971.82371.8881
x₃000000

数据特性:rank X⁻ = 2 < 3(秩亏)

求解过程

  1. 使用MATLAB + YALMIP + MOSEK求解LMI (11)
  2. 得到Θ(5×2矩阵)
  3. 计算K₁ = -2.7728 -9.7123
  4. 取K₂ = 0,得到K = -2.7728 -9.7123 0

Monte Carlo实验

实验设置

  • 1000个随机场景
  • 每个场景:从t=0到t=100模拟系统
  • 输入和初始条件从泊松分布(λ=1)独立采样
  • 分析不同样本数T = 3, 4, 5, 10, 100的数据信息性

评价指标

  • 系统辨识信息性(rankX⁻ᵀ U⁻ᵀ = n+m)
  • 无先验知识的镇定信息性
  • Σ_stab-informative

实验结果

主要结果(Table I)

T系统辨识信息性镇定信息性(无先验)Σ_stab-镇定信息性
30%8.1%42%
462.4%63.2%99.4%
562.8%63.2%99.8%
1063.2%63.2%100%
10063.2%63.2%100%

关键发现

  1. T=3时的显著优势
    • 无法进行系统辨识(T < n+m)
    • 仅8.1%数据可用于无先验镇定
    • 42%数据可用于Σ_stab-镇定(5倍提升)
  2. T≥4时的收敛行为
    • 系统辨识和无先验镇定信息性稳定在63.2%
    • 这是因为约36.8%的随机数据不满足必要条件
  3. T≥10时的完全覆盖
    • 100%数据都是Σ_stab-informative
    • 显著展示了可镇定性先验的强大作用

案例验证

对于给定的T=5数据:

  • X⁻不满秩,Proposition 2失效(无法用于无先验镇定)
  • 但满足Theorem 15条件
  • 成功求解LMI得到镇定增益K

相关工作

数据驱动控制

  1. De Persis & Tesi (2019):首次提出从数据直接设计镇定反馈的LMI方法,需要持续激励条件
  2. van Waarde et al. (2020):提出数据信息性框架,给出充要条件,不需要唯一辨识
  3. 噪声情况:van Waarde et al. (2020), Li et al. (2026)研究了噪声数据下的控制器综合

数据驱动控制中的先验知识

  1. 参数界约束:Berberich et al. (2022)研究了线性分式表示的先验知识
  2. 部分参数已知:Huang et al. (2025)研究了多项式系统的密度函数方法
  3. 本文创新:首次研究系统理论性质(可控性/可镇定性)作为先验知识

系统辨识中的先验知识

  1. 稳定性约束:van Gestel et al. (2002), Lacy & Bernstein (2003)
  2. 特征值约束:Miller & De Callafon (2013)
  3. 正性/无源性:De Santis & Farina (2002), Goethals et al. (2003)
  4. 本文区别:关注控制器设计而非辨识,且处理非凸先验知识集

结构可控性

Jia et al. (2020)等研究了从系统结构推断可控性,本文可视为将这些结构信息用于数据驱动控制的桥梁。

结论与讨论

主要结论

  1. 可控性先验的无效性:若已知系统可控,该先验不能放松数据驱动镇定的条件(Theorem 5)
  2. 可镇定性先验的有效性
    • 状态数据满秩时无帮助(Theorem 14)
    • 状态数据秩亏时显著放松条件(Theorem 15)
  3. 反直觉现象:更强的性质(可控性)无益,更弱的性质(可镇定性)有益——原因在于可能所有数据一致系统都不可控
  4. 实用设计方法:提供了基于LMI的可计算控制器设计方法(Proposition 16)

理论洞察

Example 4的启示

Σ_D = {([1 α], [1]) | α,β∈ℝ}
      ([0 β], [0])
  • rank X⁻ = 1 < 2,数据不informative
  • 但Σ_D∩Σ_stab中所有系统可被K=-1 0镇定
  • 关键:不可控系统的自主部分β必须稳定(|β|<1)

Lemma 17的意义:提供了数据驱动的系统分解,无需知道系统矩阵:

  • 可镇定部分:(A₁₁,B₁)可从数据直接恢复
  • 稳定自主部分:A₂₂不影响镇定性

局限性

  1. 无噪声假设:当前理论仅适用于无噪声数据,噪声情况下的扩展是开放问题
  2. 离线数据:需要预先收集完整数据集,不适用于在线学习场景
  3. 线性系统:仅考虑LTI系统,非线性系统扩展具有挑战性
  4. 二元先验:仅考虑"可镇定"或"不可镇定",未考虑可达子空间维数的上界等更细粒度先验
  5. Schur稳定性:仅考虑稳定性,未涉及性能指标(如H∞范数)

未来方向

  1. 噪声鲁棒性:扩展至噪声数据,可能需要结合鲁棒控制技术(如S-lemma)
  2. 可达子空间维数界:研究"rank R(A,B) ≤ r"作为先验知识的情况
  3. 性能优化:结合可镇定性先验设计最优控制器(如LQR)
  4. 在线学习:发展自适应算法,在线更新控制器
  5. 非线性扩展:研究双线性或多项式系统的类似理论
  6. 实际应用:在机器人、电力系统等领域验证方法

深度评价

优点

1. 理论贡献深刻

  • 非凸先验的处理:首次在数据驱动控制中处理非凸先验知识集(可镇定/可控系统集非凸),技术难度高
  • 充要条件:Theorem 15给出秩亏情况的充要条件,理论完备
  • 反直觉结果:揭示了可控性无益但可镇定性有益的现象,提供深刻洞察

2. 证明技术精湛

  • Lemma 7(参数化可控性):利用Kalman矩阵的多项式性质,证明可控性在"几乎处处"成立
  • Lemma 9(矩阵束分析):通过迹的多项式性质推导幂零性,技术巧妙
  • Lemma 17(数据驱动分解):无需知道系统矩阵即可实现分解,创新性强

3. 方法实用性强

  • LMI可解:Proposition 16提供标准凸优化问题,可用现有工具求解
  • 参数自由度:K₂的任意性提供设计灵活性
  • 数值验证:三水箱示例清晰展示方法有效性

4. 实验设计合理

  • Monte Carlo分析:1000场景统计充分
  • 多样本数分析:系统研究T从3到100的影响
  • 物理系统:三水箱系统具有实际意义且结构可控性清晰

5. 写作清晰严谨

  • 定义精确,定理陈述清楚
  • 例子(Example 4, 6)帮助理解
  • 符号系统一致

不足

1. 理论限制

  • Remark 19的问题:Σ_stab-informative不保证二次镇定(quadratic stabilization),可能限制实际应用
  • 保守性分析缺失:未量化可镇定性先验相比无先验能节省多少数据
  • 必要性证明不完整:Theorem 10(b)-(d)的必要性证明依赖(a),但(a)本身的必要性证明较复杂

2. 实验不足

  • 单一案例:仅三水箱系统,缺乏多样性(如高维系统、不同结构)
  • 无噪声对比:未比较噪声情况下方法的鲁棒性
  • 计算复杂度:未分析LMI求解的计算时间随n,T的变化
  • 失败案例:未展示不满足Theorem 15条件的数据示例

3. 方法局限

  • K₂选择:Proposition 16(b)中K₂任意,但未给出选择指导(如优化性能)
  • 数据效率:未与基于模型的方法比较数据效率
  • 扩展性:未讨论多输入多输出(MIMO)系统的特殊考虑

4. 相关工作对比

  • 未与最新的深度强化学习方法比较
  • 未讨论与自适应控制的关系
  • 缺少与鲁棒控制(如μ-synthesis)的联系

5. 实用性考虑

  • 先验获取:未讨论如何在实践中验证系统可镇定(可能需要部分辨识)
  • 失败处理:若LMI (11)不可行怎么办?
  • 闭环数据:仅考虑开环数据,闭环数据情况未涉及

影响力评估

对领域的贡献

  1. 理论基础:为数据驱动控制整合系统理论性质奠定基础,开辟新研究方向
  2. 方法论:处理非凸先验的技术可推广至其他系统性质(如无源性、正性)
  3. 桥梁作用:连接结构可控性理论与数据驱动控制

实用价值

  1. 降低数据需求:Monte Carlo实验显示数据需求可降低至1/5(T=3时)
  2. 秩亏情况:为实践中常见的秩亏数据提供解决方案
  3. 开源代码:提供GitHub代码,可复现性强

潜在应用

  1. 机器人:关节不可控时的镇定控制
  2. 电力系统:部分发电机不可控的电网稳定
  3. 过程控制:化工过程中的多水箱、换热器系统
  4. 航空航天:卫星姿态控制(某些模态不可控但可镇定)

局限

  1. 理论门槛高:需要深厚的控制理论背景,限制传播
  2. 实际验证不足:缺少真实系统实验,工业界接受度存疑
  3. 噪声敏感性:无噪声假设限制直接应用

适用场景

理想场景

  1. 结构已知系统:可从结构推断可镇定性(如网络化系统)
  2. 秩亏数据:初始条件导致X⁻秩亏但系统可镇定
  3. 低数据环境:数据采集成本高(如航天、医疗)
  4. 安全关键系统:需要理论保证的镇定性

不适用场景

  1. 高噪声环境:当前理论不适用
  2. 非线性系统:需要其他方法
  3. 时变系统:LTI假设不满足
  4. 性能要求严格:仅保证稳定性,不保证性能

改进建议

  1. 结合鲁棒方法:扩展至有界噪声情况
  2. 性能优化:在镇定约束下优化LQR成本
  3. 在线更新:发展递推算法
  4. 实验验证:在实际系统上验证(如无人机、工业过程)

总体评价

这是一篇高质量的理论控制论文,在数据驱动控制领域做出了重要贡献。主要亮点是:

  1. 首次系统研究系统理论性质作为先验知识
  2. 揭示了可控性与可镇定性的本质区别
  3. 提供完整的充要条件和可计算方法

主要不足是实验验证不够充分,噪声鲁棒性未考虑。

推荐指数:⭐⭐⭐⭐☆ (4/5)

  • 理论深度:⭐⭐⭐⭐⭐
  • 实用价值:⭐⭐⭐⭐
  • 实验充分性:⭐⭐⭐
  • 写作质量:⭐⭐⭐⭐⭐
  • 创新性:⭐⭐⭐⭐⭐

适合发表在控制领域顶级期刊(如IEEE TAC, Automatica),对数据驱动控制和系统理论研究者有重要参考价值。

参考文献(精选)

3 H. J. van Waarde et al., "Data informativity: A new perspective on data-driven analysis and control," IEEE TAC, 2020. (数据信息性框架的奠基工作)

4 C. De Persis & P. Tesi, "Formulas for data-driven control: Stabilization, optimality, and robustness," IEEE TAC, 2019. (首个数据驱动镇定LMI方法)

12 J. Berberich et al., "Combining prior knowledge and data for robust controller design," IEEE TAC, 2022. (参数界先验知识)

25 J. Jia et al., "A unifying framework for strong structural controllability," IEEE TAC, 2020. (结构可控性理论)

27 H. J. van Waarde & M. K. Camlibel, "A matrix Finsler's lemma with applications to data-driven control," CDC, 2021. (二次镇定理论)