状态空间方法是现代控制理论的基石,它提供了一种系统化的方法来分析和设计多输入多输出(MIMO)系统。与经典控制理论依赖传递函数不同,状态空间方法直接处理系统的内部状态,为我们提供了更深入的系统洞察。本章将介绍可控性、可观性、状态反馈、观测器设计等核心概念,并通过磁悬浮系统案例展示这些理论的实际应用。
考虑线性时不变(LTI)系统的状态空间表示:
\[\begin{align} \dot{x}(t) &= Ax(t) + Bu(t) \\ y(t) &= Cx(t) + Du(t) \end{align}\]其中 $x \in \mathbb{R}^n$ 是状态向量,$u \in \mathbb{R}^m$ 是输入向量,$y \in \mathbb{R}^p$ 是输出向量。
定义:如果存在有限时间 $T > 0$ 和输入 $u(t)$,能够将系统从任意初始状态 $x_0$ 转移到任意目标状态 $x_f$,则系统是完全可控的。
数学表述:系统完全可控的充要条件是,对任意 $x_0, x_f \in \mathbb{R}^n$ 和某个 $T > 0$,存在分段连续的输入 $u:[0,T] \rightarrow \mathbb{R}^m$,使得: \(x_f = e^{AT}x_0 + \int_0^T e^{A(T-\tau)}Bu(\tau)d\tau\)
可控性矩阵: \(\mathcal{C} = [B \quad AB \quad A^2B \quad \cdots \quad A^{n-1}B] \in \mathbb{R}^{n \times nm}\)
这个矩阵的列向量张成了可控子空间。根据Cayley-Hamilton定理,$A^n$ 可以表示为 $A^0, A^1, \ldots, A^{n-1}$ 的线性组合,因此只需要考虑前 $n$ 项。
可控性判据:系统完全可控当且仅当 $\text{rank}(\mathcal{C}) = n$。
等价条件:
物理意义:
几何解释: 可控子空间 $\mathcal{R}(\mathcal{C})$ 是所有可以从原点到达的状态集合。如果系统不完全可控,状态空间可以分解为: \(\mathbb{R}^n = \mathcal{R}(\mathcal{C}) \oplus \mathcal{R}(\mathcal{C})^\perp\) 其中 $\mathcal{R}(\mathcal{C})^\perp$ 是不可控子空间。
定义:如果能够通过有限时间内的输出测量 $y(t)$ 唯一确定初始状态 $x_0$,则系统是完全可观的。
数学表述:系统完全可观的充要条件是,对于 $u(t) \equiv 0$,如果 $y(t) \equiv 0$ 对所有 $t \in [0, T]$,则必有 $x_0 = 0$。换言之,零输入响应唯一确定初始状态。
可观性矩阵: \(\mathcal{O} = \begin{bmatrix} C \\ CA \\ CA^2 \\ \vdots \\ CA^{n-1} \end{bmatrix} \in \mathbb{R}^{np \times n}\)
可观性判据:系统完全可观当且仅当 $\text{rank}(\mathcal{O}) = n$。
等价条件:
物理意义:
不可观子空间: 不可观子空间是所有不能从输出区分的初始状态集合。它是矩阵 $\mathcal{O}$ 的零空间: \(\mathcal{N}(\mathcal{O}) = \{x_0 : Ce^{At}x_0 = 0, \forall t \geq 0\}\)
可检测性: 即使系统不完全可观,如果所有不可观模态都是稳定的,则系统是可检测的。这在实际应用中往往足够,因为稳定的不可观模态会自然衰减。
可控性和可观性存在对偶关系:系统 $(A, B, C)$ 可控等价于系统 $(A^T, C^T, B^T)$ 可观。
对偶原理的数学表述:
对偶性质:
实际意义:
应用示例: 如果已知如何设计状态反馈控制器,通过对偶原理可以直接设计观测器:
可控标准型:对于单输入系统,如果完全可控,可通过相似变换转化为:
\[A_c = \begin{bmatrix} 0 & 1 & 0 & \cdots & 0 \\ 0 & 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & 1 \\ -a_0 & -a_1 & -a_2 & \cdots & -a_{n-1} \end{bmatrix}, \quad B_c = \begin{bmatrix} 0 \\ 0 \\ \vdots \\ 0 \\ 1 \end{bmatrix}\]这种形式直接反映了系统的特征多项式:$\det(sI - A_c) = s^n + a_{n-1}s^{n-1} + \cdots + a_1s + a_0$
变换矩阵:设 $T$ 是将 $(A, B)$ 变换到可控标准型的矩阵,则: \(T = \mathcal{C}_c \mathcal{C}^{-1}\) 其中 $\mathcal{C}$ 是原系统的可控性矩阵,$\mathcal{C}_c$ 是标准型的可控性矩阵。
可观标准型:对于单输出系统,如果完全可观,可通过相似变换转化为:
\[A_o = \begin{bmatrix} 0 & 0 & \cdots & 0 & -a_0 \\ 1 & 0 & \cdots & 0 & -a_1 \\ 0 & 1 & \cdots & 0 & -a_2 \\ \vdots & \vdots & \ddots & \vdots & \vdots \\ 0 & 0 & \cdots & 1 & -a_{n-1} \end{bmatrix}, \quad C_o = \begin{bmatrix} 0 & 0 & \cdots & 0 & 1 \end{bmatrix}\]标准型的应用:
注意事项:
状态反馈控制律形式为: \(u(t) = -Kx(t) + r(t)\)
其中 $K \in \mathbb{R}^{m \times n}$ 是反馈增益矩阵,$r(t)$ 是参考输入。
闭环系统动态变为: \(\dot{x}(t) = (A - BK)x(t) + Br(t)\)
定理:对于完全可控的单输入系统 $(A, b)$,存在状态反馈增益 $k$,使得闭环系统 $A - bk^T$ 的特征值可以任意配置。
证明思路:
Ackermann公式: \(k^T = [0 \quad 0 \quad \cdots \quad 1] \mathcal{C}^{-1} p(A)\)
其中 $p(s) = (s - \lambda_1)(s - \lambda_2)\cdots(s - \lambda_n)$ 是期望的特征多项式,$p(A)$ 是矩阵多项式: \(p(A) = A^n + a_{n-1}A^{n-1} + \cdots + a_1A + a_0I\)
Bass-Gura公式(另一种计算方法): \(k^T = (a - \alpha)T^{-1}\) 其中 $a = [a_0, a_1, \ldots, a_{n-1}]$ 是期望特征多项式系数,$\alpha = [\alpha_0, \alpha_1, \ldots, \alpha_{n-1}]$ 是开环特征多项式系数,$T$ 是可控性变换矩阵。
计算步骤:
对于多输入系统,反馈增益矩阵不唯一。这提供了额外的设计自由度,但也增加了设计复杂性。
主要方法:
设计自由度的利用:
| 最小化控制能量:$\min | K | _F$ 满足极点配置约束 |
实用算法:
输入:(A, B), 期望极点 {λ₁, ..., λₙ}
输出:反馈增益 K
1. 检查可控性
2. 对于每个期望极点 λᵢ:
a. 求解 (λᵢI - A)vᵢ = Bwᵢ
b. 选择 wᵢ 使 vᵢ 线性独立
3. 构造 V = [v₁ ... vₙ], W = [w₁ ... wₙ]
4. 计算 K = WV⁻¹
极点位置直接影响系统性能,合理的极点选择是成功控制设计的关键。
性能指标与极点关系:
| 时间常数:$\tau = 1/ | \text{Re}(\lambda) | $ |
| 调节时间(2%准则):$t_s \approx 4/ | \text{Re}(\lambda_{\text{dom}}) | $ |
工程经验法则:
实际限制考虑:
极点配置策略:
1. 根据性能指标确定主导极点位置
2. 非主导极点放置在主导极点左侧5-10倍处
3. 复极点成对配置(共轭对)
4. 验证控制量是否在约束范围内
5. 进行灵敏度分析
当状态不能直接测量时,需要构造观测器估计状态。全维观测器(Luenberger观测器)结构:
\[\dot{\hat{x}}(t) = A\hat{x}(t) + Bu(t) + L(y(t) - C\hat{x}(t))\]其中 $\hat{x}$ 是状态估计,$L$ 是观测器增益矩阵。
估计误差动态: \(\dot{e}(t) = (A - LC)e(t)\)
其中 $e(t) = x(t) - \hat{x}(t)$。
通过选择 $L$ 配置 $(A - LC)$ 的特征值,控制误差收敛速度。由对偶性,若系统可观,则可任意配置观测器极点。
设计准则:
当部分状态可直接测量时,只需估计不可测状态,降低观测器维数。
假设输出 $y = C_1x_1 + C_2x_2$,其中 $x_1$ 可测,$x_2$ 需要估计。降维观测器维数为 $n - p$。
优点:
定理:对于线性系统,状态反馈控制器和状态观测器可以独立设计。闭环系统的特征值是控制器特征值和观测器特征值的并集。
数学表述:考虑增广系统 \(\begin{bmatrix} \dot{x} \\ \dot{e} \end{bmatrix} = \begin{bmatrix} A-BK & BK \\ 0 & A-LC \end{bmatrix} \begin{bmatrix} x \\ e \end{bmatrix}\)
系统矩阵是块三角形,特征值为 $\lambda(A-BK) \cup \lambda(A-LC)$。
虽然分离原理保证了独立设计的可行性,但实际中需要考虑:
磁悬浮系统是典型的非线性不稳定系统,通过电磁力克服重力使物体悬浮。
电磁铁
|
┌───┴───┐
│ │
└───┬───┘
↓ F_m
│
│ x
○ 悬浮球
↓ mg
根据牛顿第二定律和电磁学原理: \(m\ddot{x} = mg - F_m = mg - \frac{c i^2}{x^2}\)
电路方程: \(L\frac{di}{dt} = u - Ri - \frac{d\lambda}{dt}\)
其中 $x$ 是位置,$i$ 是电流,$u$ 是电压输入。
在平衡点 $(x_0, i_0)$ 附近线性化,令 $\delta x = x - x_0$,$\delta i = i - i_0$:
选择状态变量 $[x_1, x_2, x_3]^T = [\delta x, \dot{x}, \delta i]^T$:
\[A = \begin{bmatrix} 0 & 1 & 0 \\ k_x & 0 & -k_i \\ 0 & 0 & -\frac{R}{L} \end{bmatrix}, \quad B = \begin{bmatrix} 0 \\ 0 \\ \frac{1}{L} \end{bmatrix}\]其中 $k_x = \frac{2ci_0^2}{mx_0^3}$,$k_i = \frac{2ci_0}{mx_0^2}$。
计算可控性矩阵: \(\mathcal{C} = [B \quad AB \quad A^2B]\)
对于典型参数,$\text{rank}(\mathcal{C}) = 3$,系统完全可控。
假设只测量位置:$C = [1 \quad 0 \quad 0]$ \(\mathcal{O} = \begin{bmatrix} C \\ CA \\ CA^2 \end{bmatrix}\)
系统完全可观。
步骤1:选择期望极点
步骤2:计算反馈增益 使用Ackermann公式或直接求解得到: \(K = [k_1 \quad k_2 \quad k_3] = [250 \quad 35 \quad 8]\)
步骤3:设计观测器 观测器极点选择:$\lambda_{o1,2} = -30 \pm 10j$,$\lambda_{o3} = -40$
非线性补偿:
实际限制:
数字实现:
Rudolf Emil Kalman(1930-2016)是现代控制理论的奠基人之一。1960年,他发表了两篇革命性论文,建立了状态空间理论框架和卡尔曼滤波器。
主要贡献:
影响:Kalman的工作使控制理论从频域方法转向时域状态空间方法,为处理多变量系统、时变系统和随机系统提供了统一框架。他的理论不仅在控制领域,在信号处理、通信、经济学等领域也有广泛应用。
描述符系统(也称广义状态空间系统或微分代数系统)形式: \(E\dot{x}(t) = Ax(t) + Bu(t)\)
其中 $E$ 可能奇异($\det(E) = 0$)。
应用场景:
关键概念:
奇异摄动系统包含不同时间尺度的动态: \(\begin{align} \dot{x} &= f(x, z, \epsilon) \\ \epsilon\dot{z} &= g(x, z, \epsilon) \end{align}\)
其中 $\epsilon \ll 1$ 是小参数,$x$ 是慢变量,$z$ 是快变量。
边界层理论:
应用实例:
设计方法:
| 概念 | 公式 | 条件 |
|---|---|---|
| 可控性判据 | $\text{rank}(\mathcal{C}) = n$ | 完全可控 |
| 可观性判据 | $\text{rank}(\mathcal{O}) = n$ | 完全可观 |
| 状态反馈 | $u = -Kx + r$ | 闭环稳定 |
| 观测器 | $\dot{\hat{x}} = A\hat{x} + Bu + L(y - C\hat{x})$ | 误差收敛 |
| 分离原理 | $\lambda_{cl} = \lambda(A-BK) \cup \lambda(A-LC)$ | 线性系统 |
习题4.1 考虑系统: \(A = \begin{bmatrix} -1 & 0 \\ 0 & -2 \end{bmatrix}, \quad B = \begin{bmatrix} 1 \\ 1 \end{bmatrix}, \quad C = \begin{bmatrix} 1 & 0 \end{bmatrix}\)
判断系统的可控性和可观性。
习题4.2 对于完全可控的二阶系统,设计状态反馈使闭环极点位于 $-3 \pm 2j$。系统矩阵为: \(A = \begin{bmatrix} 0 & 1 \\ 2 & -1 \end{bmatrix}, \quad B = \begin{bmatrix} 0 \\ 1 \end{bmatrix}\)
习题4.3 设计一个全维观测器,使观测器极点位于 $-10, -12$。系统参数同习题4.2,输出矩阵 $C = [1 \quad 0]$。
习题4.4 考虑双积分系统(如卫星姿态控制): \(\ddot{\theta} = u\)
其中 $\theta$ 是角度,$u$ 是控制力矩。 a) 写出状态空间表示 b) 证明系统完全可控但开环不稳定 c) 设计状态反馈实现临界阻尼响应($\zeta = 1$),自然频率 $\omega_n = 2$ rad/s d) 如果只能测量角度 $\theta$,设计观测器估计角速度
习题4.5 (开放性思考题)磁悬浮列车使用多个电磁铁维持悬浮。讨论以下设计挑战: a) 为什么需要分布式控制而不是集中控制? b) 如何处理轨道不平整造成的扰动? c) 乘客上下车时质量变化如何影响控制设计?
习题4.6 证明对于单输入系统,如果 $(A, b)$ 可控,则对于几乎所有的输出矩阵 $c$(除了测度为零的集合),系统 $(A, b, c)$ 是可观的。这个结果的实际意义是什么?
习题4.7 考虑柔性梁的振动控制,其中包含刚体模态和多个弹性模态。假设只控制和观测前两个模态,分析溢出(spillover)问题: a) 什么是控制溢出和观测溢出? b) 如何在设计中减小溢出影响?
陷阱:可控性/可观性矩阵在高阶系统中条件数很差。
症状:
解决方案:
陷阱:选择过快的闭环极点。
后果:
最佳实践:
陷阱:忽略观测器动态对闭环性能的影响。
表现:
调试技巧:
误解:分离原理在所有情况下都成立。
实际限制:
改进方法:
陷阱:不当的离散化方法破坏系统性质。
问题:
正确做法:
下一章预告:第5章:最优控制理论 将介绍如何系统地设计最优控制器,包括变分法、Pontryagin最大值原理、LQR控制等内容,并通过Apollo登月舱轨迹优化等案例展示最优控制的强大能力。