control_tutorial

第1章：控制系统概述与数学基础

本章概述

控制理论是工程科学的基石之一，它研究如何使动态系统按照期望的方式运行。本章将建立控制系统的基本概念框架，介绍系统建模的核心数学工具，为后续章节打下坚实基础。我们将从最基本的反馈概念出发，逐步深入到传递函数和状态空间等现代分析方法。通过倒立摆这个经典案例，读者将直观理解控制系统设计的挑战与魅力。

1.1 控制系统的基本概念

1.1.1 什么是控制系统

控制系统无处不在。从保持室温恒定的空调，到维持血糖平衡的胰岛素分泌，从SpaceX火箭的精确着陆，到自动驾驶汽车的路径跟踪，控制系统是现代文明的隐形支柱。

从数学角度看，控制系统是一个动态系统，它接收参考信号（期望行为），通过执行器对被控对象施加作用，使系统输出跟踪参考信号。这个过程涉及三个核心要素：

感知（Sensing）：测量系统当前状态
决策（Computing）：计算控制动作
执行（Actuation）：施加控制作用

一个典型的控制系统可以表示为：

参考信号 r(t) → [控制器] → 控制输入 u(t) → [被控对象] → 输出 y(t)
                     ↑                                           ↓
                     ←────────────── 反馈 ←─────────────────────

1.1.2 开环控制与闭环控制

开环控制是最简单的控制形式，控制器根据预设的规则产生控制信号，不考虑系统的实际输出。

优点：

结构简单，成本低
无稳定性问题
响应速度快

缺点：

无法应对扰动
对模型误差敏感
无法保证精度

例子：洗衣机的定时程序、微波炉的加热时间设定。

闭环控制（反馈控制）将系统输出反馈到输入端，形成闭合回路。控制器根据误差 $e(t) = r(t) - y(t)$ 计算控制动作。

优点：

能够抑制扰动
对参数变化具有鲁棒性
可以改善系统性能

缺点：

可能引入不稳定
设计复杂度高
需要传感器测量

例子：巡航控制、恒温器、自动驾驶。

1.1.3 反馈的本质

反馈是控制理论的核心概念。负反馈能够：

降低灵敏度：设开环传递函数为 $G(s)$，反馈增益为 $H(s)$，则闭环传递函数为： $T(s) = \frac{G(s)}{1 + G(s)H(s)}$ 当 $|G(s)H(s)| \gg 1$ 时，$T(s) \approx \frac{1}{H(s)}$，系统特性主要由反馈决定。
扩展带宽：反馈可以增加系统的工作频率范围。
线性化非线性系统：在高增益反馈下，非线性可以被”包裹”在反馈回路中。
创造新的动态特性：通过反馈可以改变系统的极点位置，实现期望的动态响应。

然而，反馈也带来挑战：

稳定性问题：不当的反馈可能导致系统振荡或发散
噪声放大：测量噪声会通过反馈回路传播
执行器饱和：过大的控制信号可能超出执行器能力

1.1.4 控制系统的性能指标

评价控制系统性能的关键指标包括：

时域指标：

上升时间（$t_r$）：输出从10%上升到90%所需时间
峰值时间（$t_p$）：达到第一个峰值的时间
超调量（$M_p$）：$M_p = \frac{y_{max} - y_{ss}}{y_{ss}} \times 100\%$
调节时间（$t_s$）：进入并保持在稳态值±2%或±5%范围内的时间
稳态误差（$e_{ss}$）：$e_{ss} = \lim_{t \to \infty} e(t)$

频域指标：

带宽（BW）：幅值下降3dB对应的频率
相位裕度（PM）：系统距离不稳定的相位余量
增益裕度（GM）：系统距离不稳定的增益余量
谐振峰值（$M_r$）：频率响应的最大幅值

综合指标：

ISE（积分平方误差）：$\text{ISE} = \int_0^\infty e^2(t) dt$
IAE（积分绝对误差）：$\text{IAE} = \int_0^\infty e(t) dt$
ITAE（时间加权绝对误差）：$\text{ITAE} = \int_0^\infty t e(t) dt$

这些指标之间存在固有的权衡关系。例如，减小上升时间通常会增加超调量；提高鲁棒性往往以牺牲性能为代价。优秀的控制系统设计就是在这些相互冲突的目标之间找到最佳平衡点。

1.2 动态系统建模

1.2.1 物理系统的数学描述

控制系统设计的第一步是建立被控对象的数学模型。模型是现实的抽象，它捕捉系统的本质特征，同时忽略次要细节。George Box的名言”所有模型都是错的，但有些是有用的”深刻揭示了建模的本质。

物理系统的数学描述通常基于基本物理定律：

机械系统：牛顿第二定律 $F = ma = m\frac{d^2x}{dt^2}$

电气系统：基尔霍夫定律

KVL：$\sum V = 0$（回路电压和为零）
KCL：$\sum I = 0$（节点电流和为零）

流体系统：质量守恒与动量守恒 $\frac{\partial \rho}{\partial t} + \nabla \cdot (\rho \mathbf{v}) = 0$

热力系统：能量守恒 $mc_p\frac{dT}{dt} = Q_{in} - Q_{out}$

这些基本定律为不同领域的系统建模提供了统一的框架。有趣的是，不同物理域的系统常常具有相似的数学形式，这种”同构性”使得控制理论具有广泛的适用性。

1.2.2 微分方程建模

大多数物理系统可以用常微分方程（ODE）描述。考虑一个质量-弹簧-阻尼系统：

     k (弹簧)
     ╱╲╱╲╱╲
    ┌───┐
    │ m │  → F(t) 外力
    └───┘
     |||  b (阻尼器)
    ═════

根据牛顿第二定律： $m\ddot{x} + b\dot{x} + kx = F(t)$

其中：

$m$：质量
$b$：阻尼系数
$k$：弹簧刚度
$F(t)$：外部作用力

这是一个二阶线性常系数微分方程，它描述了系统位移 $x(t)$ 对外力 $F(t)$ 的响应。

电路系统示例：RLC电路

    R        L
 ───╱╲╱╲───────🌀────
│                    │
○ V(t)              ═ C
│                    │
 ────────────────────

应用KVL： $L\frac{di}{dt} + Ri + \frac{1}{C}\int i \, dt = V(t)$

或用电荷 $q$ 表示（$i = \dot{q}$）： $L\ddot{q} + R\dot{q} + \frac{q}{C} = V(t)$

注意机械系统和电路系统的数学形式完全相同！这种类比关系：

位移 $x$ ↔ 电荷 $q$
速度 $\dot{x}$ ↔ 电流 $i$
质量 $m$ ↔ 电感 $L$
阻尼 $b$ ↔ 电阻 $R$
刚度 $1/k$ ↔ 电容 $C$

1.2.3 能量方法与拉格朗日方程

对于复杂的多自由度系统，直接应用牛顿定律可能非常繁琐。拉格朗日方法提供了一种系统化的建模途径。

拉格朗日函数定义为： $L = T - V$

其中 $T$ 是动能，$V$ 是势能。

拉格朗日方程： $\frac{d}{dt}\left(\frac{\partial L}{\partial \dot{q}_i}\right) - \frac{\partial L}{\partial q_i} = Q_i$

其中 $q_i$ 是广义坐标，$Q_i$ 是广义力。

示例：双摆系统

考虑平面内的双摆：

        O (固定点)
        |
        | l₁
        |
        ● m₁
       /
      / l₂
     /
    ● m₂

选择角度 $\theta_1, \theta_2$ 作为广义坐标。

动能： $T = \frac{1}{2}m_1l_1^2\dot{\theta}_1^2 + \frac{1}{2}m_2[l_1^2\dot{\theta}_1^2 + l_2^2\dot{\theta}_2^2 + 2l_1l_2\dot{\theta}_1\dot{\theta}_2\cos(\theta_1-\theta_2)]$

势能： $V = -m_1gl_1\cos\theta_1 - m_2g(l_1\cos\theta_1 + l_2\cos\theta_2)$

应用拉格朗日方程可得到两个耦合的非线性微分方程。这种方法的优势在于：

自动消除约束力
利用系统的对称性
便于处理复杂的多体系统

1.2.4 建模假设与简化

实际建模中，合理的简化至关重要。常见的建模假设包括：

线性化假设：

小信号假设：$\sin\theta \approx \theta$, $\cos\theta \approx 1$
忽略高阶项：$(x + \Delta x)^2 \approx x^2 + 2x\Delta x$

集总参数假设：

将分布参数系统近似为集总参数
例如：将长传输线近似为若干LC单元的级联

时间尺度分离：

快变量和慢变量的分离
奇异摄动理论的基础

忽略次要效应：

摩擦、风阻等在某些情况下可忽略
但在精密控制中可能成为关键因素

建模的迭代过程：

初始模型：基于第一性原理建立
参数辨识：通过实验确定模型参数
模型验证：将模型预测与实际数据对比
模型修正：根据验证结果调整模型复杂度

记住：模型的复杂度应该与控制目标相匹配。过于简单的模型可能无法捕捉关键动态，而过于复杂的模型则增加设计难度且可能引入不必要的不确定性。

1.3 拉普拉斯变换与传递函数

1.3.1 拉普拉斯变换基础

拉普拉斯变换是控制理论的核心数学工具，它将微分方程转化为代数方程，极大简化了系统分析。

定义： $\mathcal{L}\{f(t)\} = F(s) = \int_0^\infty f(t)e^{-st}dt$

其中 $s = \sigma + j\omega$ 是复变量。

关键性质：

线性性：$\mathcal{L}{af(t) + bg(t)} = aF(s) + bG(s)$
微分性质： $\mathcal{L}\{\dot{f}(t)\} = sF(s) - f(0^-)$ $\mathcal{L}\{\ddot{f}(t)\} = s^2F(s) - sf(0^-) - \dot{f}(0^-)$
积分性质： $\mathcal{L}\left\{\int_0^t f(\tau)d\tau\right\} = \frac{F(s)}{s}$
时移性质：$\mathcal{L}{f(t-T)u(t-T)} = e^{-sT}F(s)$
终值定理： $\lim_{t \to \infty} f(t) = \lim_{s \to 0} sF(s)$ （前提：$sF(s)$ 的极点都在左半平面）

常用拉普拉斯变换对：

时域 $f(t)$	频域 $F(s)$
$\delta(t)$	$1$
$u(t)$	$\frac{1}{s}$
$t$	$\frac{1}{s^2}$
$e^{-at}$	$\frac{1}{s+a}$
$\sin(\omega t)$	$\frac{\omega}{s^2+\omega^2}$
$\cos(\omega t)$	$\frac{s}{s^2+\omega^2}$
$e^{-at}\sin(\omega t)$	$\frac{\omega}{(s+a)^2+\omega^2}$

1.3.2 传递函数的定义与意义

传递函数是线性时不变（LTI）系统的频域表示，定义为零初始条件下，输出的拉普拉斯变换与输入的拉普拉斯变换之比：

\[G(s) = \frac{Y(s)}{U(s)}\]

从微分方程到传递函数：

考虑 n 阶微分方程： $a_n\frac{d^ny}{dt^n} + a_{n-1}\frac{d^{n-1}y}{dt^{n-1}} + \cdots + a_0y = b_m\frac{d^mu}{dt^m} + \cdots + b_0u$

取拉普拉斯变换（零初始条件）： $G(s) = \frac{Y(s)}{U(s)} = \frac{b_ms^m + b_{m-1}s^{m-1} + \cdots + b_0}{a_ns^n + a_{n-1}s^{n-1} + \cdots + a_0}$

传递函数的物理意义：

描述系统的输入-输出关系
包含系统的所有动态信息（在线性假设下）
不依赖于具体的输入信号
完全由系统参数决定

标准形式：

零极点形式： $G(s) = K\frac{(s-z_1)(s-z_2)\cdots(s-z_m)}{(s-p_1)(s-p_2)\cdots(s-p_n)}$

时间常数形式： $G(s) = K'\frac{(\tau_1s+1)(\tau_2s+1)\cdots}{(T_1s+1)(T_2s+1)\cdots}$

1.3.3 系统的极点与零点

极点和零点决定了系统的动态特性。

极点（使分母为零的 s 值）：

决定系统的稳定性
决定瞬态响应的模式
实极点：指数响应
复共轭极点：振荡响应

零点（使分子为零的 s 值）：

影响响应的幅值和相位
可能导致响应中某些模式的消失
右半平面零点（非最小相位）会限制系统性能

极点位置与时域响应：

     Im
      ↑
   ×  |  ×     振荡发散
      |
 ─────┼───── Re
      |
   ×  |  ×     振荡衰减
      ↓

左半平面极点 → 稳定响应
虚轴上极点 → 临界稳定
右半平面极点 → 不稳定响应

主导极点：离虚轴最近的极点对响应影响最大，称为主导极点。其他极点的影响可近似忽略，这是降阶的理论基础。

1.3.4 方框图与信号流图

方框图是系统互联的图形表示，便于理解和分析复杂系统。

基本元素：

方框：表示传递函数
```
U(s) →[G(s)]→ Y(s)
```

求和点：

R(s) →⊕← E(s) = R(s) - Y(s)
     ↑
    Y(s)

分支点：信号分流

基本连接：

串联：$G_{总}(s) = G_1(s) \cdot G_2(s)$

并联：$G_{总}(s) = G_1(s) + G_2(s)$

反馈： $G_{闭环}(s) = \frac{G(s)}{1 \pm G(s)H(s)}$ （”+”表示负反馈，”-“表示正反馈）

Mason增益公式：

对于复杂的信号流图，Mason公式提供了系统化的求解方法：

\[G(s) = \frac{\sum_k P_k \Delta_k}{\Delta}\]

其中：

$P_k$：第 k 条前向通路的增益
$\Delta$：特征式 = $1 - \sum L_i + \sum L_iL_j - \cdots$
$L_i$：回路增益
$\Delta_k$：去掉与第 k 条前向通路相接触的回路后的余子式

1.4 状态空间表示

1.4.1 状态的概念

状态空间方法是现代控制理论的基石，它提供了一种统一的框架来处理多输入多输出（MIMO）系统、时变系统和非线性系统。与传递函数方法相比，状态空间方法保留了系统的内部结构信息，这对于理解和设计复杂控制系统至关重要。

状态的定义：系统的状态是一组最小的变量集合，如果知道 $t_0$ 时刻的状态和 $t \geq t_0$ 的输入，就能完全确定系统在任意时刻 $t \geq t_0$ 的行为。

状态具有以下特性：

完备性：包含预测未来所需的全部信息
最小性：不包含冗余信息
可测性：可能直接测量或通过观测器重构

状态变量的选择：状态变量的选择不唯一，常见的选择包括：

物理变量：位置、速度、电流、电压等
能量变量：动能、势能、磁能、电能等
相变量：输出及其各阶导数
模态变量：对应于系统各个模态的坐标

例如，对于机械系统，自然选择位置和速度作为状态变量；对于电路系统，选择电容电压和电感电流。

1.4.2 状态方程的标准形式

线性时不变系统的状态空间描述由两个方程组成：

状态方程（描述状态的演化）： $\dot{\mathbf{x}}(t) = \mathbf{A}\mathbf{x}(t) + \mathbf{B}\mathbf{u}(t)$

输出方程（描述输出与状态的关系）： $\mathbf{y}(t) = \mathbf{C}\mathbf{x}(t) + \mathbf{D}\mathbf{u}(t)$

其中：

$\mathbf{x} \in \mathbb{R}^n$：状态向量
$\mathbf{u} \in \mathbb{R}^m$：输入向量
$\mathbf{y} \in \mathbb{R}^p$：输出向量
$\mathbf{A} \in \mathbb{R}^{n \times n}$：系统矩阵，决定系统的动态特性
$\mathbf{B} \in \mathbb{R}^{n \times m}$：输入矩阵，描述输入如何影响状态
$\mathbf{C} \in \mathbb{R}^{p \times n}$：输出矩阵，描述状态如何映射到输出
$\mathbf{D} \in \mathbb{R}^{p \times m}$：直通矩阵，通常为零

物理系统示例：双积分器（如位置控制系统） $\ddot{y} = u$

选择状态变量 $x_1 = y$, $x_2 = \dot{y}$： $\begin{bmatrix} \dot{x}_1 \\ \dot{x}_2 \end{bmatrix} = \begin{bmatrix} 0 & 1 \\ 0 & 0 \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \end{bmatrix} + \begin{bmatrix} 0 \\ 1 \end{bmatrix} u$

\[y = \begin{bmatrix} 1 & 0 \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \end{bmatrix}\]

状态转移矩阵：状态方程的解为： $\mathbf{x}(t) = e^{\mathbf{A}t}\mathbf{x}(0) + \int_0^t e^{\mathbf{A}(t-\tau)}\mathbf{B}\mathbf{u}(\tau)d\tau$

其中 $\mathbf{\Phi}(t) = e^{\mathbf{A}t}$ 是状态转移矩阵，计算方法包括：

级数展开：$e^{\mathbf{A}t} = \mathbf{I} + \mathbf{A}t + \frac{\mathbf{A}^2t^2}{2!} + \cdots$
对角化：若 $\mathbf{A} = \mathbf{T}\mathbf{\Lambda}\mathbf{T}^{-1}$，则 $e^{\mathbf{A}t} = \mathbf{T}e^{\mathbf{\Lambda}t}\mathbf{T}^{-1}$
拉普拉斯变换：$\mathbf{\Phi}(t) = \mathcal{L}^{-1}{(s\mathbf{I} - \mathbf{A})^{-1}}$

1.4.3 从传递函数到状态空间

将传递函数转换为状态空间表示有多种标准形式，每种形式在不同应用场景下有其优势。

可控标准形（Controller Canonical Form）：对于传递函数： $G(s) = \frac{b_ms^m + b_{m-1}s^{m-1} + \cdots + b_0}{s^n + a_{n-1}s^{n-1} + \cdots + a_0}$

（假设 $m < n$）

状态空间实现： $\mathbf{A} = \begin{bmatrix} 0 & 1 & 0 & \cdots & 0 \\ 0 & 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & 1 \\ -a_0 & -a_1 & -a_2 & \cdots & -a_{n-1} \end{bmatrix}, \quad \mathbf{B} = \begin{bmatrix} 0 \\ 0 \\ \vdots \\ 0 \\ 1 \end{bmatrix}$

\[\mathbf{C} = \begin{bmatrix} b_0 & b_1 & \cdots & b_{m} & 0 & \cdots & 0 \end{bmatrix}, \quad \mathbf{D} = 0\]

可观标准形（Observer Canonical Form）： $\mathbf{A} = \begin{bmatrix} 0 & 0 & \cdots & 0 & -a_0 \\ 1 & 0 & \cdots & 0 & -a_1 \\ 0 & 1 & \cdots & 0 & -a_2 \\ \vdots & \vdots & \ddots & \vdots & \vdots \\ 0 & 0 & \cdots & 1 & -a_{n-1} \end{bmatrix}, \quad \mathbf{B} = \begin{bmatrix} b_0 \\ b_1 \\ \vdots \\ b_{m} \\ 0 \\ \vdots \\ 0 \end{bmatrix}$

\[\mathbf{C} = \begin{bmatrix} 0 & 0 & \cdots & 0 & 1 \end{bmatrix}, \quad \mathbf{D} = 0\]

对角标准形（适用于无重根情况）：若传递函数可分解为部分分式： $G(s) = \sum_{i=1}^n \frac{r_i}{s - p_i}$

则： $\mathbf{A} = \begin{bmatrix} p_1 & 0 & \cdots & 0 \\ 0 & p_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & p_n \end{bmatrix}, \quad \mathbf{B} = \begin{bmatrix} 1 \\ 1 \\ \vdots \\ 1 \end{bmatrix}$

\[\mathbf{C} = \begin{bmatrix} r_1 & r_2 & \cdots & r_n \end{bmatrix}, \quad \mathbf{D} = 0\]

1.4.4 状态空间的规范形式

Jordan标准形：当系统矩阵有重复特征值时，Jordan标准形提供了最简洁的表示：

\[\mathbf{A}_J = \begin{bmatrix} \mathbf{J}_1 & & & \\ & \mathbf{J}_2 & & \\ & & \ddots & \\ & & & \mathbf{J}_k \end{bmatrix}\]

其中每个Jordan块： $\mathbf{J}_i = \begin{bmatrix} \lambda_i & 1 & 0 & \cdots & 0 \\ 0 & \lambda_i & 1 & \cdots & 0 \\ \vdots & \vdots & \ddots & \ddots & \vdots \\ 0 & 0 & \cdots & \lambda_i & 1 \\ 0 & 0 & \cdots & 0 & \lambda_i \end{bmatrix}$

状态空间与传递函数的关系：从状态空间到传递函数： $\mathbf{G}(s) = \mathbf{C}(s\mathbf{I} - \mathbf{A})^{-1}\mathbf{B} + \mathbf{D}$

这个公式揭示了重要事实：

传递函数的极点是 $\mathbf{A}$ 的特征值
传递函数的零点由 $\mathbf{A}$, $\mathbf{B}$, $\mathbf{C}$ 共同决定
可能存在极零相消，导致传递函数阶次低于状态空间维数

最小实现：给定传递函数的状态空间实现称为最小实现，当且仅当：

系统完全可控
系统完全可观

最小实现的维数等于传递函数的McMillan度（分母多项式的次数）。

坐标变换：状态空间表示不唯一，通过坐标变换 $\mathbf{z} = \mathbf{T}\mathbf{x}$ 可得到新的表示： $\bar{\mathbf{A}} = \mathbf{T}\mathbf{A}\mathbf{T}^{-1}, \quad \bar{\mathbf{B}} = \mathbf{T}\mathbf{B}, \quad \bar{\mathbf{C}} = \mathbf{C}\mathbf{T}^{-1}, \quad \bar{\mathbf{D}} = \mathbf{D}$

坐标变换不改变系统的输入输出特性（传递函数不变），但可能简化分析和设计。常用的变换目标包括：

对角化（解耦系统模态）
可控/可观标准形（便于控制器/观测器设计）
平衡实现（数值稳定性）

1.5 线性化技术

1.5.1 非线性系统的挑战

现实世界本质上是非线性的。从飞机的空气动力学到化学反应动力学，从神经元的动作电位到股票市场的价格波动，非线性无处不在。然而，非线性系统的分析和控制面临巨大挑战：

非线性系统的复杂性：

叠加原理失效：输入的线性组合不等于输出的线性组合
多平衡点：可能存在多个稳定或不稳定的平衡点
极限环：即使没有外部激励也可能产生持续振荡
混沌行为：对初始条件极度敏感，长期行为不可预测
分岔现象：参数微小变化可能导致定性行为突变

常见的非线性特性：

饱和：执行器限幅，如阀门开度0-100%
死区：小信号不响应，如齿轮间隙
迟滞：输入输出关系依赖历史，如磁滞回线
库仑摩擦：速度符号改变时的不连续性
继电特性：开关型非线性

为什么需要线性化：尽管非线性系统理论（如Lyapunov方法、描述函数法）取得了重要进展，线性系统理论仍然是最完善、最实用的工具。线性化允许我们：

应用成熟的线性控制设计方法
获得解析解和频域分析工具
保证局部性能和稳定性
简化计算复杂度

1.5.2 泰勒级数展开与小信号分析

线性化的数学基础是泰勒级数展开。对于非线性系统： $\dot{\mathbf{x}} = \mathbf{f}(\mathbf{x}, \mathbf{u})$ $\mathbf{y} = \mathbf{h}(\mathbf{x}, \mathbf{u})$

平衡点的确定：首先找到平衡点 $(\mathbf{x}_0, \mathbf{u}_0)$，满足： $\mathbf{f}(\mathbf{x}_0, \mathbf{u}_0) = \mathbf{0}$

泰勒展开：在平衡点附近展开： $\mathbf{f}(\mathbf{x}, \mathbf{u}) = \mathbf{f}(\mathbf{x}_0, \mathbf{u}_0) + \frac{\partial \mathbf{f}}{\partial \mathbf{x}}\bigg|_{(\mathbf{x}_0, \mathbf{u}_0)} \Delta\mathbf{x} + \frac{\partial \mathbf{f}}{\partial \mathbf{u}}\bigg|_{(\mathbf{x}_0, \mathbf{u}_0)} \Delta\mathbf{u} + \text{H.O.T.}$

其中 $\Delta\mathbf{x} = \mathbf{x} - \mathbf{x}_0$，$\Delta\mathbf{u} = \mathbf{u} - \mathbf{u}_0$。

忽略高阶项（H.O.T.），得到线性化系统： $\Delta\dot{\mathbf{x}} = \mathbf{A}\Delta\mathbf{x} + \mathbf{B}\Delta\mathbf{u}$ $\Delta\mathbf{y} = \mathbf{C}\Delta\mathbf{x} + \mathbf{D}\Delta\mathbf{u}$

其中Jacobian矩阵： $\mathbf{A} = \frac{\partial \mathbf{f}}{\partial \mathbf{x}}\bigg|_{(\mathbf{x}_0, \mathbf{u}_0)}, \quad \mathbf{B} = \frac{\partial \mathbf{f}}{\partial \mathbf{u}}\bigg|_{(\mathbf{x}_0, \mathbf{u}_0)}$ $\mathbf{C} = \frac{\partial \mathbf{h}}{\partial \mathbf{x}}\bigg|_{(\mathbf{x}_0, \mathbf{u}_0)}, \quad \mathbf{D} = \frac{\partial \mathbf{h}}{\partial \mathbf{u}}\bigg|_{(\mathbf{x}_0, \mathbf{u}_0)}$

实例：Van der Pol振荡器 $\ddot{x} - \mu(1-x^2)\dot{x} + x = 0$

改写为状态方程（$x_1 = x$, $x_2 = \dot{x}$）： $\dot{x}_1 = x_2$ $\dot{x}_2 = \mu(1-x_1^2)x_2 - x_1$

在原点 $(0, 0)$ 处线性化： $\mathbf{A} = \begin{bmatrix} 0 & 1 \\ -1 & \mu \end{bmatrix}$

当 $\mu > 0$ 时，原点不稳定（特征值有正实部），系统会产生极限环。

1.5.3 工作点的选择

工作点（平衡点）的选择对线性化模型的有效性至关重要。不同的工作点可能导致完全不同的线性模型。

工作点选择原则：

物理意义：选择有实际意义的工作状态
- 巡航飞行的配平状态
- 化学反应器的稳态操作点
- 机器人的直立位置
稳定性考虑：优先选择稳定的平衡点
- 检查线性化矩阵 $\mathbf{A}$ 的特征值
- 所有特征值实部为负 → 局部渐近稳定
性能要求：选择满足性能指标的工作点
- 能耗最小的操作点
- 产率最大的反应条件
- 舒适性最佳的飞行状态

多工作点策略：对于工作范围大的系统，单一线性模型可能不够，需要：

增益调度（Gain Scheduling）：
- 在不同工作点建立多个线性模型
- 根据当前状态切换或插值控制器参数
- 例如：飞机在不同高度和速度的控制律
线性参变（LPV）系统：
- 将非线性系统表示为参数依赖的线性系统
- 参数可测量或估计
- 系统化的分析和设计方法

实例：倒立摆的两个平衡点

倒立摆有两个平衡点：

下垂位置（$\theta = 0$）：稳定但无趣
直立位置（$\theta = \pi$）：不稳定但是控制目标

在直立位置线性化得到： $\mathbf{A} = \begin{bmatrix} 0 & 1 & 0 & 0 \\ \frac{(M+m)g}{Ml} & 0 & 0 & 0 \\ 0 & 0 & 0 & 1 \\ \frac{mg}{M} & 0 & 0 & 0 \end{bmatrix}$

这个线性模型用于设计稳定控制器。

1.5.4 线性化的有效范围

线性化模型只在平衡点附近有效，理解其有效范围对控制系统设计至关重要。

有效性的数学刻画：

根据Lyapunov第一法（间接法）：

如果线性化系统的所有特征值实部为负，则非线性系统在平衡点局部渐近稳定
如果至少有一个特征值实部为正，则非线性系统在平衡点不稳定
如果有零实部特征值，线性化不能判断稳定性（临界情况）

吸引域估计：线性化有效的区域称为吸引域（Region of Attraction, ROA）。估计方法包括：

Lyapunov函数法：找到 $V(\mathbf{x})$ 使得 $\dot{V} < 0$，则 $V(\mathbf{x}) \leq c$ 定义的区域在吸引域内
仿真法：从不同初始条件仿真，观察收敛行为
SOS（Sum of Squares）优化：系统化的计算方法，可得到吸引域的多项式近似

线性化失效的情况：

大信号扰动：
- 饱和效应显著
- 超出小信号假设范围
分岔点附近：
- 参数接近临界值
- 系统行为质变
强非线性区域：
- 接近其他平衡点
- 进入极限环

改进线性化精度的方法：

反馈线性化：通过非线性反馈实现精确线性化（不是近似）
扩展线性化：保留部分二阶项，提高精度
分段线性化：不同区域使用不同的线性模型

实践指南：

验证线性模型：
- 对比线性和非线性模型的阶跃响应
- 检查不同幅值输入的响应
保守设计：
- 留有足够的稳定裕度
- 考虑最坏情况
非线性补偿：
- 抗积分饱和（Anti-windup）
- 增益调度
- 自适应控制
监控与保护：
- 实时监测系统状态
- 越界时切换到安全模式

记住：所有模型都是近似，但线性化提供了强大的分析和设计工具。关键是理解其局限性并采取适当的补偿措施。

案例研究：倒立摆系统建模

倒立摆是控制理论教学中的经典案例，它简单yet富有挑战性，完美展示了不稳定系统的控制问题。从Segway平衡车到火箭姿态控制，倒立摆的原理无处不在。

系统描述

考虑一个小车-倒立摆系统：

小车质量：$M$
摆杆质量：$m$
摆杆长度：$2l$（质心距转轴距离为 $l$）
摆杆角度：$\theta$（垂直向上为0）
小车位置：$x$
控制力：$F$（作用于小车）

        ↑ θ
        |/
        ●  m
        |
     ===□===  M
    ────┴──── → x
       F→

动力学建模

方法1：牛顿-欧拉法

小车的水平运动： $M\ddot{x} = F - N$

其中 $N$ 是摆杆对小车的水平作用力。

摆杆质心的水平加速度： $m\frac{d^2}{dt^2}(x + l\sin\theta) = N$

展开得： $m(\ddot{x} + l\ddot{\theta}\cos\theta - l\dot{\theta}^2\sin\theta) = N$

摆杆的转动方程（对质心）： $I\ddot{\theta} = -Nl\cos\theta - Pl\sin\theta$

其中 $I = \frac{ml^2}{3}$ 是摆杆相对质心的转动惯量，$P = mg$ 是重力。

方法2：拉格朗日法

系统动能： $T = \frac{1}{2}M\dot{x}^2 + \frac{1}{2}m[(\dot{x} + l\dot{\theta}\cos\theta)^2 + (l\dot{\theta}\sin\theta)^2] + \frac{1}{2}I\dot{\theta}^2$

简化后： $T = \frac{1}{2}(M+m)\dot{x}^2 + ml\dot{x}\dot{\theta}\cos\theta + \frac{1}{2}(ml^2 + I)\dot{\theta}^2$

势能： $V = mgl\cos\theta$

拉格朗日函数： $L = T - V$

应用拉格朗日方程得到两个耦合的非线性微分方程： $(M+m)\ddot{x} + ml\ddot{\theta}\cos\theta - ml\dot{\theta}^2\sin\theta = F$ $ml\ddot{x}\cos\theta + (ml^2 + I)\ddot{\theta} - mgl\sin\theta = 0$

线性化

在直立位置（$\theta = 0$, $\dot{\theta} = 0$）附近线性化。假设 $\theta$ 很小：

$\sin\theta \approx \theta$
$\cos\theta \approx 1$
$\dot{\theta}^2 \approx 0$

线性化方程： $(M+m)\ddot{x} + ml\ddot{\theta} = F$ $ml\ddot{x} + (ml^2 + I)\ddot{\theta} - mgl\theta = 0$

状态空间表示

选择状态变量： $\mathbf{x} = \begin{bmatrix} x \\ \dot{x} \\ \theta \\ \dot{\theta} \end{bmatrix}$

经过代数运算，得到状态方程： $\dot{\mathbf{x}} = \begin{bmatrix} 0 & 1 & 0 & 0 \\ 0 & 0 & \frac{-m^2gl^2}{D} & 0 \\ 0 & 0 & 0 & 1 \\ 0 & 0 & \frac{mgl(M+m)}{D} & 0 \end{bmatrix} \mathbf{x} + \begin{bmatrix} 0 \\ \frac{ml^2 + I}{D} \\ 0 \\ \frac{-ml}{D} \end{bmatrix} F$

其中 $D = (M+m)(ml^2 + I) - m^2l^2$。

如果忽略摆杆转动惯量（$I = 0$），简化为： $\mathbf{A} = \begin{bmatrix} 0 & 1 & 0 & 0 \\ 0 & 0 & \frac{-mg}{M} & 0 \\ 0 & 0 & 0 & 1 \\ 0 & 0 & \frac{(M+m)g}{Ml} & 0 \end{bmatrix}, \quad \mathbf{B} = \begin{bmatrix} 0 \\ \frac{1}{M} \\ 0 \\ \frac{-1}{Ml} \end{bmatrix}$

系统特性分析

特征值：系统矩阵 $\mathbf{A}$ 的特征值为： $\lambda_{1,2} = 0, \quad \lambda_{3,4} = \pm\sqrt{\frac{(M+m)g}{Ml}}$

一个正实特征值 → 系统不稳定
零特征值 → 小车位置不受约束

可控性：可控性矩阵： $\mathbf{P} = [\mathbf{B} \quad \mathbf{AB} \quad \mathbf{A}^2\mathbf{B} \quad \mathbf{A}^3\mathbf{B}]$

计算得 $\text{rank}(\mathbf{P}) = 4$，系统完全可控。

物理解释：

通过控制小车加速度可以产生惯性力
惯性力在摆杆质心产生力矩
力矩可以控制摆杆角度
系统虽然不稳定但完全可控

控制设计考虑

状态反馈：设计增益矩阵 $\mathbf{K}$ 使闭环极点在左半平面
观测器：如果只能测量位置和角度，需要估计速度
约束处理：
- 轨道长度限制
- 执行器饱和
- 角度限制（线性化范围）

扩展与变体

双倒立摆：两节摆杆，更高维度，更具挑战性
旋转倒立摆：Furuta摆，水平旋转臂带动垂直摆杆
柔性倒立摆：考虑摆杆弹性，引入分布参数
3D倒立摆：球面倒立摆，两个自由度

实际应用

火箭控制：垂直起降火箭本质上是倒立摆
人形机器人：站立和行走的平衡控制
Segway：两轮自平衡车
建筑减震：调谐质量阻尼器的摆动控制

历史人物：James Watt与自动控制的开端

James Watt（1736-1819）不仅改进了蒸汽机，更重要的是发明了离心调速器（1788年），这标志着自动控制的诞生。

离心调速器原理

离心调速器通过机械反馈实现转速控制：

两个飞球通过连杆与旋转轴连接
转速增加 → 离心力增大 → 飞球上升
飞球上升 → 节流阀关小 → 蒸汽减少
蒸汽减少 → 转速降低 → 达到平衡

这是一个纯机械的比例控制器，体现了负反馈的核心思想。

数学模型

现代控制理论可以精确描述调速器： $J\ddot{\theta} + b\dot{\theta} = T_s - T_l$

其中：

$J$：转动惯量
$b$：阻尼系数
$T_s$：蒸汽力矩（受飞球位置控制）
$T_l$：负载力矩

飞球位置与转速关系： $h = k\omega^2$

节流阀开度与飞球位置关系： $T_s = T_0 - K_ph$

组合得到闭环系统的自调节特性。

历史影响

工业革命推动：稳定的动力输出使大规模工业生产成为可能
理论发展：Maxwell（1868）首次对调速器进行数学分析
稳定性问题：早期调速器常出现”hunting”（振荡）现象
现代启示：简单的反馈机制可以实现复杂的控制目标

Watt的其他贡献

功率单位：马力（HP）的定义者
平行运动机构：将旋转运动转换为直线运动
压力指示器：早期的数据采集系统

Watt的工作启示我们：伟大的工程创新往往源于对基本原理的深刻理解和巧妙应用。

前沿专题：分数阶微积分在控制中的应用

分数阶微积分将微分和积分的阶次从整数推广到实数甚至复数，为控制系统建模和设计提供了新的自由度。

基本概念

分数阶微积分定义（Riemann-Liouville）： $_aD_t^\alpha f(t) = \frac{1}{\Gamma(n-\alpha)}\frac{d^n}{dt^n}\int_a^t \frac{f(\tau)}{(t-\tau)^{\alpha-n+1}}d\tau$

其中 $n-1 < \alpha < n$，$\Gamma$ 是伽马函数。

拉普拉斯变换： $\mathcal{L}\{_0D_t^\alpha f(t)\} = s^\alpha F(s) - \sum_{k=0}^{n-1} s^{k} \cdot _0D_t^{\alpha-k-1}f(0^+)$

零初始条件下简化为： $\mathcal{L}\{_0D_t^\alpha f(t)\} = s^\alpha F(s)$

分数阶系统建模

许多实际系统展现分数阶特性：

电化学系统：电池、超级电容的阻抗 $Z(s) = R + \frac{1}{Cs^\alpha}, \quad 0 < \alpha < 1$
粘弹性材料：应力-应变关系 $\sigma(t) = E \cdot _0D_t^\alpha \epsilon(t)$
热扩散：半无限介质中的温度分布 $\frac{\partial T}{\partial t} = \kappa \cdot _0D_x^{1.5} T$

分数阶PID控制器（PIᵅDᵝ）

传统PID的推广： $u(t) = K_p e(t) + K_i \cdot _0D_t^{-\lambda} e(t) + K_d \cdot _0D_t^{\mu} e(t)$

其中 $0 < \lambda, \mu < 1$。

传递函数： $C(s) = K_p + \frac{K_i}{s^\lambda} + K_d s^\mu$

优势：

两个额外的调节参数（$\lambda$, $\mu$）
更灵活的频率响应整形
对系统参数变化更鲁棒

分数阶系统稳定性

稳定性判据：分数阶系统 $D(s) = \sum_{k=0}^n a_k s^{\alpha_k} = 0$ 稳定的充要条件： $|\arg(s_i)| > \frac{\alpha\pi}{2}$

其中 $\alpha$ 是所有阶次的最小公倍数的倒数。

实现方法

Oustaloup近似：在频率范围 $[\omega_l, \omega_h]$ 内用有理传递函数近似 $s^\alpha$： $s^\alpha \approx K \prod_{k=-N}^{N} \frac{s + \omega_k'}{s + \omega_k}$
数值方法：
- Grünwald-Letnikov差分
- 预测-校正算法

应用案例

锂电池管理：分数阶模型更准确描述电池动态
机器人柔性关节：分数阶阻尼模型
经济系统：长记忆过程建模

挑战与展望

物理解释：分数阶导数的物理意义仍在探索
计算复杂度：需要存储历史信息
参数辨识：阶次和系数的同时估计

分数阶控制代表了控制理论的前沿方向，它打破了整数阶的限制，为复杂系统的建模和控制提供了新工具。

本章小结

本章奠定了控制理论学习的数学基础。我们从控制系统的基本概念出发，深入探讨了系统建模的各种方法，掌握了从物理系统到数学模型的转换技巧。

关键要点：

控制系统本质：反馈是控制的核心，它能改善系统性能但也可能引入不稳定
建模方法：
- 微分方程：时域描述，直观但分析困难
- 传递函数：频域描述，便于分析但限于LTI系统
- 状态空间：现代方法，适用范围广，保留内部信息
线性化技术：将非线性问题转化为线性问题的桥梁，理解其局限性至关重要
数学工具：拉普拉斯变换是连接时域和频域的纽带

核心公式回顾：

闭环传递函数：$T(s) = \frac{G(s)}{1 + G(s)H(s)}$
状态方程：$\dot{\mathbf{x}} = \mathbf{A}\mathbf{x} + \mathbf{B}\mathbf{u}$
传递函数与状态空间：$G(s) = \mathbf{C}(s\mathbf{I} - \mathbf{A})^{-1}\mathbf{B} + \mathbf{D}$
线性化：$\mathbf{A} = \frac{\partial \mathbf{f}}{\partial \mathbf{x}}\bigg _{(\mathbf{x}_0, \mathbf{u}_0)}$

掌握这些基础概念和工具，为深入学习后续章节的系统分析、控制器设计和高级控制方法打下了坚实基础。