video_codec_tutorial

第九章：码率控制 (Rate Control)

开篇段落

欢迎来到视频编码核心系列的第九章。在本章中，我们将深入探讨视频编码中一个至关重要的环节：码率控制 (Rate Control)。

想象一下，如果没有码率控制，视频流的大小将完全取决于内容的复杂度。在电影《疯狂的麦克斯：狂暴之路》中的沙尘暴追逐场景，编码器可能会产生 50 Mbps 的瞬时码率；而在《爱乐之城》中静谧的钢琴独奏片段，码率可能跌至 0.5 Mbps。这种剧烈的码率波动对于任何实际应用都是灾难性的：流媒体播放会因带宽不足而频繁卡顿，蓝光光盘会因容量超标而无法刻录，直播推流会因码率突刺而被平台拒绝。

码率控制是视频编码的”经济学”——它决定了有限的比特预算如何在时间和空间维度上进行分配。正如一个明智的投资者会根据市场状况调整投资组合，码率控制算法会根据视频内容的复杂度动态调整质量参数，确保每一个比特都用在刀刃上。

本章的目标是：

理解约束的来源：从网络带宽到存储容量，了解为什么码率控制是必需的
掌握主流模型：CBR 为传输而生，VBR 为存储而优，CRF 为质量而存
深入优化理论：率失真优化 (RDO) 如何为编码决策提供数学基础
展望前沿技术：AI 如何重新定义智能码率控制的边界

学完本章，您将能够：在给定的应用场景下选择最佳的码率控制策略；理解现代编码器进行微观决策的理论基础；掌握调试码率控制问题的实用技巧。

为何需要码率控制

在理想世界中，我们可以为视频的每一帧分配无限的比特，以实现完美的重建质量。然而，现实世界充满了经济和技术约束。码率控制的核心任务，正是在这些约束下，智能地为视频的不同部分分配有限的比特预算，以达到最优的整体观看体验。

约束的双重来源：带宽与存储

信道带宽约束 (Channel Bandwidth Constraints)

现代流媒体面临的带宽约束是多层次的：

末端网络瓶颈：用户的实际可用带宽往往远低于标称值。一个标称 100 Mbps 的家庭宽带，在晚间高峰期可能只有 20 Mbps 的实际吞吐量。
CDN 成本考量：每 GB 的流量都会产生实际的货币成本。Netflix 每年向 CDN 支付数十亿美元，优化码率直接影响运营成本。
移动网络波动：4G/5G 网络的带宽会因位置、时间、用户密度而剧烈波动。一个正在高速行驶中的用户可能会经历从 50 Mbps 到 1 Mbps 的带宽断崖。

存储容量约束 (Storage Capacity Constraints)

存储约束同样具有多个维度：

物理媒体限制：蓝光光盘的 25-128 GB 容量、USB 闪存盘的成本考量都对文件大小提出严格要求。
云存储成本：YouTube、Bilibili 等平台存储着数十亿小时的视频内容，每个额外的比特都会转化为实际的存储成本。
设备本地存储：移动设备的存储空间宝贵，用户下载的离线视频必须在质量和占用空间之间找到平衡。

控制机制：QP 的动态调节

码率控制通过动态调整量化参数 (Quantization Parameter, QP) 来实现其目标。QP 是视频编码中最重要的控制旋钮，它直接决定了质量与码率的权衡：

QP 的双重作用机制：

高 QP (例如 QP=42)：粗糙量化，高频细节被大量丢弃，编码块呈现”糊化”效果，但比特消耗极低
低 QP (例如 QP=18)：精细量化，几乎保留所有频率成分，接近无损质量，但比特消耗巨大

智能分配策略的三个维度：

时间维度的分配智慧
- 动作序列优先级：在《疯狂的麦克斯》的沙尘暴场景中，大量运动矢量和复杂残差需要低 QP 来保持动作的清晰度
- 静态场景节约：在《2001太空漫游》的星空镜头中，可以使用高 QP，因为缓慢的摄像机移动对质量要求相对较低
空间维度的感知优化
- 纹理复杂度感知：皮肤、织物等高频纹理区域需要低 QP 保持真实感
- 平坦区域压缩：天空、墙壁等均匀区域可以使用高 QP 而不产生明显的视觉劣化
感知重要性驱动
- 前景-背景分离：人物面部等关注焦点使用低 QP，模糊背景使用高 QP
- 运动自适应：快速运动的区域由于运动模糊效应，可以容忍更高的 QP

如果没有码率控制，编码器通常会以一种固定的 QP 进行编码（Fixed QP 模式）。这将导致码率随内容复杂度的变化而剧烈波动。对于一个典型的电影片段，其码率可能会像过山车一样：

      ▲
      │       /-----
Bitrate │      /       \
      │     /         \
      │    /           \
      │---/             \----/--
      │  /               \  /
      └────────────────────────►
        Time (Frame Number)

        <图9-1: 固定QP模式下的码率波动>

这种模式虽然能保证每一帧的“感知质量”相对恒定，但完全不实用，因为它无法满足任何实际应用的带宽或存储要求。因此，码率控制算法应运而生，其目标就是“削峰填谷”，将码率控制在预期的范围内，同时最大化整体视频质量。

## 常见模型：CBR, VBR, CRF

根据应用场景的不同需求，衍生出了几种主流的码率控制模型。理解它们的特点和适用范围至关重要。

### 1. 恒定比特率 (Constant Bitrate, CBR)

**设计哲学**：CBR 是"传输优先"的编码模式，它将网络传输的稳定性置于视觉质量一致性之上。

**工作原理的三个层次**：

1. **比特预算管理**：CBR 维护一个虚拟的"比特银行"概念
   - 系统持续监控实际码率与目标码率的偏差
   - 当实际消耗超出预算时，立即"收紧银根"（提高 QP）
   - 当实际消耗低于预算时，适当"宽松投资"（降低 QP）

2. **反馈控制机制**：类似于巡航定速系统
   - **正反馈抑制**：当码率偏高时，快速提升 QP 进行"刹车"
   - **负反馈补偿**：当码率偏低时，适度降低 QP 进行"加速"
   - **缓冲区管理**：利用编码器缓冲区 (VBV) 来平滑短期码率波动

3. **时间窗口策略**：
   - **短期窗口** (1-2秒)：严格控制瞬时码率，防止缓冲区溢出
   - **中期窗口** (5-10秒)：允许适度的码率借贷，提供质量缓冲
   - **长期平均**：确保整体码率收敛到目标值

**应用场景的精确定位**：
- **直播推流**：如 Twitch、斗鱼等平台的严格码率限制 (2-6 Mbps)
- **视频会议**：如 Zoom、Teams 等需要适应网络波动的实时通信
- **卫星传输**：带宽昂贵且固定的广播电视传输
- **低延迟场景**：游戏直播、远程控制等对延迟敏感的应用

**质量特性的双面性**：
- **优势**：网络友好，缓冲最少，延迟可预测
- **劣势**：质量波动大，复杂场景可能出现严重的块效应和模糊

**Rule-of-thumb**：CBR 是网络工程师的选择，而不是画质工程师的选择。当你的首要考虑是"确保流能够稳定传输"时，选择 CBR；当你更关心"每一帧都好看"时，避免使用 CBR。

```ascii
      ▲
Quality │      /-----
      │     /       \
      │    /         \
      │---/           \----/--
      │  /             \  /
      └────────────────────────►
        Time (Frame Number)

        <图9-2: CBR模式下的质量波动>

2. 可变比特率 (Variable Bitrate, VBR)

目标：在保持平均码率接近目标值的前提下，允许码率根据内容复杂度进行浮动，以追求更稳定的整体质量。
工作原理：VBR 通常需要对视频内容进行预分析。在两遍编码 (2-Pass Encoding) 中，第一遍 (First Pass) 会快速分析整个视频，收集每个场景的复杂度信息（例如，运动量、纹理细节等），并生成一个统计文件。第二遍 (Second Pass) 则利用这些信息，进行精细化的比特分配：为复杂场景分配更多比特，为简单场景分配更少比特。
优点：
- 相比 CBR，VBR 在相同的平均码率下，可以提供显著更高的整体视频质量。
- 对于给定的文件大小（存储约束），VBR 是达到最佳质量的理想选择。
缺点：
- 编码过程更慢、更复杂，因为它需要至少两次完整的遍历。
- 不适合实时编码场景，因为无法预知未来的内容复杂度。
- 码率波动较大，可能不适合某些对码率稳定性要求高的流媒体应用。
Rule-of-thumb：当你的目标是在固定的文件大小内最大化视频质量时（例如，为视频网站制作点播内容、存储蓝光电影），VBR 是最佳选择。

3. 恒定速率因子 (Constant Rate Factor, CRF) / 恒定质量 (Constant Quality, CQ)

目标：不追求特定的码率，而是追求一个相对恒定的“感知质量”水平。码率将完全由内容复杂度决定。
工作原理：CRF 是 x264/x265 编码器中一个非常流行的模式，其背后思想与固定 QP 类似，但更智能。它允许用户指定一个 CRF 值（例如，范围 0-51，值越低质量越高），编码器会尝试在整个视频中维持这个质量水平。它会像 CBR/VBR 一样动态调整 QP，但其调整目标不是码率，而是维持一个由 CRF 值决定的感知质量指标。
优点：
- 在一遍编码 (1-Pass Encoding) 中就能达到非常好的质量/码率平衡，效率很高。
- 提供了最直观的质量控制方式。你只需要关心“我想要多高的质量”，而不需要去猜测应该设置多高的码率。
缺点：
- 输出码率完全不可预测。你无法预知最终文件的大小，因此不适合有严格码率或大小限制的场景。
Rule-of-thumb：当你最关心的是视频本身的质量，而对最终文件大小没有严格要求时，CRF 是最佳选择。这是视频归档、个人收藏或母版制作的理想模式。

模型	主要目标	码率	质量	编码遍数	适用场景
CBR	恒定码率	稳定	波动	1-Pass	直播、视频会议
VBR	固定文件大小	波动	较稳定	2-Pass (典型)	视频点播、文件存储
CRF	恒定感知质量	高度波动	稳定	1-Pass	视频归档、母版制作

总结：选择哪种码率控制模型，完全取决于你的应用需求。是带宽优先（CBR），还是存储优先（VBR），还是质量优先（CRF）？这是每个视频工程师在开始编码前必须回答的第一个问题。

率失真优化 (Rate-Distortion Optimization, RDO) 简介

前面讨论的码率控制模型（CBR, VBR, CRF）解决了宏观层面（视频级或场景级）的比特分配问题。但一个更精细、更核心的问题是：在微观层面（例如，为一个宏块选择最佳的编码模式），编码器应如何做出“最优”决策？

这就是率失真优化（RDO）发挥作用的地方。RDO 是现代视频编码器的“大脑”，它为编码过程中成千上万个决策提供了一个统一的评判标准。

基本思想

视频编码的本质是在码率 (Rate) 和失真 (Distortion) 之间进行权衡。

码率 (R)：编码一个单元（如一个块）所花费的比特数。
失真 (D)：编码后的块与原始块之间的差异，通常用均方误差 (MSE) 或差值绝对和 (SAD) 来衡量。

我们希望同时降低 R 和 D，但这是不可能的，它们是相互制约的。RDO 的目标是在这两者之间找到最佳的平衡点。

RDO 将这个问题形式化为一个最优化问题：对于给定的编码单元，我们需要在所有可用的编码选项（例如，不同的帧内预测模式、不同的运动矢量、不同的变换块大小等）中，选择一个能够最小化拉格朗日代价函数 (Lagrangian Cost Function) J 的选项。

这个代价函数定义为：

$J = D + \lambda \cdot R$

其中：

J 是总代价 (Cost)。
D 是失真 (Distortion)。
R 是码率 (Rate)。
λ (lambda) 是拉格朗日乘子 (Lagrange Multiplier)，它代表了码率和失真之间的相对重要性。

λ 的值至关重要，它直接由量化参数 (QP) 决定。它们之间存在近似的指数关系：

$\lambda \approx 0.85 \cdot 2^{(QP-12)/3}$

高 QP：意味着我们更关心码率（希望省比特）。此时 λ 会很大，代价函数 J 将由码率 R 主导。编码器会倾向于选择那些能最大程度节省比特的模式，即使这会带来较大的失真。
低 QP：意味着我们更关心质量（希望保留细节）。此时 λ 会很小，代价函数 J 将由失真 D 主导。编码器会倾向于选择那些能最小化失真的模式，即使这会花费更多的比特。

RDO 的工作流程

让我们以“为一个宏块选择最佳帧内预测模式”为例，看看 RDO 是如何工作的：

获取候选模式：编码器会列出所有可用的帧内预测模式（例如，Planar, DC, 以及多个角度模式）。
对每个模式进行“试编码”： a. 使用该模式进行预测。 b. 计算预测残差。 c. 对残差进行变换和量化。 d. 计算失真 (D)：将量化后的残差逆变换回来，与原始残差比较，计算出 MSE。 e. 计算码率 (R)：对量化后的系数、预测模式信息、运动矢量（如果是帧间）等所有语法元素进行熵编码，得到所需的比特数。
计算总代价：对于每个候选模式，使用公式 $J = D + \lambda \cdot R$ 计算其总代价。
做出决策：选择那个使 J 值最小的模式，作为该宏块的最终编码模式。

+-----------------+
|  Original Block |
+-----------------+
       |
       v
+------------------------------------------------+
| Loop through all candidate modes (e.g., Intra Modes) |
|                                                |
|   +----------------------------------------+   |
|   | Mode A:                                |   |
|   |  - Predict, Transform, Quantize        |   |
|   |  - Calculate D_A (Distortion)          |   |
|   |  - Calculate R_A (Rate)                |   |
|   |  - J_A = D_A + λ * R_A                 |   |
|   +----------------------------------------+   |
|                                                |
|   +----------------------------------------+   |
|   | Mode B:                                |   |
|   |  - Predict, Transform, Quantize        |   |
|   |  - Calculate D_B (Distortion)          |   |
|   |  - Calculate R_B (Rate)                |   |
|   |  - J_B = D_B + λ * R_B                 |   |
|   +----------------------------------------+   |
|                                                |
|   ... (and so on for all other modes) ...      |
|                                                |
+------------------------------------------------+
       |
       v
+---------------------------------+
| Select mode with the minimum J  |
+---------------------------------+

        <图9-3: RDO决策流程示意图>

RDO 的意义

RDO 是一个非常强大的概念，因为它将编码器中所有看似无关的决策（模式选择、运动估计、量化等）统一到了一个共同的优化框架下。它确保了编码器在每一个细节上所做的决策，都有一个清晰、数学上可优化的目标：在当前 λ (即 QP) 所定义的码率-失真权衡下，做到局部最优。

然而，RDO 的计算量是巨大的。对每一个块的每一个可能选项都进行完整的“试编码”会消耗惊人的计算资源。因此，实际的编码器都会开发各种快速算法，用于提前排除掉那些不可能是最优的选项，从而在编码速度和压缩效率之间取得平衡。

Rule-of-thumb：RDO 是现代编码器性能的基石。当你调整编码预设（preset）从 ultrafast 到 veryslow 时，你主要调整的就是 RDO 的复杂度和搜索范围。更慢的预设意味着更详尽的 RDO 搜索，从而找到更优的编码决策，带来更高的压缩效率。

高级话题：多遍编码 (Multi-pass Encoding)

在 VBR 模式的讨论中，我们提到了两遍编码 (2-Pass Encoding) 是实现高质量比特分配的常用方法。实际上，这个概念可以被进一步扩展，以追求更极致的优化效果。

多遍编码的核心思想是利用前一遍编码收集的信息来指导后一遍的编码决策。

第一遍 (First Pass)：
- 目标：不是生成最终的压缩视频，而是快速地对整个视频进行分析，为每一帧或每一个场景“打分”，评估其复杂度。
- 过程：编码器以一种较快的模式（例如，关闭一些耗时的 RDO 决策）运行，不输出完整的码流，只记录关键的统计数据。这些数据通常包括：
  - 每帧的类型（I, P, B）。
  - 量化参数 (QP)。
  - 运动矢量的幅度和方向。
  - 残差信息的能量（SAD 或 SATD）。
  - 帧内的空间复杂度。
- 输出：一个日志文件（log file），详细记录了整个视频的“码率-失真”特性曲线。
第二遍 (Second Pass) 及后续遍：
- 目标：利用第一遍收集的全局信息，进行最优的比特分配，并生成最终的压缩视频。
- 过程：在开始编码任何一帧之前，编码器就已经“看”过了整个视频的复杂度分布。它可以做出更具前瞻性的决策：
  - 比特预算分配：它可以精确地为高动态的动作场景预留更多比特，同时从平静态的对话场景中“借用”比特，从而平滑整个视频的质量。
  - GOP 结构优化：它可以根据场景切换的位置，智能地决定在何处插入 I 帧，避免在场景切换的中间插入 B 帧导致的质量下降。
  - QP 调整：它可以建立一个更精确的“码率-QP”模型，从而更准确地通过调整 QP 来达到目标码率。

虽然理论上可以进行三遍甚至更多遍的编码，但实践证明，从第一遍到第二遍的收益是最大的。后续遍所带来的质量提升会迅速减小，而编码时间却线性增加。因此，两遍编码是目前在质量、效率和复杂度之间最佳的折衷方案。

Rule-of-thumb：对于所有非实时、追求高质量的视频点播 (VOD) 应用，两遍编码都应该是默认选项。它是在给定的文件大小约束下，获得最佳画质的最可靠方法。

AI 算法改进：基于强化学习的码率控制策略

传统的码率控制算法，无论是基于公式的（如 λ 的计算）还是基于启发式规则的，都是由人类专家根据大量实验数据设计的。这些模型虽然有效，但很难适应所有类型和风格的视频内容。

近年来，一个令人兴奋的研究方向是使用强化学习 (Reinforcement Learning, RL) 来自动学习最优的码率控制策略。

基本思想：将码率控制问题建模为一个强化学习任务。
- 智能体 (Agent)：编码器本身。
- 环境 (Environment)：视频序列的内容特性。
- 状态 (State)：描述当前编码状况的特征向量，可以包括已用比特数、缓冲区占用率、前几帧的 QP 值、当前帧的复杂度等。
- 动作 (Action)：为下一个编码单元（例如一帧或一个 CTU）选择一个合适的 QP 值。
- 奖励 (Reward)：一个精心设计的函数，用于激励智能体做出好的决策。奖励函数通常会综合考虑多个因素，例如：
  - 正奖励：高的视频质量（通常用 VMAF 或 PSNR 衡量）。
  - 负奖励（惩罚）：超出目标码率、码率波动过大。
学习过程：
1. 智能体（编码器）在一个庞大的视频数据集上进行“训练”。
2. 在训练过程中，它会不断地尝试为不同的视频帧选择 QP 值（动作）。
3. 每次选择后，它会从环境中获得一个奖励或惩罚。
4. 通过成千上万次的迭代，智能体内部的神经网络会逐渐学习到一个最优策略 (Policy)，这个策略能够根据当前的状态，映射到最佳的动作（QP选择），以最大化长期累积奖励。
优势：
- 自适应性：与固定的传统算法不同，RL 模型可以学习到针对不同内容类型的特定码率控制策略，例如为动画、体育、电影等内容自动优化。
- 超越传统模型：在某些测试中，基于 RL 的码率控制已经能够在相同的码率下，实现比传统 x265 等编码器更高的 VMAF 分数。
- 端到端优化：可以将码率控制与其他编码决策（如模式选择）联合优化，实现全局最优。

目前，这项技术还主要处于学术研究和工业实验室阶段，因为它需要巨大的计算资源进行训练。但它代表了未来码率控制技术的一个重要发展方向，有望为视频编码带来新一轮的性能突破。

历史事件/人物：Gary Sullivan 与率失真优化理论

在视频编码领域，Gary J. Sullivan 是一个无法绕开的名字。他是 ITU-T VCEG (Video Coding Experts Group) 的主席，并且是 H.264/AVC, H.265/HEVC, H.266/VVC 等一系列里程碑式视频标准的核心设计者之一。

他对视频编码最重要的贡献之一，就是将率失真优化 (RDO) 理论系统性地引入并应用到视频编码标准的设计中。虽然拉格朗日优化理论早已存在，但 Sullivan 和他的同事们（如 Thomas Wiegand）首次将其形式化地应用于编码器决策的方方面面，从运动估计到模式选择，使其成为现代视频编码器的标准工作模式。

这一理论框架的引入，将视频编码从一系列零散的、启发式的“技巧”集合，转变为一个有坚实理论基础的、可系统性优化的科学体系。可以说，没有 RDO，就没有现代编码器惊人的压缩效率。

当代事件/人物：Netflix 的动态优化器 (Dynamic Optimizer)

在工业界，Netflix 无疑是视频编码技术应用和创新的领导者。面对全球数亿用户的多样化网络环境和设备，Netflix 开发了一套名为动态优化器 (Dynamic Optimizer) 的先进编码系统，将码率控制的理念推向了新的高度。

其核心思想是“Per-Shot”或“Per-Title”编码：

放弃“一刀切”：传统的编码流程会对所有不同类型的电影（例如，动画片《马男波杰克》和动作片《惊天营救》）使用同一套码率阶梯（bitrate ladder）。但这显然不是最优的。动画片在较低码率下就能达到很好的质量，而充满胶片颗粒感和快速运动的动作片则需要高得多的码率。
内容自适应编码：Netflix 的动态优化器会在编码前对每一个影片（Per-Title），甚至影片中的每一个镜头（Per-Shot）进行分析。
生成定制化的码率阶梯：根据分析结果，它会为该内容生成一个独一无二的码率阶梯。对于简单的动画内容，可能会生成一个从 200 kbps 到 3 Mbps 的码率阶梯；而对于复杂的动作电影，则可能生成一个从 1 Mbps 到 15 Mbps 的码率阶梯。

通过这种方式，Netflix 能够在保证所有内容在所有设备上都有良好观看体验的前提下，极大地节省带宽和存储成本。例如，对于简单内容，他们可以避免浪费比特在人眼无法区分的高码率上；对于复杂内容，他们又确保分配了足够的比特来保留其视觉质量。

这一实践是码率控制思想在工业界最大规模、最精细化的应用典范，展示了如何通过智能的比特分配策略，为全球范围的流媒体服务提供支持。

本章小结

本章深入探讨了视频编码的“经济学”——码率控制。我们学习了如何根据不同的应用约束（带宽、存储、质量），在多种码率控制模型中做出正确选择，并理解了现代编码器进行微观决策的核心理论。

为何需要码率控制：为了克服信道带宽和存储容量的限制，码率控制通过动态调整 QP，在视频不同部分之间智能分配比特预算。
三大控制模型：
- CBR (恒定比特率)：为带宽而生，牺牲质量以换取稳定的码率，适用于实时流媒体。
- VBR (可变比特率)：为存储而生，通过多遍编码，在固定文件大小内最大化整体质量，适用于视频点播。
- CRF (恒定速率因子)：为质量而生，追求恒定的感知质量，不保证输出码率，适用于内容归档。
率失真优化 (RDO)：是现代编码器进行模式选择、运动估计等所有微观决策的统一优化框架。它通过最小化代价函数 $J = D + \lambda \cdot R$ 来寻找码率与失真之间的最佳平衡点。
高级与前沿：多遍编码通过全局信息分析实现更优的比特分配；而基于强化学习的 AI 方法则为开发更智能、自适应的码率控制策略开辟了新的道路。

常见陷阱与错误 (Gotchas)

误用 CBR 进行点播编码：最常见的错误之一是为视频点播（VOD）文件使用 CBR 模式。这会导致在复杂场景下质量严重受损，而在简单场景下浪费带宽。正确做法：对于 VOD，应始终使用 2-Pass VBR 或 CRF 模式。
对 CRF 的码率抱有不切实际的期望：使用 CRF 时，无法精确控制最终文件的大小。试图通过反复微调 CRF 值来精确匹配一个目标大小是低效且错误的。正确做法：如果必须满足严格的大小限制，请直接使用 2-Pass VBR。如果关心的是质量，请选择一个合适的 CRF 值并接受其最终大小。
混淆“比特率”与“质量”：更高的比特率并不总是意味着更高的质量。在 CBR 模式下，一个简单的场景可能被分配了过高的比特率，其质量可能远不如一个经过 VBR 精心优化的、平均比特率更低的复杂场景。关键认知：比特率是成本，质量是产出。码率控制的目标就是最大化“性价比”。
忽略 RDO 对编码速度的巨大影响：用户有时会抱怨编码速度太慢，却没有意识到他们选择了一个非常慢的预设（preset）。这些慢速预设的主要工作就是进行极其详尽的 RDO 搜索。调试技巧：在编码速度成为瓶颈时，首先应尝试调整编码器预设（例如，从 slow 调整到 medium），这是在编码效率和速度之间进行权衡的最直接方式。
在 1-Pass VBR 中期望过高：一些编码器提供单遍 VBR 模式。虽然这比 CBR 好，但它因为缺乏对未来的“预知”，其比特分配效果远不如 2-Pass VBR。它可能会在视频前半部分过于“大方”，导致后半部分比特预算不足。正确做法：除非编码时间极其有限，否则应尽量避免使用 1-Pass VBR。