database_tutorial

第5章：并发控制

本章导读

并发控制是数据库系统的核心挑战之一。当多个事务同时访问共享数据时，如何保证数据的一致性、避免冲突、同时最大化系统吞吐量？本章深入探讨各种并发控制机制的设计原理、实现细节和性能权衡。我们将从传统的锁机制出发，逐步扩展到乐观并发控制、时间戳排序等无锁方案，最后讨论如何根据工作负载特征选择和组合不同的策略。

学习目标

掌握锁管理器的内部实现和优化技术
理解乐观并发控制的适用场景和验证算法
分析时间戳排序的正确性保证和性能特征
设计针对特定工作负载的混合并发控制策略
识别和处理系统中的热点数据问题

5.1 锁管理器设计

锁管理器是悲观并发控制的核心组件，负责协调事务对数据资源的访问。一个高效的锁管理器需要在保证正确性的前提下，最小化锁操作的开销，减少锁冲突，并支持灵活的锁粒度。

5.1.1 锁的粒度层次

数据库系统通常支持多级锁粒度，形成一个层次结构。这种层次化设计允许系统在并发性和开销之间找到最优平衡点。

Database
    ↓
Table/Relation
    ↓
Partition (分区表)
    ↓  
Page/Block (通常4KB-16KB)
    ↓
Tuple/Row
    ↓
Attribute/Field

粒度选择的权衡：

粗粒度锁（如表锁）：开销小，但并发度低，适合批量操作
细粒度锁（如行锁）：并发度高，但管理开销大，适合点查询
中间粒度（如页锁）：折中方案，某些场景下性能最优

动态粒度选择算法：系统可以根据操作特征动态选择锁粒度。考虑因素包括：

选择率（Selectivity）：影响行数占总行数的比例
访问模式：顺序扫描vs随机访问
并发级别：当前系统的活跃事务数
历史统计：该表的锁冲突历史

锁粒度的成本模型： \(\text{Cost} = \text{LockOverhead} \times \text{NumLocks} + \text{ConflictProbability} \times \text{ConflictCost}\)

其中：

LockOverhead：单个锁的管理开销（内存、CPU）
NumLocks：需要获取的锁数量
ConflictProbability：锁冲突概率
ConflictCost：冲突导致的等待或回滚成本

实际系统中的粒度选择：

MySQL InnoDB：默认行级锁，但DDL操作使用表锁
PostgreSQL：行级锁为主，支持咨询锁（Advisory Lock）
SQL Server：动态锁粒度，根据查询优化器估算
Oracle：行级锁 + 多版本，几乎不使用页锁

Rule of Thumb：

OLTP工作负载：优先使用行级锁（选择率 < 5%）
OLAP工作负载：可以容忍表级或分区级锁（选择率 > 40%）
批量操作：考虑锁升级机制（影响行数 > 5000）
混合负载：使用意向锁 + 动态升级策略

5.1.2 锁表实现

锁表是锁管理器的核心数据结构，需要支持高效的查找、插入和删除操作。现代数据库系统的锁表设计必须考虑多核扩展性和缓存友好性。

基本设计：

Lock Table (Hash Table)
    ↓
Bucket → Lock Header → Lock Request Queue
           ├─ Resource ID (表ID + 页ID + 行ID)
           ├─ Lock Mode Bitmap
           ├─ Granted List (已授予锁的事务列表)
           ├─ Waiting Queue (等待锁的事务队列)
           └─ Reference Count

详细数据结构：

struct LockHeader {
    ResourceID resource_id;      // 资源标识符
    uint32_t granted_modes;       // 已授予锁模式的位图
    uint32_t waiting_modes;       // 等待中锁模式的位图
    List<LockRequest> granted;    // 已授予队列
    Queue<LockRequest> waiting;   // 等待队列
    atomic<int> ref_count;        // 引用计数
    SpinLock latch;              // 保护该锁头的轻量级锁
};

struct LockRequest {
    TransactionID txn_id;         // 事务ID
    LockMode mode;               // 请求的锁模式
    GrantStatus status;          // GRANTED/WAITING/CONVERTING
    LockRequest* next;           // 链表指针
    ConditionVariable cv;        // 用于等待通知
};

关键优化技术：

分片锁表（Partitioned Lock Table）：

分片数 = 2^n (通常为CPU核数的2-4倍)
分片索引 = hash(resource_id) & (num_shards - 1)
每个分片独立的锁保护，减少争用

无锁数据结构：
- 使用CAS操作实现lock-free队列
- 读操作使用RCU（Read-Copy-Update）
- 写操作使用细粒度的自旋锁
内存池管理： ``` 预分配策略：
- 初始池大小 = 预期并发事务数 × 平均锁数
- 动态扩展：当使用率 > 80% 时翻倍
- 回收策略：定期回收空闲超过阈值的内存块 ```
缓存行对齐：
- 将频繁访问的字段放在同一缓存行
- 使用padding避免false sharing
- 热点数据使用NUMA-aware分配

锁兼容性矩阵：

         | IS | IX | S  | SIX | X  | U  | AI | AX
    -----|----|----|----|----|----|----|----|----|
    IS   | ✓  | ✓  | ✓  | ✓   | ✗  | ✓  | ✓  | ✗
    IX   | ✓  | ✓  | ✗  | ✗   | ✗  | ✗  | ✓  | ✗
    S    | ✓  | ✗  | ✓  | ✗   | ✗  | ✓  | ✓  | ✗
    SIX  | ✓  | ✗  | ✗  | ✗   | ✗  | ✗  | ✓  | ✗
    X    | ✗  | ✗  | ✗  | ✗   | ✗  | ✗  | ✗  | ✗
    U    | ✓  | ✗  | ✓  | ✗   | ✗  | ✗  | ✓  | ✗
    AI   | ✓  | ✓  | ✓  | ✓   | ✗  | ✓  | ✗  | ✗
    AX   | ✗  | ✗  | ✗  | ✗   | ✗  | ✗  | ✗  | ✗

其中：

IS (Intent Shared)：意向共享锁
IX (Intent Exclusive)：意向排他锁
S (Shared)：共享锁
SIX (Shared + Intent Exclusive)：共享意向排他锁
X (Exclusive)：排他锁
U (Update)：更新锁，用于避免转换死锁
AI (Auto-Increment)：自增锁，MySQL特有
AX (Append Exclusive)：追加排他锁，用于日志表

快速兼容性检查：使用位运算加速兼容性判断：

bool is_compatible(uint32_t granted_modes, LockMode requested) {
    return (compatibility_matrix[requested] & granted_modes) == 0;
}

5.1.3 意向锁机制

意向锁是多粒度锁协议的关键创新，它通过在粗粒度级别标记细粒度锁的存在，极大地提高了锁冲突检测的效率。没有意向锁，系统需要遍历所有子节点才能判断是否存在冲突。

工作原理：

在获取细粒度锁之前，先在粗粒度上设置意向锁
意向锁表明下层存在或将要存在某种类型的锁
通过意向锁快速判断是否存在冲突，避免遍历所有细粒度锁

意向锁的类型与含义：

IS（Intent Shared）：子节点正在或将要持有S锁
IX（Intent Exclusive）：子节点正在或将要持有X锁
SIX（Shared + IX）：当前节点S锁 + 子节点将持有X锁

多粒度锁协议（MGL Protocol）规则：

自顶向下获取：必须先获取祖先节点的意向锁
兼容性检查：在每一层检查锁兼容性
自底向上释放：先释放子节点锁，再释放父节点锁

获取锁的完整流程：

要在行R上获取X锁：
1. 获取数据库级IX锁
2. 获取表级IX锁
3. 获取页级IX锁（如果使用页锁）
4. 获取行级X锁

伪代码：
function acquire_lock(resource, mode):
    path = get_hierarchy_path(resource)
    for level in path[:-1]:  // 除了目标资源外的所有祖先
        if mode == SHARED:
            acquire(level, IS)
        else:  // EXCLUSIVE
            acquire(level, IX)
    acquire(resource, mode)

意向锁的优化实现：

锁继承优化：如果父节点已有IX锁，子节点的IS请求可以直接通过
批量意向锁：一次性获取路径上所有意向锁，减少往返
意向锁缓存：缓存常用表的意向锁状态

死锁预防：意向锁协议天然防止某些死锁场景：

场景：T1持有行锁，T2请求表锁
没有意向锁：T2需要检查所有行，可能形成死锁
有意向锁：T2立即发现表级IX锁，直接等待

性能影响分析：

正面影响：O(1)的冲突检测，而非O(n)的全表扫描
负面影响：额外的锁获取开销（通常可忽略）
权衡点：当表的行数 > 100时，意向锁带来净收益

5.1.4 锁升级与降级

锁升级是数据库系统平衡内存使用和并发性能的重要机制。当细粒度锁数量过多时，不仅消耗大量内存，锁管理的CPU开销也会显著增加。

锁升级（Lock Escalation）：当事务持有大量细粒度锁时，自动转换为粗粒度锁。这是一个权衡：牺牲一定的并发性来换取更低的管理开销。

升级触发条件：

1. 数量阈值触发：
   - 单事务持有锁数 > 5000
   - 或 > 表总行数的 5%
   
2. 内存压力触发：
   - 锁表内存使用 > 分配内存的 60%
   - 系统总内存压力达到阈值
   
3. 模式识别触发：
   - 检测到全表扫描模式
   - 连续页访问超过阈值
   - 批量DML操作

升级算法：

function try_lock_escalation(transaction, table):
    if should_escalate(transaction, table):
        // 尝试获取表级锁
        if try_acquire_table_lock(table, transaction.lock_mode):
            // 释放所有行级锁
            for each row_lock in transaction.locks[table]:
                release(row_lock)
            // 更新锁记录
            transaction.locks[table] = [table_lock]
            return SUCCESS
        else:
            // 升级失败，保持原状或等待
            return RETRY_LATER

升级策略选择：

立即升级：检测到触发条件立即尝试
延迟升级：等待当前操作完成后升级
预测性升级：基于查询计划提前升级

锁降级（Lock De-escalation）：较少见，主要用于长事务释放部分资源。某些高级系统支持部分降级。

降级场景：
长事务完成批量操作后，只需保留少量锁
内存压力缓解后，恢复细粒度锁以提高并发
工作负载模式改变（从批量变为OLTP）

升级的代价分析：

正面效应：
- 减少内存使用（可减少90%以上）
- 降低锁管理CPU开销
- 简化死锁检测
负面效应：
- 降低并发度（其他事务被阻塞）
- 可能导致锁等待队列增长
- 升级过程本身的开销

智能升级策略：

class SmartEscalation:
    def __init__(self):
        self.history = {}  # 记录历史升级效果
        
    def should_escalate(self, txn, table):
        # 基础检查
        if txn.lock_count[table] < self.threshold:
            return False
            
        # 历史效果评估
        if table in self.history:
            past_benefit = self.history[table].benefit_ratio
            if past_benefit < 0.5:  # 历史升级效果不好
                return False
                
        # 并发影响评估
        waiting_txns = get_waiting_transactions(table)
        if len(waiting_txns) > 5:  # 太多事务在等待
            return False
            
        # 工作负载预测
        if is_oltp_workload(table):
            return False  # OLTP不适合表锁
            
        return True

Rule of Thumb：

锁升级阈值设置：
- OLTP系统：行锁数量 > 10000 或 > 表行数的10%
- OLAP系统：行锁数量 > 1000 或 > 表行数的5%
- 混合负载：动态调整，基于最近的工作负载特征
避免频繁升级/降级：设置最小间隔时间（如5秒）
监控指标：
- 锁升级频率 > 1次/分钟需要优化查询
- 升级后等待时间增加 > 50% 需要调整策略

5.1.5 死锁处理

锁管理器必须能够检测和解决死锁。

检测算法：

等待图法（Wait-for Graph）：
- 维护事务等待关系图
- 定期检测环的存在
- 时间复杂度：O(n²)
超时法：
- 设置锁等待超时时间
- 简单但可能误判

解决策略：

选择牺牲者（Victim Selection）：最小代价原则
考虑因素：事务年龄、已完成工作量、持有资源数

5.2 乐观并发控制

乐观并发控制（OCC）假设冲突很少发生，事务执行时不加锁，只在提交时检查冲突。

5.2.1 三阶段协议

OCC将事务执行分为三个阶段：

1. 读阶段（Read Phase）：

事务读取数据到私有工作空间
所有写操作在本地缓冲
维护读集（Read Set）和写集（Write Set）

2. 验证阶段（Validation Phase）：

检查是否与其他并发事务冲突
确定序列化顺序
原子性地执行验证

3. 写阶段（Write Phase）：

如果验证通过，将缓冲的修改写入数据库
否则，中止事务并重试

5.2.2 验证算法

向后验证（Backward Validation）：检查当前事务的读集是否与已提交事务的写集冲突。

算法伪代码：
for each committed transaction Ti where Ti < Tc:
    if WriteSet(Ti) ∩ ReadSet(Tc) ≠ ∅:
        abort Tc

向前验证（Forward Validation）：检查当前事务的写集是否与活跃事务的读集冲突。

算法伪代码：
for each active transaction Ti:
    if WriteSet(Tc) ∩ ReadSet(Ti) ≠ ∅:
        abort Tc or Ti (based on policy)

性能优化：

使用Bloom Filter加速集合交集判断
分区验证减少检查范围
批量验证多个事务

5.2.3 写集管理

写集的高效管理对OCC性能至关重要。

实现方案：

完整对象复制：
- 简单但内存开销大
- 适合小对象
增量日志：
- 只记录修改的属性
- 需要重放日志生成最终版本
版本链：
- 维护多版本链表
- 支持快照隔离

内存管理策略：

预分配缓冲池
基于事务大小的自适应分配
溢出到磁盘的机制

5.2.4 OCC的适用场景

适合OCC的工作负载特征：

读多写少
事务较短
冲突率低（< 5%）
低争用的Web应用

不适合OCC的场景：

高冲突率导致大量重试
长事务累积大量写集
需要严格的响应时间保证

Rule of Thumb：

冲突率 < 1%：OCC显著优于2PL
冲突率 > 10%：考虑使用悲观锁
中间情况：需要基准测试决定

5.3 时间戳排序

时间戳排序（Timestamp Ordering, TO）是另一种无锁并发控制方法，通过为每个事务分配唯一时间戳来确定序列化顺序。

5.3.1 基本TO协议

核心思想：

每个事务Ti获得唯一时间戳TS(Ti)
事务按时间戳顺序序列化
每个数据项X维护：
- WTS(X)：最后写入X的事务时间戳
- RTS(X)：最后读取X的事务时间戳

读操作规则：

if TS(Ti) < WTS(X):
    // 读取过时数据，违反序列化顺序
    abort Ti
else:
    执行读操作
    RTS(X) = max(RTS(X), TS(Ti))

写操作规则：

if TS(Ti) < RTS(X) or TS(Ti) < WTS(X):
    // 写入会影响已发生的读或写
    abort Ti
else:
    执行写操作
    WTS(X) = TS(Ti)

5.3.2 Thomas写规则

Thomas写规则是对基本TO协议的优化，减少不必要的事务中止。

优化规则：

if TS(Ti) < RTS(X):
    abort Ti  // 仍需中止
elif TS(Ti) < WTS(X):
    忽略写操作  // 写被后续事务覆盖，可以安全忽略
else:
    执行写操作
    WTS(X) = TS(Ti)

优势：

减少写-写冲突导致的中止
特别适合更新频繁的数据

5.3.3 多版本时间戳排序（MVTO）

MVTO结合多版本和时间戳排序，提供更好的并发性。

数据结构：每个数据项X维护版本链：

X → [Version1: (value, WTS, RTS)] 
    → [Version2: (value, WTS, RTS)]
    → ...

读操作：

找到最大的版本k，使得WTS(Xk) ≤ TS(Ti)
if 没有这样的版本:
    等待或使用默认值
else:
    读取Xk
    RTS(Xk) = max(RTS(Xk), TS(Ti))

写操作：

找到最大的版本k，使得WTS(Xk) ≤ TS(Ti)
if TS(Ti) < RTS(Xk):
    abort Ti  // 会影响已发生的读
elif TS(Ti) = WTS(Xk):
    覆盖版本k
else:
    创建新版本

垃圾回收：

保留规则：版本的WTS ≥ 最老活跃事务的时间戳
定期清理不再需要的旧版本

5.3.4 时间戳分配策略

1. 系统时钟：

简单直接
需要处理时钟偏移和回拨

2. 逻辑计数器：

单调递增
可能成为瓶颈

3. 混合时间戳：

Timestamp = (Physical_Clock << 16) | Counter

结合物理时间和逻辑计数器
提供全局唯一性和单调性

4. 向量时间戳（分布式系统）：

每个节点维护向量时钟
支持因果一致性

5.3.5 TO的性能特征

优势：

无死锁（事务可能饿死）
不需要锁管理开销
读操作通常不阻塞

劣势：

级联中止问题
长事务容易被中止
时间戳分配可能成为瓶颈

Rule of Thumb：

短事务、读密集：TO性能良好
存在长事务：考虑MVTO
写冲突频繁：TO可能导致大量中止

5.4 混合并发控制策略

现实系统往往结合多种并发控制机制，根据工作负载特征动态选择最优策略。

5.4.1 自适应并发控制

基本架构：

Monitor → Analyzer → Selector → Executor
   ↑                                ↓
   └────── Feedback Loop ←──────────┘

监控指标：

事务中止率
平均等待时间
锁争用程度
系统吞吐量

切换策略：

if abort_rate > threshold_high:
    切换到悲观锁
elif abort_rate < threshold_low and conflict_rate < threshold:
    切换到OCC
else:
    保持当前策略

平滑切换机制：

新事务使用新策略
等待旧策略事务完成
迁移元数据
完成切换

5.4.2 分区混合策略

不同数据分区使用不同的并发控制策略。

分区策略选择：

热点分区：2PL（悲观锁）
冷数据分区：OCC
只读分区：MVCC快照读
时序数据分区：追加写+TO

跨分区事务处理：

使用2PC协调不同分区
维护全局序列化图
必要时升级到全局锁

5.4.3 工作负载感知优化

OLTP优化：

细粒度锁 + 索引锁
轻量级OCC用于短事务
优先级调度减少等待

OLAP优化：

粗粒度锁或快照隔离
批量验证减少开销
查询级并发控制

HTAP混合负载：

主副本用2PL服务OLTP
副本用MVCC服务OLAP
异步复制保持一致性

5.4.4 机器学习驱动的优化

预测模型：

预测事务访问模式
估计冲突概率
选择最优并发控制策略

在线学习：

特征向量 = [
    事务类型,
    访问数据量,
    读写比例,
    历史冲突率,
    当前系统负载
]
策略 = ML_Model.predict(特征向量)

强化学习应用：

状态：系统性能指标
动作：并发控制策略选择
奖励：吞吐量提升 - 中止代价

5.5 热点数据处理

热点数据是指被频繁访问的数据项，它们往往成为系统的性能瓶颈。有效的热点处理策略对于维持系统的可扩展性至关重要。

5.5.1 热点检测机制

访问频率统计：

每个数据项维护：
- access_count：访问计数
- last_access_time：最后访问时间
- access_pattern：访问模式（读/写比例）

热点判定：
if access_count > threshold * avg_access_count:
    标记为热点

滑动窗口算法：

维护最近N秒的访问历史
使用指数衰减权重：weight = e^(-λ * age)
热度分数 = Σ(access_i * weight_i)

自适应阈值：

动态调整热点阈值
考虑系统负载和响应时间
避免过度识别或遗漏

分布式热点检测：

本地检测 + 全局聚合
使用Gossip协议传播热点信息
延迟容忍的最终一致性

5.5.2 缓解策略

1. 数据分片（Sharding）：

原始热点：Counter X
分片方案：X → [X1, X2, ..., Xn]

写操作：随机选择分片Xi进行更新
读操作：Sum(X1, X2, ..., Xn)

优势：分散写压力劣势：读操作开销增加

2. 缓存层优化：

多级缓存架构
热点数据优先缓存
写穿透（Write-through）vs 写回（Write-back）

3. 乐观锁升级：

if 检测到热点:
    从悲观锁切换到OCC
    使用批量验证减少开销

4. 读写分离：

主节点处理写
多个副本分担读
异步复制保持最终一致性

5.5.3 分区与复制技术

动态分区：

监控分区负载
if 负载不均衡:
    识别热点键范围
    创建新分区
    迁移部分数据
    更新路由表

智能复制：

热点数据增加副本数
冷数据减少副本以节省空间
基于访问模式的副本放置

一致性哈希优化：

虚拟节点映射：
热点数据 → 更多虚拟节点
均匀分布负载

5.5.4 应用层优化

批量处理：

收集时间窗口内的请求
批量执行：
UPDATE counter SET value = value + batch_sum

请求合并：

识别相同的查询
只执行一次，结果共享
减少数据库压力

限流与降级：

if 访问频率 > 限制:
    返回缓存结果
    或返回降级响应

异步处理：

将更新操作加入队列
批量处理队列中的更新
适合容忍延迟的场景

5.5.5 特定场景优化

计数器场景：

使用HyperLogLog近似计数
分片计数器 + 定期合并
Redis/Memcached作为计数缓存

排行榜场景：

使用跳表或B+树维护有序集合
分层排行榜（全局Top + 分组Top）
延迟更新 + 批量重算

库存扣减：

预扣减 + 异步确认
分段库存管理
使用信号量控制并发

秒杀场景：

令牌桶限流
预生成订单号
队列化处理

Rule of Thumb：

热点阈值：访问频率 > 10倍平均值
分片数量：√(预期并发数)
缓存命中率目标：> 95% for 热点数据
副本数量：ceil(读QPS / 单副本容量)

本章小结

并发控制是数据库系统保证事务正确执行的核心机制。本章深入探讨了多种并发控制策略：

核心概念回顾

锁管理器设计：
- 多粒度锁协议通过意向锁减少锁检查开销
- 锁升级机制平衡并发度和管理开销
- 死锁检测与处理确保系统进展
乐观并发控制（OCC）：
- 三阶段协议：读-验证-写
- 适合低冲突工作负载
- 验证算法决定性能表现
时间戳排序（TO）：
- 通过时间戳确定序列化顺序
- 无死锁但可能导致级联中止
- MVTO提供更好的并发性
混合策略：
- 自适应选择最优策略
- 分区级策略定制
- 机器学习驱动的优化
热点处理：
- 检测、缓解、优化三步走
- 分片和复制技术分散负载
- 应用层优化减少数据库压力

关键公式与算法

并发度估算： \(\text{Concurrency} = \frac{N}{1 + \alpha \cdot (N-1)}\) 其中N是并发事务数，α是冲突概率

最优锁粒度选择： \(\text{Granularity} = \arg\min_{g} \left( \text{LockOverhead}(g) + \text{ConflictCost}(g) \right)\)

OCC中止率预测： \(P_{abort} = 1 - (1 - p)^{n-1}\) 其中p是单个操作冲突概率，n是事务操作数

热点分片数量： \(\text{Shards} = \lceil \sqrt{\text{ExpectedConcurrency}} \rceil\)

设计决策指南

场景	推荐策略	原因
短事务、低冲突	OCC	无锁开销，高吞吐量
高冲突OLTP	2PL + 细粒度锁	避免大量重试
只读查询为主	MVCC	读不阻塞写
混合负载	自适应/分区策略	针对性优化
存在热点	分片 + 缓存	分散负载

练习题

基础题

练习5.1 锁兼容性矩阵给定事务序列：

T1: S(A), S(B)
T2: X(B), X(C)
T3: S(C), X(A)

使用二阶段锁协议，判断哪些操作会被阻塞？画出等待图。

提示：按时间顺序分析每个操作的锁请求

参考答案

执行序列分析： 1. T1: S(A) - 成功 2. T1: S(B) - 成功 3. T2: X(B) - 阻塞（T1持有S(B)） 4. T3: S(C) - 成功 5. T3: X(A) - 阻塞（T1持有S(A)）等待图：T2 → T1, T3 → T1 无环，不存在死锁。 T1提交后： - T2获得X(B)，继续执行X(C) - 阻塞（T3持有S(C)） - T3获得X(A) 最终等待图：T2 → T3

练习5.2 OCC验证考虑三个事务的时间戳和操作：

T1(ts=1): R(A), W(B)
T2(ts=2): R(B), W(C)
T3(ts=3): R(C), W(A)

如果T2先验证，T3后验证，使用向后验证算法，哪个事务会被中止？

提示：检查读集与已提交事务写集的交集

参考答案

T2验证时： - 检查T1的写集{B}与T2的读集{B} - 有交集，T2应该中止如果T2通过验证（假设T1未提交）： T3验证时： - 检查T2的写集{C}与T3的读集{C} - 有交集，T3应该中止结论：在向后验证中，T2和T3都可能被中止，取决于验证时机。

练习5.3 时间戳排序给定数据项初始时间戳：WTS(X)=0, RTS(X)=0 事务序列：

T1(ts=10): R(X)
T2(ts=20): W(X)
T3(ts=15): R(X)
T4(ts=25): W(X)

哪些操作会被拒绝？

提示：比较事务时间戳与数据项时间戳

参考答案

1. T1(10): R(X) - 成功，RTS(X)=10 2. T2(20): W(X) - 成功，WTS(X)=20 3. T3(15): R(X) - 失败（TS(T3)=15 < WTS(X)=20） 4. T4(25): W(X) - 成功，WTS(X)=25 T3被中止，因为它试图读取"未来"的数据。

挑战题

练习5.4 混合并发控制设计设计一个自适应并发控制系统，根据以下指标动态切换策略：

事务中止率
平均响应时间
系统吞吐量

要求：给出状态转换图和切换算法伪代码。

提示：考虑滞后效应避免频繁切换

参考答案

状态转换图： ``` 中止率>30% 2PL ←----------→ OCC ↑ ↓ |中止率<5%| ↓ ↑ MVTO ←----→ TO 吞吐量优先 ``` 切换算法： ```python def adaptive_cc_selector(): history = [] current_strategy = "2PL" while True: metrics = collect_metrics() history.append(metrics) if len(history) < WINDOW_SIZE: continue avg_abort_rate = average(history, 'abort_rate') avg_response_time = average(history, 'response_time') if current_strategy == "2PL": if avg_abort_rate < 0.05 and read_ratio > 0.8: switch_to("OCC") elif long_transactions > 0.3: switch_to("MVTO") elif current_strategy == "OCC": if avg_abort_rate > 0.3: switch_to("2PL") elif version_overhead > threshold: switch_to("TO") # 防止频繁切换 if time_since_last_switch < MIN_INTERVAL: continue ```

练习5.5 热点优化方案某电商系统的商品库存表成为热点，每秒10000次扣减操作。设计一个综合优化方案，包括：

数据结构设计
并发控制策略
缓存方案
降级策略

提示：考虑最终一致性的可接受性

参考答案

综合方案： 1. **数据结构设计**： ```sql -- 主库存表 CREATE TABLE inventory_main ( sku_id BIGINT PRIMARY KEY, total_stock INT, reserved INT, version BIGINT ); -- 分片库存表 CREATE TABLE inventory_shard ( sku_id BIGINT, shard_id INT, stock INT, PRIMARY KEY (sku_id, shard_id) ); ``` 2. **并发控制策略**： - 读操作：MVCC快照读 - 预扣减：OCC + 批量提交 - 最终扣减：分布式事务 3. **缓存方案**： ``` L1: 本地缓存（10ms TTL） L2: Redis（100ms TTL） L3: 数据库写路径：异步写入 + 批量合并读路径：多级缓存fallback ``` 4. **降级策略**： - 限流：令牌桶算法 - 降级：返回"可能有货"，异步确认 - 熔断：队列满时直接失败

练习5.6 死锁预防算法实现Wait-Die和Wound-Wait死锁预防算法，分析它们的优缺点。

提示：基于时间戳的优先级

参考答案

Wait-Die算法： ```python def wait_die(T_requesting, T_holding): if timestamp(T_requesting) < timestamp(T_holding): # 老事务等待年轻事务 wait() else: # 年轻事务死亡（中止） abort(T_requesting) ``` Wound-Wait算法： ```python def wound_wait(T_requesting, T_holding): if timestamp(T_requesting) < timestamp(T_holding): # 老事务伤害年轻事务 abort(T_holding) else: # 年轻事务等待 wait() ``` 比较分析： - Wait-Die：年轻事务频繁重启，但无级联中止 - Wound-Wait：减少重启，但可能级联中止 - 两者都保证无死锁和无饥饿

练习5.7 MVCC垃圾回收设计一个MVCC系统的垃圾回收算法，需要考虑：

确定哪些版本可以安全删除
最小化对活跃事务的影响
处理长事务问题

提示：维护活跃事务的最小时间戳

参考答案

垃圾回收算法： ```python class MVCCGarbageCollector: def __init__(self): self.min_active_ts = None self.version_chains = {} def update_min_active_ts(self): active_transactions = get_active_transactions() if active_transactions: self.min_active_ts = min(t.start_ts for t in active_transactions) else: self.min_active_ts = current_timestamp() def collect_garbage(self): self.update_min_active_ts() for item_id, versions in self.version_chains.items(): # 保留最新版本 keep_latest = True # 按时间戳降序排序 sorted_versions = sorted(versions, key=lambda v: v.ts, reverse=True) for version in sorted_versions: if keep_latest: keep_latest = False continue # 如果版本时间戳小于最小活跃事务时间戳 if version.ts < self.min_active_ts: # 检查是否有更新的版本 if has_newer_version(version): mark_for_deletion(version) def handle_long_transactions(self): for txn in get_active_transactions(): if txn.duration > LONG_TXN_THRESHOLD: # 强制创建快照 create_snapshot_for_transaction(txn) # 允许GC继续 exclude_from_min_ts_calculation(txn) ``` 优化策略： 1. 后台异步GC 2. 分区独立GC 3. 自适应GC频率

常见陷阱与错误

1. 锁粒度选择不当

错误：盲目使用细粒度锁

问题：管理开销超过并发收益
症状：CPU利用率高但吞吐量低

正确做法：根据访问模式选择合适粒度

2. 忽视锁升级的副作用

错误：频繁触发锁升级

问题：突然的并发度下降
症状：性能抖动

正确做法：监控锁升级频率，调整阈值或优化查询

3. OCC重试风暴

错误：高冲突场景使用OCC

问题：大量事务反复重试
症状：延迟激增，CPU空转

正确做法：设置重试上限，自动降级到悲观锁

4. 时间戳分配瓶颈

错误：使用全局计数器

问题：成为系统瓶颈
症状：所有事务在时间戳分配处排队

正确做法：使用分布式时间戳或混合方案

5. MVCC版本链过长

错误：不及时回收旧版本

问题：内存爆炸，查询性能下降
症状：版本链遍历时间增长

正确做法：积极的垃圾回收，限制长事务

6. 死锁检测开销过大

错误：每次锁请求都检测死锁

问题：O(n²)复杂度导致性能问题
症状：锁管理器成为瓶颈

正确做法：周期性检测或使用超时机制

7. 热点识别滞后

错误：静态阈值判断热点

问题：无法适应负载变化
症状：真正的热点未被识别

正确做法：动态阈值 + 预测模型

8. 缓存一致性问题

错误：缓存与数据库不一致

问题：读到过期数据
症状：业务逻辑错误

正确做法：Cache-Aside模式 + 版本号验证

调试技巧

性能诊断：
- 监控锁等待时间分布
- 跟踪事务中止原因
- 分析热点数据访问模式
工具使用：
- SHOW ENGINE INNODB STATUS查看锁信息
- 系统表查询活跃事务
- 火焰图分析锁竞争
测试方法：
- 压力测试不同并发级别
- 模拟各种冲突场景
- 长事务影响测试

记住：并发控制没有银弹，理解工作负载特征是选择正确策略的关键。