第2章：电互联的极限与光互联的机遇

本章概述

在AI推理芯片向100T甚至P级算力演进的过程中，芯片间的数据传输已成为决定系统性能的关键瓶颈。本章将深入剖析传统电互联技术面临的物理极限，包括SerDes功耗墙、信号完整性挑战以及铜线传输距离限制。同时，我们将探讨光互联技术如何从根本上突破这些限制，为超大规模AI系统提供高带宽、低功耗、长距离的互联解决方案。通过本章学习，读者将理解为什么光互联是AI芯片发展的必然选择，以及在实际系统设计中如何权衡成本与性能。

2.1 SerDes技术的功耗墙

2.1.1 SerDes功耗演进历程

SerDes（Serializer/Deserializer）作为高速电互联的核心技术，其功耗随着数据率的提升呈现超线性增长。让我们回顾SerDes技术的演进历程：

28G NRZ时代（2015-2018）：功耗约为5-8 pJ/bit
56G PAM4时代（2018-2021）：功耗增至10-15 pJ/bit
112G PAM4时代（2021-2024）：功耗达到15-20 pJ/bit
224G PAM4展望（2024+）：预期功耗将超过25 pJ/bit

这种功耗增长并非线性关系，而是遵循以下经验公式：

$$P_{SerDes} = P_0 \cdot (R/R_0)^{\alpha} + P_{overhead}$$ 其中：

$P_0$ 是基准数据率 $R_0$ 下的功耗
$\alpha$ 是功耗指数，典型值为1.5-2.0
$P_{overhead}$ 是固定开销（PLL、时钟分配等）

2.1.2 功耗构成分析

现代112G PAM4 SerDes的功耗主要由以下几部分构成：

Total Power Budget (典型值: 1.5W per lane)
├── Analog Front-End (40%)
│   ├── Driver (25%)
│   ├── Receiver (10%)
│   └── Clock Recovery (5%)
├── Digital Signal Processing (35%)
│   ├── FFE/DFE (20%)
│   ├── FEC (10%)
│   └── Protocol Logic (5%)
├── PLL & Clock Distribution (15%)
└── I/O & Termination (10%)

2.1.3 功耗墙的系统级影响

对于一个典型的AI推理芯片，假设需要4TB/s的片外带宽：

使用112G SerDes：需要约300个通道
仅SerDes功耗：300 × 1.5W = 450W
占芯片总功耗比例：450W / 700W ≈ 64%

这意味着互联功耗已经超过计算功耗，成为系统设计的主要限制因素。

实际案例分析：NVIDIA H100与功耗分配

以NVIDIA H100为例，其功耗分配展现了SerDes功耗墙的现实影响：

H100 功耗分配（700W TDP）
├── GPU计算核心 (45%, 315W)
│   ├── SM阵列 (280W)
│   └── L2 Cache (35W)
├── HBM3内存接口 (20%, 140W)
├── NVLink 4.0 (18%, 126W)
│   └── 18个Links × 7W/link
├── PCIe 5.0 (7%, 49W)
└── 其他（控制、时钟等）(10%, 70W)

可以看到，NVLink和PCIe等高速互联已占据25%的功耗预算。在多GPU系统中，这个比例会更高：

DGX H100系统：8个GPU全互联，互联功耗>1kW
训练集群：跨节点互联功耗可达系统总功耗的40%

功耗密度的热管理挑战

SerDes的高功耗密度带来严峻的散热挑战： $$\text{功耗密度} = \frac{P_{SerDes} \times N_{lanes}}{A_{die}} > 50 \text{ W/mm}^2$$ 这已接近先进封装的散热极限：

风冷散热：~30 W/cm²
液冷散热：~50 W/cm²
浸没式冷却：~100 W/cm²

热密度过高导致的问题：

热节流（Thermal Throttling）：温度超过Tj,max时降频运行
电迁移加速：高温下互连线的MTTF指数下降
时序退化：温度每升高10°C，延迟增加2-3%

2.1.4 技术改进的边际效应递减

尽管业界在持续优化SerDes设计，但改进空间日益缩小：

工艺节点收益递减：从7nm到5nm，SerDes功耗仅降低15-20%
架构创新有限：ADC-based接收器虽然提升了灵活性，但功耗反而增加
信号调制复杂度上升：PAM4到PAM8的跃迁将带来更高的DSP开销

2.2 Copper Reach的物理限制

2.2.1 信道损耗的频率依赖性

铜线传输的根本限制来自于信道损耗随频率的增长，主要包括：

趋肤效应损耗： $$\alpha_{skin} = R_s \sqrt{f} / Z_0$$ 其中 $R_s$ 是表面电阻，与 $\sqrt{f}$ 成正比。

介质损耗： $$\alpha_{dielectric} = \pi f \sqrt{\epsilon_r} \tan\delta / c$$ 总损耗可近似为： $$Loss(dB) = (a\sqrt{f} + bf) \cdot L$$ 对于典型的PCB材料（FR4），在28GHz（56Gbps NRZ）：

损耗约为1.2 dB/inch
10英寸传输距离损耗达12dB
需要复杂的均衡技术才能恢复信号

2.2.2 串扰与信号完整性

高密度互联场景下，串扰成为主要限制：

Signal Trace Layout (Top View)
━━━━━━━━━━━━━━━━━━━━━━━━━━━  Aggressor 1
    ↓ NEXT    ↓ FEXT
━━━━━━━━━━━━━━━━━━━━━━━━━━━  Victim
    ↑ NEXT    ↑ FEXT  
━━━━━━━━━━━━━━━━━━━━━━━━━━━  Aggressor 2

Spacing: 2×trace_width (典型设计规则)

串扰耦合系数： $$K_{XT} = 20\log_{10}\left(\frac{V_{coupled}}{V_{aggressor}}\right)$$ 在112G PAM4系统中，要求串扰低于-30dB，这严重限制了走线密度。

2.2.3 传输距离的实际限制

不同应用场景下的铜线reach限制：

| 数据率 | 芯片内 | 封装内 | PCB板级 | 背板 | 线缆 |

数据率	芯片内	封装内	PCB板级	背板	线缆
56G	20mm	50mm	200mm	500mm	1m
112G	10mm	25mm	100mm	250mm	0.5m
224G	5mm	12mm	50mm	-	-

这些限制直接影响了系统架构的设计空间。

信道损耗补偿技术的极限

为了延长传输距离，业界采用了多种补偿技术，但每种都有其物理极限：

前向均衡（FFE）

FFE传递函数：H(z) = Σ(n=-N1 to N2) cn·z^(-n)

优点：预补偿高频损耗
限制：放大噪声，增加峰值功率需求
实际极限：~15dB补偿

判决反馈均衡（DFE）

DFE输出：y[n] = x[n] + Σ(k=1 to M) bk·d[n-k]

优点：不放大噪声
限制：错误传播，不能补偿前标ISI
实际极限：~20dB补偿

连续时间线性均衡（CTLE） - 模拟域高频增益提升 - 限制：功耗随增益指数增长 - 实际极限：~10dB@Nyquist频率

即使综合使用这些技术，总补偿能力也限制在30-35dB，对应的最大传输距离受限于： $$L_{max} = \frac{35\text{ dB}}{α(f) \text{ dB/inch}}$$

重定时器与中继器的代价

当传输距离超过SerDes的native reach时，需要插入重定时器（Retimer）：

发送端 ══> [Retimer 1] ══> [Retimer 2] ══> ... ══> 接收端
         ↑              ↑              ↑
      +3W/+5ns      +3W/+5ns      +3W/+5ns

重定时器的问题：

功耗累加：每个重定时器消耗2-3W
延迟累加：每级增加3-5ns延迟
成本增加：每个重定时器成本$20-50
可靠性降低：增加故障点
管理复杂：需要额外的配置和监控

实际系统的距离瓶颈案例

案例1：AI训练服务器内部互联

GPU到GPU距离：~300mm（跨主板）
112G SerDes无法直达，需要：
方案A：降速到56G（带宽减半）
方案B：使用重定时器（功耗+30W）
方案C：改用光互联（成本+$500）

案例2：数据中心TOR到Spine连接

机架顶到列头距离：10-30m
电缆解决方案：
56G DAC：最长3m，不可行
56G AOC：可达30m，但成本$300/根
需要400根线缆，总成本$120K

案例3：分解式架构的内存池

计算节点到内存池：2-5m
CXL 32GT/s over copper：最长0.5m
必须使用光学延长器或重新设计机架布局

2.3 光互联的基本原理与优势

2.3.1 光传输的物理基础

光信号在光纤中的传输损耗远低于电信号在铜线中的损耗：

单模光纤损耗：

1310nm波长：~0.35 dB/km
1550nm波长：~0.20 dB/km

相比之下，即使1米的铜线在高频下的损耗也超过30dB。这种根本性差异源于：

频率无关性：光纤损耗在工作波长范围内基本恒定
无串扰：光信号在不同光纤/波长间完全隔离
低色散：现代光纤的色散可控制在极低水平

2.3.2 光互联系统架构

典型的芯片级光互联系统包含：

Electrical Domain          Optical Domain           Electrical Domain

   TX Data ──→ [Driver] ──→ [Modulator] ──→ 〰〰〰 ──→ [Detector] ──→ [TIA] ──→ RX Data
                              ↑                                         ↓
                          [Laser Source]                            [CDR/DSP]

关键性能指标：

调制器效率：0.5-2 V·cm (VπL)
探测器响应度：0.8-1.2 A/W
耦合损耗：1-3 dB
激光器功率：10-20 mW

2.3.3 功耗优势分析

光互联的功耗主要集中在电光/光电转换： $$P_{optical} = P_{laser} + P_{mod} + P_{det} + P_{TIA}$$ 典型功耗分解（100G单通道）：

激光器：50mW（可多通道共享）
调制器驱动：30mW
探测器+TIA：20mW
总计：~100mW → 1pJ/bit

相比112G电互联的15-20pJ/bit，功耗降低超过10倍。

2.3.4 带宽密度优势

光互联通过波分复用（WDM）实现超高带宽密度：

Single Fiber with DWDM
λ1: 100G ─┐
λ2: 100G ─┤
λ3: 100G ─┼─→ [MUX] ══════ Fiber ══════ [DEMUX] ─┼─→ λ1: 100G
...       │                                        │    λ2: 100G
λ16: 100G ┘                                        └─→ ... λ16: 100G

Total: 1.6 Tbps per fiber
Fiber diameter: 125 μm
Bandwidth density: >10 Tbps/mm²

相比之下，电互联的带宽密度受限于：

PCB层数限制
串扰隔离要求
过孔密度限制典型值仅为0.1-0.5 Tbps/mm²

WDM技术的带宽扩展潜力

波分复用技术提供了巨大的带宽扩展空间：

CWDM（粗波分复用）

波长间隔：20nm
通道数：4-8
适用场景：短距离、成本敏感

DWDM（密集波分复用）

波长间隔：0.8nm (100GHz) 或 0.4nm (50GHz)
通道数：40-80 (C-band)
扩展潜力：C+L band可达160通道

未来技术

超密集WDM：25GHz间隔，>200通道
空分复用（SDM）：多芯光纤，7-19芯
模分复用（MDM）：少模光纤，3-6个模式

理论带宽计算： $$B_{total} = N_{wavelength} \times N_{mode} \times N_{core} \times R_{per-channel}$$ 示例：80波长 × 6模式 × 7芯 × 400G = 1.344 Pbps单根光缆

光互联在不同尺度的应用

片上光互联网络（ONoC）

Die Layout (10mm × 10mm)
┌────────────────────────────────┐
│ Core  ←→ [E/O] ←→ Waveguide    │
│   ↑         ↓        ↓          │
│ Router ←→ [O/E] ←→ Ring Bus     │
│   ↑         ↓        ↓          │
│ Cache  ←→ [E/O] ←→ Waveguide    │
└────────────────────────────────┘

带宽密度：>100 Tbps/mm²
延迟：<1ns（光速限制）
功耗：<0.1pJ/bit（片上无需激光器功率）

封装级光互联（CPO）

Package Substrate (50mm × 50mm)
┌─────────────────────────────────┐
│  Chiplet A    Optical Layer     │
│     ║          ═══════          │
│     ╚═══>[PIC]═══════>[PIC]═══> │
│            ↑           ↓         │
│        [Laser]    Chiplet B     │
└─────────────────────────────────┘

集成密度：>1000 光I/O per cm²
传输距离：可达50cm
应用：多chiplet互联、内存扩展

机架级光背板

Optical Backplane Architecture
Slot1 ═══╗
Slot2 ═══╬═══ [Optical Switch] ═══╬═══ Slot5
Slot3 ═══╣         ↓               ╠═══ Slot6
Slot4 ═══╝    Reconfigurable      ╚═══ Slot7

无阻塞交换：N×N全连接
重构时间：<μs（MEMS）或<ns（SOA）
扩展性：可达1000+端口

2.3.5 延迟特性分析

光互联的端到端延迟由多个部分组成： $$T_{total} = T_{E/O} + T_{prop} + T_{O/E} + T_{DSP}$$

各部分典型值：

$T_{E/O}$：电光转换 ~100ps
$T_{prop}$：传播延迟 5ns/m
$T_{O/E}$：光电转换 ~100ps
$T_{DSP}$：信号处理 0-500ps（取决于是否使用DSP）

与电互联的延迟对比

| 距离 | 电互联延迟 | 光互联延迟 | 优势 |

距离	电互联延迟	光互联延迟	优势
1mm	6ps	205ps	电优
10cm	600ps	700ps	相当
1m	6ns+DSP(>10ns)	5.2ns	光优
10m	需要多级中继(>50ns)	50.2ns	光优

关键观察：

短距离（<10cm）：电互联延迟更低
中长距离（>1m）：光互联优势明显
电互联需要DSP时：光互联可能在更短距离就有优势

2.3.6 可靠性与信号完整性

光互联在信号完整性方面具有本质优势：

误码率特性 - 原始BER：10^-12 到 10^-15（无FEC） - 后FEC BER：<10^-15 - 对比：电互联通常需要强FEC才能达到10^-12
抗干扰能力 - 电磁免疫：完全不受EMI/RFI影响 - 串扰隔离：>60dB（不同波长/光纤） - 地电位隔离：天然的电气隔离
长期稳定性 - 激光器老化：功率衰减~0.5dB/年 - 光纤老化：可忽略（<0.01dB/年） - 对比：PCB材料老化导致损耗增加1-2dB/年
故障模式分析

光互联故障树
├── 激光器失效 (MTBF: 50,000h)
│   └── 冗余激光器切换
├── 光纤损坏 (MTBF: >100,000h)
│   └── 保护套管+弯曲半径控制
├── 连接器污染 (可清洁)
│   └── 定期维护程序
└── 温度漂移 (可补偿)
    └── 温控或波长锁定

2.4 成本与性能的权衡分析

2.4.1 成本构成对比

光互联与电互联的成本结构存在显著差异：

电互联成本模型：

总成本 = SerDes面积成本 + PCB/封装成本 + 散热成本 + 运营电费
        = N × (A_SerDes × C_Si) + L × C_PCB + P × C_cooling + P × T × C_electricity

光互联成本模型：

总成本 = 光子芯片成本 + 激光器成本 + 封装成本 + 运营电费
        = (A_photonic × C_Si-Ph) + N_laser × C_laser + C_pkg + P × T × C_electricity

关键参数对比（2024年数据）：

SerDes硅片成本：~$0.10/mm² (5nm)
硅光芯片成本：~$0.05/mm² (45nm SOI)
外置激光器：~$50-100/unit
光纤耦合封装：~$20-50/port

2.4.2 总拥有成本(TCO)分析

以100T AI推理系统为例，5年TCO对比：

| 成本项 | 电互联方案 | 光互联方案 |

成本项	电互联方案	光互联方案
初始硬件	$50K	$80K
功耗(5年)	$120K	$40K
散热设施	$30K	$10K
维护更换	$20K	$15K
总TCO	$220K	$145K

盈亏平衡点分析：

带宽 > 1.6 Tbps时，光互联TCO更优
传输距离 > 1m时，光互联成为必选
功耗预算受限场景，光互联具有决定性优势

2.4.3 技术成熟度评估

采用技术成熟度等级(TRL)评估：

| 技术要素 | 电互联 | 光互联 |

技术要素	电互联	光互联
112G SerDes/光引擎	TRL 9	TRL 7-8
224G SerDes/光引擎	TRL 6-7	TRL 8-9
封装集成	TRL 9	TRL 6-7
EDA工具链	TRL 9	TRL 5-6
规模量产	成熟	初期

2.4.4 应用场景选择矩阵

带宽需求
  ↑
10T├─────────────────────────────┐
   │         光互联优选区域        │
   │                              │
1T ├──────────┬──────────────────┤
   │  混合方案 │                   │
   │          │                   │
100G├──────────┴──────────────────┤
   │      电互联优选区域           │
   │                              │
10G└──────────────────────────────┘
    10cm     1m      10m     100m
              传输距离 →

决策准则：

短距离低带宽（<1m, <100G）：电互联成本最优
中等需求（1-10m, 100G-1T）：根据功耗约束选择
长距离高带宽（>10m, >1T）：光互联是唯一选择

实际部署案例分析

案例1：Google TPU v4 Pod

规模：4096个TPU芯片
互联需求：3D Torus拓扑，每芯片6×100G链路
解决方案：
机架内：电互联（<1m）
机架间：光互联（1-30m）
总光纤数：>10,000根
效果：相比全电方案功耗降低40%

案例2：Meta AI Research SuperCluster

规模：16,000个GPU
网络架构：3层Clos网络
技术选择：
GPU岛内：200G HDR InfiniBand（电）
岛间互联：400G光模块
Spine层：全光交换
成本权衡：初始投资增加30%，但3年TCO降低25%

案例3：阿里云CIPU（Cloud Infrastructure Processing Unit）

设计理念：计算存储分离
互联方案：
CIPU内部：112G SerDes（芯片间<5cm）
CIPU到存储：100G光互联（5-50m）
网络加速：RDMA over Converged Ethernet
创新点：动态切换电/光通道based on workload

2.4.5 未来成本趋势预测

基于产业发展趋势，预测2025-2030年成本演变：

光互联成本下降驱动因素

规模效应

年份    出货量      单位成本
2024    10M         $100/100G
2026    50M         $50/100G
2028    200M        $25/100G
2030    1B          $10/100G

技术进步 - 硅光集成度提升：2x/2年 - 激光器效率提升：30%/3年 - 封装自动化：成本降低50%/5年
标准化推动 - UCIe光学扩展（2025） - OIF 112G标准成熟（2024） - CXL 3.0光学物理层（2026）

成本交叉点（Crossover）预测

| 应用场景 | 2024年交叉点 | 2027年预测 | 2030年预测 |

应用场景	2024年交叉点	2027年预测	2030年预测
芯片间	>10m	>3m	>1m
板级	>3m	>1m	>30cm
机架内	>1m	>50cm	>20cm
数据中心	已经交叉	-	-

投资回报期（ROI）分析

# 简化的ROI模型
def calculate_roi(bandwidth_tbps, distance_m, years):
    # 初始成本
    copper_capex = bandwidth_tbps * 50000  # $/Tbps
    optical_capex = bandwidth_tbps * 80000  # $/Tbps

    # 运营成本（每年）
    copper_opex = bandwidth_tbps * 15000 * years  # 功耗+散热
    optical_opex = bandwidth_tbps * 5000 * years

    # 总成本
    copper_total = copper_capex + copper_opex
    optical_total = optical_capex + optical_opex

    # ROI计算
    roi_years = (optical_capex - copper_capex) / 
                (copper_opex/years - optical_opex/years)

    return roi_years

# 示例：10Tbps, 10m距离
# ROI = 1.5年（2024年）
# ROI = 0.8年（2027年预测）

2.4.6 风险因素与缓解策略

技术风险

光源可靠性 - 风险：激光器早期失效 - 缓解：N+1冗余，预测性维护
温度敏感性 - 风险：波长漂移导致串扰 - 缓解：温度补偿，adiabatic设计
工艺成熟度 - 风险：良率不稳定 - 缓解：多供应商策略，设计冗余

市场风险

标准分裂 - 风险：不同标准不兼容 - 缓解：支持多协议，软件定义
供应链集中 - 风险：关键组件依赖单一供应商 - 缓解：投资第二源，战略库存
技术锁定 - 风险：早期投资的技术被淘汰 - 缓解：模块化设计，渐进迁移路径

本章小结

本章深入分析了电互联技术面临的三大物理极限：

SerDes功耗墙：功耗随数据率超线性增长，112G PAM4已达15-20pJ/bit，224G将超过25pJ/bit，互联功耗已超过计算功耗成为系统瓶颈
Copper Reach限制：信道损耗与频率成正比，112G传输距离限制在百毫米级别，高密度场景下串扰进一步限制设计空间
光互联优势： - 功耗降低10倍以上（<2pJ/bit） - 传输距离提升1000倍（公里级别） - 带宽密度提升20倍（>10Tbps/mm²）
成本权衡：虽然光互联初始成本较高，但在高带宽（>1.6T）、长距离（>1m）场景下，5年TCO可降低35%

关键公式回顾：

SerDes功耗：$P = P_0(R/R_0)^{\alpha} + P_{overhead}$
铜线损耗：$Loss = (a\sqrt{f} + bf) \cdot L$
光互联功耗：$P_{optical} = P_{laser} + P_{mod} + P_{det} + P_{TIA}$

练习题

基础题

2.1 计算题：某AI芯片需要2TB/s的片外带宽，分别计算使用56G NRZ、112G PAM4和光互联方案所需的通道数和预期功耗。

提示

考虑PAM4相比NRZ的频谱效率提升，以及不同技术的pJ/bit指标。

答案

56G NRZ方案：
通道数：2TB/s ÷ 56Gb/s = 286个通道
功耗：286 × 56Gb/s × 8pJ/bit = 128W
112G PAM4方案：
通道数：2TB/s ÷ 112Gb/s = 143个通道
功耗：143 × 112Gb/s × 18pJ/bit = 288W
光互联方案（假设100G/λ，16λ WDM）：
光纤数：2TB/s ÷ 1.6Tb/s = 10根光纤
功耗：160 × 100Gb/s × 1.5pJ/bit = 24W

结论：虽然光互联需要的物理通道最少，功耗也最低，仅为PAM4方案的8.3%。

2.2 分析题：解释为什么SerDes功耗与数据率呈超线性关系，列出至少三个主要原因。

提示

考虑均衡器复杂度、时钟频率、信号摆幅等因素。

答案

SerDes功耗超线性增长的主要原因：

均衡器复杂度增加：高频损耗以sqrt(f)增长，需要更多FFE/DFE抽头，DSP复杂度呈O(n²)增长
时钟功耗上升：PLL功耗与频率成正比，时钟分配网络功耗与f×C×V²成正比
信噪比要求提高：PAM4相比NRZ，电平间距减小，需要更高的发送功率和更复杂的接收器
前向纠错开销：高速传输BER增加，需要更强的FEC（如RS-FEC），增加15-20%功耗
工艺限制：晶体管ft/fmax限制，高频下需要更大尺寸的器件，静态功耗增加

2.3 概念题：列出光纤传输相比铜线传输的五个关键优势，并简要说明物理原理。

提示

从损耗、带宽、串扰、EMI、传输距离等角度思考。

答案

光纤传输的关键优势：

超低损耗：0.2dB/km@1550nm，因为光子不与介质电子相互作用，仅有瑞利散射损耗
频率无关性：在工作波长窗口内损耗恒定，不存在趋肤效应和介质损耗的频率依赖
无电磁串扰：光信号在不同纤芯/波长间完全隔离，不产生电磁耦合
超大带宽：单模光纤带宽>100THz，通过WDM可充分利用光谱资源
抗EMI干扰：光信号不受外界电磁场影响，适合恶劣电磁环境
长距离传输：配合光放大器可实现数千公里无中继传输

挑战题

2.4 系统设计题：设计一个AI训练集群的互联方案，要求：8个GPU节点，每节点需要400GB/s全连接带宽，节点间距离20m。对比纯电、纯光和混合方案的可行性。

提示

考虑不同距离scale的技术选择，以及all-to-all通信模式的特殊要求。

答案

需求分析：

总带宽：8节点×400GB/s = 3.2TB/s的交换容量
物理约束：20m距离超出112G电互联能力范围

方案对比：

纯电方案：不可行 - 112G PAM4在20m仅能通过昂贵的Active Cable - 需要约230个通道，成本>$50K/节点 - 功耗>500W/节点仅用于互联
纯光方案：技术可行但成本高 - 使用800G光模块，每节点需5个 - 成本：$3K×5×8 = $120K - 功耗：80W/节点 - 优势：可扩展至更大规模
混合方案（推荐）： - 节点内：电互联（GPU-GPU使用NVLink） - 机架内：中距离电互联或AOC（<3m） - 机架间：光互联（>3m） - 拓扑：2层fat-tree，光交换机做spine - 成本：$60K（平衡初始投资） - 功耗：120W/节点

结论：混合方案在成本、功耗和可扩展性间达到最佳平衡。

2.5 分析题：未来5年，哪些技术突破可能改变电互联vs光互联的竞争格局？分析至少三种可能性。

提示

考虑新材料、新器件、新架构等维度。

答案

可能改变竞争格局的技术突破：

线性驱动光学（LPO/LRO）成熟 - 影响：去除DSP，光互联功耗降至0.5pJ/bit - 时间线：2025-2026年规模商用 - 结果：光互联成本下降50%，加速替代中短距电互联
先进封装技术突破 - Glass基板+混合键合实现超细间距（<1μm） - 影响：Chiplet间电互联密度提升10倍 - 时间线：2027年后 - 结果：延长电互联在超短距（<5mm）的生命周期
片上激光器集成 - III-V族异质集成或硅基激光器突破 - 影响：消除外置激光器成本 - 时间线：2028年后 - 结果：光互联成本降低30-40%，进入消费级应用
新型调制技术 - 等离子体调制器、石墨烯调制器 - 影响：调制器尺寸缩小100倍，功耗降低50% - 时间线：2030年后 - 结果：实现真正的片上光互联网络
量子/相干通信 - 相干检测+高阶调制（16-QAM） - 影响：单波长速率达1.6T - 时间线：数据中心2026年，芯片级2030年后 - 结果：光互联带宽密度再提升10倍

关键观察：光互联的技术进步速度明显快于电互联，成本下降曲线更陡峭，预计2027年前后达到大规模替代的拐点。

2.6 开放思考题：如果量子计算机需要与经典计算机高速互联，应该选择电互联还是光互联？说明理由。

提示

考虑量子计算机的工作温度、噪声敏感性、接口特性等。

答案

量子-经典互联应选择光互联，理由如下：

物理隔离需求：

量子比特工作在mK温度，经典计算在室温
光纤提供完美的热隔离，电缆会传导热量
光信号不产生电磁噪声，不干扰量子态

技术匹配性：

许多量子比特本身基于光子
量子-经典转换自然产生光信号
单光子探测器技术成熟

带宽需求特性：

量子纠错需要极低延迟（<μs）
测量数据量大（每个量子门产生MB级数据）
光互联提供确定性低延迟

系统架构考虑：

稀释制冷机内部空间极其有限
光纤占用空间远小于同等带宽的电缆
可通过WDM复用减少物理连接数

未来扩展性：

分布式量子计算需要量子态传输
光子是量子态的理想载体
光互联可平滑演进到量子互联

挑战：需要开发耐低温的光电转换器件，以及优化的协议栈来处理量子-经典接口的特殊需求。

预期架构：量子处理器→低温光电转换→光纤→室温光电转换→经典控制器

常见陷阱与错误（Gotchas）

G1. SerDes功耗估算错误

陷阱：仅考虑datasheet上的典型功耗，忽略实际系统中的额外开销 正确做法：加入20-30%的margin，考虑PVT变化、重传功耗、管理开销

G2. 光互联成本计算遗漏

陷阱：只计算光模块成本，忽略激光器寿命、维护成本 正确做法：激光器MTBF约50K小时，需计入更换成本；考虑备份激光器

G3. 传输距离估算过于乐观

陷阱：使用理想信道模型，忽略连接器、过孔、转接损耗 正确做法：实际损耗 = 理论损耗 + 3dB（连接器）+ 1dB/过孔

G4. 带宽计算忽略协议开销

陷阱：用原始带宽计算，忽略8b/10b、FEC、协议开销 正确做法：有效带宽 = 原始带宽 × 0.8（编码）× 0.85（FEC）× 0.9（协议）

G5. 功耗密度超过散热能力

陷阱：局部SerDes密度过高，超过封装散热能力 正确做法：控制功耗密度<40W/cm²，采用交错布局分散热点

G6. 光纤弯曲半径违规

陷阱：光纤布线弯曲半径过小，导致额外损耗甚至断裂 正确做法：单模光纤最小弯曲半径>15mm，使用专门的光纤管理方案

最佳实践检查清单

系统架构设计阶段

[ ] 明确带宽需求：峰值、平均值、突发特性
[ ] 评估传输距离：芯片内、板级、机架内、机架间
[ ] 功耗预算分配：为互联预留足够功耗空间
[ ] 成本模型建立：包含CAPEX和OPEX的完整TCO
[ ] 技术选型矩阵：根据距离-带宽选择合适技术
[ ] 扩展性规划：预留50%以上的带宽扩展空间

电互联设计要点

[ ] 信道仿真验证：使用3D EM仿真验证高速信号完整性
[ ] SerDes配置优化：根据实际信道调整均衡参数
[ ] 电源完整性：每个SerDes配置独立的电源滤波
[ ] 热仿真验证：确保最坏情况下Junction温度<105°C
[ ] 测试性设计：预留眼图测试点和PRBS测试模式

光互联设计要点

[ ] 激光器冗余：关键链路配置1+1激光器备份
[ ] 功率预算：预留3dB功率余量应对老化
[ ] 偏振管理：使用偏振无关器件或偏振分集
[ ] 温度补偿：激光器和MUX/DEMUX温度控制
[ ] 清洁度控制：制定光纤端面清洁流程
[ ] 监控告警：配置光功率监控和预警机制

性能验证

[ ] BER测试：全温度范围PRBS31测试，BER<1e-15
[ ] 延迟测试：测量并优化端到端延迟
[ ] 带宽测试：验证持续带宽和突发性能
[ ] 互操作测试：验证与第三方设备的兼容性
[ ] 可靠性测试：HTOL、温循、振动等可靠性验证
[ ] 规模验证：多链路并行工作的系统级验证