chip_packaging_interconnect

第6章：Chiplet设计理念与经济学

本章导读

Chiplet架构代表了半导体产业的范式转变，从追求单片集成转向模块化设计。本章深入探讨Chiplet的设计理念、经济学模型和产业影响。我们将分析为什么Chiplet成为后摩尔时代的关键技术路径，如何通过数学模型评估Chiplet方案的经济性，以及如何制定最优的芯片分解策略。通过AMD Zen架构的详细案例分析，您将理解Chiplet如何在实践中创造价值。

学习目标：

理解Chiplet架构的历史背景和发展动力
掌握良率模型和成本分析方法
学会评估Chiplet vs 单片设计的权衡
了解IP复用和供应链管理策略
能够为特定应用制定Chiplet分解方案

6.1 Chiplet起源与发展历程

6.1.1 多芯片模块（MCM）时代

Chiplet的概念并非全新，其根源可追溯到1970年代的多芯片模块（Multi-Chip Module, MCM）技术。早期的MCM主要用于高性能计算系统，如IBM System/390大型机。

MCM演进时间线：
1970s: IBM开发陶瓷MCM用于大型机
1990s: DEC Alpha 21164采用MCM-D技术
2000s: Intel Pentium Pro集成CPU+L2 Cache
2010s: 2.5D/3D封装技术成熟
2017: AMD EPYC开启现代Chiplet时代
2020s: UCIe标准化推动生态发展

6.1.2 现代Chiplet的诞生

现代Chiplet概念的形成源于三个关键驱动力：

制程成本爆炸：先进制程的掩膜成本指数级增长 $C_{mask}(N) = C_0 \cdot 2^{(N-28)/8}$ 其中$N$为工艺节点（nm），$C_0$为28nm节点基准成本
良率瓶颈：大型芯片良率随面积急剧下降 $Y = Y_0 \cdot e^{-D_0 \cdot A}$ 其中$Y_0$为理想良率，$D_0$为缺陷密度，$A$为芯片面积
异构集成需求：不同功能模块最优工艺节点不同
- 逻辑电路：追求最先进制程
- 模拟/IO：成熟制程即可满足
- 内存：专用工艺优化

6.1.3 Chiplet定义与特征

DARPA CHIPS（Common Heterogeneous Integration and IP Reuse Strategies）项目给出的Chiplet定义：

Chiplet是预先设计、验证并经过测试的模块化芯片，通过标准化接口实现die-to-die互联，可组合成更大的系统。

关键特征：

模块化：功能独立，接口标准
可复用：跨产品、跨代际复用
异构集成：不同工艺、不同供应商
已知良品（KGD）：封装前完成测试

传统SoC vs Chiplet架构对比：

传统SoC（单片集成）：
┌─────────────────────────────┐
│  CPU  │  GPU  │  IO  │ DRAM │  800mm²@5nm
└─────────────────────────────┘
成本：$500/die，良率：30%

Chiplet架构：
┌─────┐ ┌─────┐ ┌────┐ ┌────┐
│ CPU │ │ GPU │ │ IO │ │DRAM│  4×200mm²
└─────┘ └─────┘ └────┘ └────┘  CPU/GPU@5nm
   ↓       ↓       ↓      ↓     IO@14nm
 ╔═══════════════════════════╗  DRAM@专用
 ║      Silicon Interposer   ║
 ╚═══════════════════════════╝
成本：$320/系统，良率：85%

6.2 摩尔定律终结与解决方案

6.2.1 摩尔定律的多重挑战

摩尔定律面临物理、经济和架构三重限制：

物理极限：

晶体管尺寸接近原子级别（3nm ≈ 15个硅原子）
量子隧穿效应导致漏电急剧增加
功率密度接近核反应堆水平（>100W/cm²）

经济极限（摩尔第二定律）： 晶圆厂建设成本遵循： $C_{fab}(N) = C_{fab}(N_{prev}) \times 1.5$

3nm晶圆厂投资：>200亿美元
设计成本：5nm芯片>5亿美元
投资回报期延长至>5年

架构极限（Dark Silicon）： Dennard Scaling失效后，功耗密度限制导致： $\text{Active Ratio} = \frac{P_{budget}}{P_{density} \times A_{total}}$

在固定功耗预算下，只有部分晶体管可同时工作。

6.2.2 后摩尔时代的技术路径

面对摩尔定律放缓，产业界探索多条技术路径：

技术路径对比矩阵：

路径          | 性能提升 | 成本增加 | 技术成熟度 | 适用场景
-------------|---------|---------|-----------|----------
More Moore   | ★★☆☆☆  | ★★★★★  | ★★★☆☆    | 高端处理器
More than    | ★★★★☆  | ★★☆☆☆  | ★★★★☆    | 数据中心
Moore(Chiplet)|         |         |           |
专用架构(DSA) | ★★★★★  | ★★★☆☆  | ★★★☆☆    | AI/加密
新材料/器件   | ★★★☆☆  | ★★★★☆  | ★☆☆☆☆    | 研究阶段
量子计算      | ★★★★★  | ★★★★★  | ★☆☆☆☆    | 特定算法

6.2.3 Chiplet作为系统级摩尔定律

Chiplet实现”系统级摩尔定律”的关键机制：

功能分解优化：每个模块采用最适合的工艺节点 $\text{Cost}_{optimal} = \sum_{i} A_i \times C_{process}(N_i)$ 其中$N_i$为模块$i$的最优工艺节点
复用放大效应：设计成本分摊到多个产品 $\text{Cost}_{per\_product} = \frac{C_{design}}{N_{products} \times V_{volume}}$
良率乘数效应：小芯片良率远高于大芯片 $Y_{system} = \prod_{i} Y_i \gg Y_{monolithic}$

6.3 大芯片制造的良率挑战

6.3.1 缺陷密度与良率模型

半导体制造中的随机缺陷遵循泊松分布，良率计算使用Murphy模型：

\[Y = \left[\frac{1 - e^{-D_0 \cdot A}}{D_0 \cdot A}\right]^2\]

更精确的负二项分布模型（考虑缺陷聚集）： $Y = \left(1 + \frac{D_0 \cdot A}{\alpha}\right)^{-\alpha}$

其中：

$D_0$：平均缺陷密度（defects/cm²）
$A$：芯片面积（cm²）
$\alpha$：聚集参数（典型值2-5）

6.3.2 面积与良率的关系

以5nm工艺为例（$D_0 = 0.1$ defects/cm²，$\alpha = 3$）：

芯片面积vs良率关系：

面积(mm²) | 良率(%) | 良品数/晶圆 | 相对成本
---------|---------|------------|----------
100      | 93.2    | 620        | 1.0×
200      | 86.5    | 287        | 2.2×
400      | 74.5    | 124        | 5.0×
600      | 64.1    | 71         | 8.7×
800      | 55.2    | 46         | 13.5×

6.3.3 边缘效应与晶圆利用率

大芯片还面临晶圆边缘损失：

\[N_{dies} = \frac{\pi r^2}{A_{die}} - \frac{2\pi r}{\sqrt{A_{die}}}\]

其中$r$为晶圆半径（150mm for 300mm晶圆）。

晶圆利用率分析（300mm晶圆）：

Die尺寸  | 理论最大 | 考虑边缘 | 利用率
---------|---------|---------|--------
10×10mm  | 706     | 660     | 93.5%
20×20mm  | 176     | 153     | 86.9%
26×33mm  | 82      | 64      | 78.0%
30×30mm  | 78      | 58      | 74.4%

6.3.4 系统性良率损失

除随机缺陷外，大芯片还面临系统性挑战：

光刻套准误差：随距离增加累积
CMP平坦度：大面积均匀性差
应力/翘曲：影响后道封装良率
测试覆盖率：测试时间与成本急剧增加

6.4 Chiplet经济学模型

6.4.1 成本分析框架

Chiplet系统总成本包含多个组成部分：

\[C_{total} = C_{chiplets} + C_{interposer} + C_{assembly} + C_{test} + C_{yield\_loss}\]

详细展开：

\[C_{chiplets} = \sum_{i} \left(\frac{C_{wafer}(N_i)}{Y_i \times N_{die\_per\_wafer}(A_i)} + C_{test\_die}\right)\] \[C_{interposer} = \frac{C_{wafer\_interposer}}{Y_{interposer} \times N_{interposer\_per\_wafer}}\] \[C_{assembly} = C_{bump} \times N_{bumps} + C_{integration} + C_{substrate}\]

6.4.2 单片vs Chiplet成本对比

案例：600mm²高性能处理器

单片方案（5nm）：

芯片面积：600mm²
良率：55%（使用负二项模型）
晶圆成本：$17,000
每晶圆良品数：~40
单芯片成本：$425

Chiplet方案：

4×计算chiplet（5nm，100mm²每个）
1×IO die（14nm，200mm²）
2.5D封装（硅中介层）

成本计算：

计算chiplet成本：
- 单个良率：93%
- 单个成本：$17,000/(620×0.93) = $29.5
- 4个总成本：$118

IO die成本：
- 良率：95%（14nm成熟工艺）
- 成本：$6,000/(280×0.95) = $22.6

封装成本：
- 硅中介层：$80
- 集成封装：$60

总成本：$118 + $22.6 + $80 + $60 = $280.6
成本降低：34%

6.4.3 成本优化策略

1. Known Good Die (KGD)策略

通过预测试确保只封装良品： $Y_{system} = \prod_{i=1}^{n} P(KGD_i)$

其中$P(KGD_i)$是第$i$个chiplet为已知良品的概率。

2. 冗余设计

添加备用chiplet提高系统良率： $Y_{with\_redundancy} = \sum_{k=n}^{n+r} \binom{n+r}{k} p^k (1-p)^{n+r-k}$

其中$n$是所需chiplet数，$r$是冗余数。

3. Binning策略

不同性能等级的产品共享chiplet：

高端产品：4个高频chiplet
中端产品：2个高频+2个标频chiplet  
入门产品：4个标频chiplet

6.4.4 总拥有成本（TCO）分析

数据中心环境下的5年TCO：

\[TCO = C_{acquisition} + C_{power} \times T + C_{cooling} + C_{maintenance}\]

成本项目	单片设计	Chiplet设计	节省
采购成本	$15,000	$12,000	20%
电力成本	$8,000	$7,200	10%
散热成本	$3,000	$2,700	10%
维护成本	$2,000	$1,800	10%
总TCO	$28,000	$23,700	15.4%

6.5 IP复用策略与供应链管理

6.5.1 Chiplet IP生态系统

IP分类与特征

Chiplet IP按功能和标准化程度分类：

IP类型	标准化程度	复用潜力	典型供应商
CPU核心	高	高	ARM, RISC-V
GPU/AI加速器	中	中	NVIDIA, AMD
内存控制器	高	高	Synopsys, Cadence
SerDes/PHY	高	高	Rambus, Synopsys
定制逻辑	低	低	内部开发

接口标准化的重要性

成功的IP复用需要多层标准化：

物理层：电气特性、凸点间距、功耗
链路层：协议、流控、错误处理
传输层：路由、QoS、虚拟通道
软件层：驱动接口、配置API

6.5.2 Make vs Buy决策模型

IP获取策略决策矩阵：

战略重要性
    高 │  自主开发    合作开发
       │   (核心IP)   (战略IP)
       │
    中 │  授权使用    外购定制
       │  (标准IP)   (半定制IP)
       │  
    低 │  直接采购    开源方案
       │  (商品IP)   (社区IP)
       └──────────────────────→
          低    中    高   技术差异化

总拥有成本（TCO）评估

\[TCO_{IP} = C_{license} + C_{integration} + C_{verification} + C_{support} + C_{opportunity}\]

其中：

$C_{license}$：授权费用（一次性+版税）
$C_{integration}$：集成开发成本
$C_{verification}$：验证测试成本
$C_{support}$：技术支持和维护
$C_{opportunity}$：机会成本（time-to-market）

6.5.3 供应链风险管理

多源策略（Multi-sourcing）

降低供应链风险的关键策略：

设计可移植性
- 避免工艺特定优化
- 使用标准单元库
- 保持多个PDK就绪

供应商多元化

主供应商（60%）：成本优化
备用供应商（30%）：产能保障
战略储备（10%）：应急响应

库存策略 $I_{optimal} = \sqrt{\frac{2 \times D \times S}{H}}$ 其中$D$是需求率，$S$是订购成本，$H$是持有成本。

6.5.4 IP版本管理与演进

版本兼容性矩阵

版本	v1.0	v1.1	v2.0	v3.0
v1.0	✓	✓	△	✗
v1.1	✓	✓	△	✗
v2.0	△	△	✓	△
v3.0	✗	✗	△	✓

✓完全兼容 △需要适配层 ✗不兼容

演进路线图管理

Q1: UCIe 1.0支持
Q3: 功耗优化(-20%)
Q1: UCIe 1.1升级
Q3: 面积优化(-15%)
Q1: 下一代架构

6.6 案例分析：AMD Zen架构成本收益分析

6.6.1 AMD EPYC的架构演进

第一代EPYC（Naples, 14nm, 2017）

架构：4×Zeppelin Die (MCM)
┌─────────┬─────────┐
│  Die 0  │  Die 1  │  每个die：
│ 8C/16T  │ 8C/16T  │  - 213mm²
├─────────┼─────────┤  - 8核Zen
│  Die 2  │  Die 3  │  - 2通道DDR4
│ 8C/16T  │ 8C/16T  │  - 32 PCIe
└─────────┴─────────┘  
Infinity Fabric互联（42.7GB/s）

第二代EPYC（Rome, 7nm+14nm, 2019）

革命性CCD+IOD架构：
     ┌─────────────────┐
     │   IO Die (14nm)  │  IOD：416mm²
     │  ┌───┬───┬───┐  │  - 内存控制器
     │  │CCD│CCD│CCD│  │  - PCIe 4.0
     │  ├───┼───┼───┤  │  - Infinity Fabric
     │  │CCD│...│CCD│  │  CCD：74mm²×8
     │  └───┴───┴───┘  │  - 8核Zen2
     └─────────────────┘  - 32MB L3

第三代EPYC（Milan, 7nm+14nm, 2021）

架构优化但保持相同封装：

Zen3核心（IPC +19%）
统一32MB L3缓存
改进的Infinity Fabric

6.6.2 成本效益分析

制造成本对比（估算）

Rome 64核 vs Intel Xeon 28核：

组件	AMD成本	Intel成本
计算芯片	8×$30=$240	1×$350=$350
IO芯片	1×$40=$40	(集成)
封装	$100	$50
测试	$30	$25
总计	$410	$425

性能价格比优势

性能指标对比（相对值）：
指标        | EPYC Rome | Xeon 8280 | EPYC优势
-----------|-----------|-----------|----------
核心数      | 64        | 28        | 2.29×
内存带宽    | 204.8GB/s | 131.6GB/s | 1.56×
PCIe通道    | 128       | 48        | 2.67×
TDP        | 280W      | 205W      | 0.73×(更高)
价格       | $6,950    | $10,009   | 0.69×(更低)
性能/美元   | 基准      | 0.48×     | 2.08×

6.6.3 市场影响

服务器CPU市场份额变化

AMD服务器市场份额演进：
Q1 (pre-EPYC)：  0.8%  ▌
Q1 (Naples)：    4.2%  ████▌
Q1 (pre-Rome)：  3.4%  ███▌
Q1 (Rome)：      7.1%  ███████
Q1 (Milan)：    10.7%  ███████████
Q1：            15.3%  ███████████████▌
Q1 (Genoa)：    23.6%  ████████████████████████
Q1：            31.4%  ███████████████████████████████▌

6.6.4 关键成功因素

技术优势
- Infinity Fabric提供充足带宽
- 7nm工艺领先Intel 2年
- Chiplet实现更高核心数
经济优势
- 良率优势降低成本
- 灵活的产品线配置
- 快速迭代能力
生态系统
- 软件兼容性（x86）
- 云服务商采用
- OEM支持扩大

6.6.5 经验教训

成功经验：

渐进式创新降低风险
标准化接口确保兼容性
成本优势转化为市场份额

挑战与解决：

NUMA延迟：软件优化+硬件改进
功耗分布：改进的电源管理
初期良率：快速学习曲线

本章小结

Chiplet架构是后摩尔时代的关键技术路径，通过模块化设计实现了技术和经济的双重优化。本章要点回顾：

核心概念：

良率经济学：大芯片良率指数下降，Chiplet通过分解提升系统良率
异构集成：不同功能采用最适合的工艺节点
IP复用：设计成本分摊，加速产品迭代
供应链弹性：多源供应，降低地缘风险

关键公式：

良率模型：$Y = (1 + \frac{D_0 \cdot A}{\alpha})^{-\alpha}$
系统成本：$C_{total} = \sum C_{chiplet} + C_{package} + C_{assembly}$
IP复用价值：$V_{reuse} = N_{products} \times (C_{dev} - C_{integration})$

设计权衡：

分解粒度：平衡良率收益与封装开销
接口标准：互操作性vs性能优化
供应链策略：成本vs韧性

练习题

基础题

题目6.1 某公司计划开发400mm²的AI处理器，7nm工艺缺陷密度为0.12 defects/cm²，α=3。如果分解为4个100mm²的chiplet，计算：

单片设计的良率
Chiplet系统的良率（假设100%KGD）
如果7nm晶圆成本$17,000，每个方案的芯片成本

提示

使用负二项分布良率模型，注意单位转换。计算晶圆上的die数量时考虑300mm晶圆。

答案

1. 单片良率： $Y_{mono} = (1 + \frac{0.12 \times 4}{3})^{-3} = 0.577$ (57.7%) 2. Chiplet良率：单个：$Y_{chip} = (1 + \frac{0.12 \times 1}{3})^{-3} = 0.885$ (88.5%) 系统：$Y_{sys} = 0.885^4 = 0.614$ (61.4%) 3. 成本计算： - 单片：die数=153，良品=88，成本=$193/chip - Chiplet：die数=620，良品=549，成本=4×$31=$124/system 成本降低：36%

题目6.2 解释为什么UCIe标准对Chiplet生态系统至关重要？列出至少3个关键价值点。

提示

考虑互操作性、生态系统、成本等方面。

答案

UCIe标准的关键价值： 1. **互操作性**：不同供应商的chiplet可以无缝集成 2. **降低集成成本**：标准化接口减少定制开发 3. **加速创新**：专业供应商可专注核心竞争力 4. **扩大市场**：中小企业可参与chiplet生态 5. **风险降低**：避免vendor lock-in

题目6.3 某chiplet IP开发成本$30M，计划用于3个产品线，年销量分别为5万、10万、8万。计算3年的NRE摊销成本（贴现率8%）。

提示

考虑资金时间价值，使用NPV方法。

答案

年销量总计：23万片 3年NPV系数：1 + 0.926 + 0.857 = 2.783 等效销量：23万 × 2.783 = 64万片每片NRE摊销：$30M / 640K = $46.88 如果不复用（每产品独立开发）： - 产品1：$30M/(5万×2.783) = $215.63/片 - 产品2：$30M/(10万×2.783) = $107.82/片 - 产品3：$30M/(8万×2.783) = $134.77/片复用节省：56-78%

挑战题

题目6.4 设计一个1200mm²的HPC处理器的Chiplet方案，包括：

架构分解（计算、IO、内存控制器）
工艺节点选择理由
封装技术选择
成本和性能权衡分析

假设条件：

5nm: D=0.15/cm², 晶圆$18,000
7nm: D=0.10/cm², 晶圆$15,000
12nm: D=0.05/cm², 晶圆$8,000

提示

考虑HPC的特点：高计算密度、高内存带宽、功耗密度挑战。

答案

**建议方案：** 1. **架构分解：** - 8×计算chiplet (5nm, 100mm²)：最高性能 - 4×HBM控制器 (7nm, 50mm²)：平衡性能/成本 - 1×IO hub (12nm, 200mm²)：成熟工艺足够 2. **工艺选择理由：** - 计算：5nm获得最高晶体管密度和能效 - HBM控制器：7nm平衡PHY性能和成本 - IO：12nm满足PCIe 5.0/CXL需求 3. **封装：CoWoS-S** - 支持HBM集成 - 提供>5TB/s die间带宽 - 成本~$300 4. **成本分析：** ``` 计算chiplet: 8×$35 = $280 HBM控制器: 4×$20 = $80 IO hub: $25 封装: $300 总计: $685 vs 单片(如果可能): ~$2000 节省: 66% ``` 5. **性能考虑：** - Die间延迟：~20ns (可接受) - 功耗开销：+15W (Chiplet互联) - 内存带宽：4×HBM3 = 3.2TB/s

题目6.5 作为初创公司CTO，你有$100M预算开发edge AI产品线。设计一个Chiplet IP战略，包括自研vs外购决策、复用策略、风险管理。

提示

考虑初创公司的资源限制、time-to-market压力、差异化需求。

答案

**Chiplet IP战略：** 1. **核心竞争力识别：** - 自研：AI加速器架构（差异化） - 外购：CPU核心、内存控制器 - 合作：高速SerDes 2. **产品规划：** ``` 基础AI chiplet (50mm²): $30M开发增强AI chiplet (100mm²): $20M增量 Edge IO chiplet (40mm²): $15M 共用CPU chiplet: $5M授权 ``` 3. **复用矩阵：** | 产品 | AI基础 | AI增强 | Edge IO | CPU | |------|--------|--------|---------|-----| | 入门 | 1× | - | 1× | 1× | | 主流 | 2× | - | 1× | 1× | | 高端 | - | 2× | 2× | 2× | 4. **风险管理：** - 技术：分阶段验证，MVP先行 - 供应：TSMC+Samsung双源 - 市场：灵活配置应对需求变化 - 财务：保留$20M应急资金 5. **时间线：** - Q1-Q2: 架构定义+IP评估 - Q3-Q4: 首款chiplet tapeout - Y2Q1: 系统集成验证 - Y2Q2: 量产 6. **预期回报：** - 开发成本：$70M - 3年销量：500K units - 毛利率：45% - ROI: 180%

题目6.6 分析Intel IDM 2.0战略中的Chiplet角色。如果你是Intel CEO，如何利用Chiplet技术重获竞争优势？

提示

考虑Intel的制造优势、生态系统地位、与TSMC/AMD的竞争。

答案

**Intel Chiplet战略分析：** 1. **现状评估：** - 优势：先进封装(EMIB/Foveros)、IDM模式、x86生态 - 劣势：工艺落后、成本劣势、市场份额下降 2. **Chiplet战略支柱：** **A. 技术领先：** - 推进Foveros Direct (混合键合) - 开发光互联chiplet - 主导UCIe 2.0标准 **B. 开放生态：** - IFS提供chiplet代工服务 - 建立chiplet marketplace - 支持ARM/RISC-V chiplet **C. 产品差异化：** ``` Meteor Lake架构： - CPU tile: Intel 4 - GPU tile: TSMC N5 - SOC tile: TSMC N6 - IO tile: Intel 7 展示混合代工能力 ``` 3. **竞争策略：** - vs TSMC：利用IDM优势，提供设计+制造一体化 - vs AMD：先进封装技术领先，更低延迟 - vs NVIDIA：AI chiplet生态系统 4. **实施路线图：** ``` 2024: Chiplet产品全面铺开 2025: 开放chiplet生态系统 2026: 光互联chiplet量产 2027: 3D-IC领导地位 ``` 5. **投资重点：** - 先进封装产能：$10B - EDA工具链：$2B - 生态系统基金：$1B 6. **成功指标：** - Chiplet代工收入：>$5B/年 - 生态伙伴：>100家 - 市场份额恢复：>25%

常见陷阱与错误

设计阶段陷阱

过度分解
- 错误：将系统分成过多小chiplet（>10个）
- 后果：封装成本和复杂度失控
- 预防：详细成本建模，考虑封装限制
忽视热密度
- 错误：高功耗chiplet集中放置
- 后果：局部热点限制性能
- 预防：热仿真驱动的floorplan
接口带宽不足
- 错误：低估die间通信需求
- 后果：互联成为性能瓶颈
- 预防：系统级性能建模

经济评估陷阱

良率过度乐观
- 错误：使用理想良率模型
- 后果：成本严重低估
- 预防：包含学习曲线和余量
忽视NRE成本
- 错误：只计算单位制造成本
- 后果：总成本超预算
- 预防：全生命周期成本分析
供应链风险低估
- 错误：单一供应商依赖
- 后果：供应中断影响生产
- 预防：多源策略+库存缓冲

实施阶段陷阱

测试策略不足
- 错误：依赖KGD，忽视系统测试
- 后果：field failure率高
- 预防：完整的分层测试策略
软件适配滞后
- 错误：硬件先行，软件跟不上
- 后果：无法发挥硬件优势
- 预防：软硬件协同开发
版本管理混乱
- 错误：chiplet版本不兼容
- 后果：集成失败，库存浪费
- 预防：严格的版本控制流程

最佳实践检查清单

架构设计阶段

完成详细的良率和成本模型
评估3-5种不同的分解方案
进行系统级性能仿真
制定IP复用策略
选择标准化接口（UCIe/BoW）
完成热设计和功耗预算
评估软件栈影响