第3章：域控制器元年（2021-2022）

章节概述

2021-2022年是自动驾驶产业的关键转折点。整车电子电气架构从分布式ECU向域控制器演进，标志着汽车智能化进入新阶段。这一时期，国产芯片厂商快速崛起，地平线征程5以单颗128 TOPS的算力打破了国外垄断，黑芝麻华山二号A1000系列在高端市场站稳脚跟。同时，Intel完成对Mobileye的收购后，推出EyeQ6战略，试图在架构变革中重新定义市场格局。

3.1 E/E架构革命：从分布式到集中式

3.1.1 传统分布式架构的困境

2021年之前，汽车电子系统采用分布式ECU架构，一辆高端车型可能包含超过100个ECU，分别控制不同功能。以2020年奥迪A8为例，整车包含超过150个ECU，涵盖动力、底盘、车身、信息娱乐等各个领域：

传统分布式ECU架构（2020年典型配置）
┌─────────────────────────────────────────────────────────────┐
│  前视摄像头 ──→ [ECU1] ──┐                                  │
│  侧视摄像头 ──→ [ECU2] ──┤   处理器配置：                   │
│  后视摄像头 ──→ [ECU3] ──┤   • MCU: 32-bit @ 200MHz       │
│  毫米波雷达 ──→ [ECU4] ──┼──→ CAN/LIN总线 ──→ 中央网关      │
│  超声波雷达 ──→ [ECU5] ──┤   带宽: 500Kbps (CAN)          │
│  激光雷达   ──→ [ECU6] ──┤         ↓                       │
│                           │    各执行单元                     │
│  每个ECU独立配置:          │   (制动/转向/动力)               │
│  • CPU: ARM Cortex-M4     │                                 │
│  • RAM: 256KB-2MB         │   总线负载率: >70%              │
│  • Flash: 1MB-4MB         │   消息延迟: 10-100ms           │
└─────────────────────────────────────────────────────────────┘

关键问题详解：
• 线束复杂度高：

  - 总重量: 60-80kg (特斯拉Model 3仅15kg)
  - 线束长度: 5km+ (域控架构减少至1.5km)
  - 成本: $3000-4000 (占整车BOM 8-10%)
  - 装配工时: 20+ 小时

• 数据孤岛：

  - 各ECU独立处理，数据格式不统一
  - 跨ECU通信延迟高达100ms
  - 无法实现多传感器时空同步
  - 算法迭代需要多方协调

• 算力浪费：

  - 平均CPU利用率: 15-30%
  - 峰值负载不均衡
  - 冗余配置导致成本增加
  - 无法动态调配计算资源

• OTA困难：

  - 需要逐个更新ECU固件 (平均耗时2-4小时)
  - 版本依赖复杂，容易出现兼容性问题
  - 回滚机制不完善，风险高
  - 用户体验差，需要到店升级

3.1.2 域控制器架构优势

域控制器将功能相近的ECU整合到统一计算平台，实现了计算资源的集中化和标准化：

域控制器架构（2021-2022年主流方案）
┌──────────────────────────────────────────────────────────────────┐
│                         整车域控制器布局                           │
├──────────────────────────────────────────────────────────────────┤
│   ┌─────────────┐  ┌─────────────┐  ┌─────────────┐           │
│   │  智驾域      │  │  座舱域      │  │  车身域      │           │
│   │  (ADAS DC)  │  │  (CDC)       │  │  (BDC)      │           │
│   │ 芯片：Orin-X │  │ 芯片：8155   │  │ 芯片：TC397  │           │
│   │ 算力：275T   │  │ 算力：8T     │  │ 算力：2.5G   │           │
│   │  ·感知融合   │  │  ·信息娱乐   │  │  ·车灯控制   │           │
│   │  ·路径规划   │  │  ·仪表显示   │  │  ·门窗控制   │           │
│   │  ·决策控制   │  │  ·语音交互   │  │  ·空调系统   │           │
│   │ OS: QNX 7.1 │  │ OS: Android  │  │ OS: AUTOSAR  │           │
│   └──────┬──────┘  └──────┬──────┘  └──────┬──────┘           │
│          │                 │                 │                   │
│          └─────────────────┼─────────────────┘                   │
│                            ↓                                     │
│                    ┌───────────────┐                            │
│                    │  以太网骨干网   │                           │
│                    │  TSN + AVB     │                           │
│                    │  带宽：10Gbps  │                           │
│                    │  延迟：<1ms    │                           │
│                    └───────┬───────┘                            │
│                            ↓                                     │
│   ┌─────────────┐  ┌──────┴──────┐  ┌─────────────┐           │
│   │  动力域      │  │  中央网关    │  │  底盘域      │           │
│   │  (PDC)      │  │  (CGW)      │  │  (CDC)      │           │
│   │ 芯片：TC399  │  │ 芯片：S32G   │  │ 芯片：TC397  │           │
│   │  ·电机控制   │  │  ·路由管理   │  │  ·制动系统   │           │
│   │  ·电池管理   │  │  ·安全防护   │  │  ·转向系统   │           │
│   │  ·充电管理   │  │  ·OTA管理    │  │  ·悬架控制   │           │
│   │ ASIL-D认证  │  │  ·诊断服务   │  │ ASIL-D认证   │           │
│   └─────────────┘  └─────────────┘  └─────────────┘           │
└──────────────────────────────────────────────────────────────────┘

关键优势量化：
• 线束减少70%：从5km降至1.5km，重量减少40kg
• 算力利用率提升至60-80%：动态资源调配
• OTA时间缩短90%：整域更新仅需15分钟
• 开发周期缩短40%：标准化接口和中间件
• BOM成本降低25%：减少冗余硬件配置

3.1.3 技术挑战与解决方案

实时性保证

问题：多传感器数据需要严格时间同步，毫秒级偏差即可导致感知失败
方案：采用TSN（时间敏感网络）+ PTP（精确时间协议）

时间同步架构：
GPS/北斗授时 ──→ 主时钟(Grandmaster) 
                       ↓ PTP协议
       ┌──────────────┼──────────────┐
       ↓              ↓              ↓
   智驾域时钟     座舱域时钟     底盘域时钟
       ↓              ↓              ↓
   传感器同步     显示同步      执行器同步

关键指标：
• 时间同步精度：<100ns (802.1AS-2020标准)
• 网络延迟：<1ms (确定性保证)
• 抖动：<100μs
• 丢包率：<10^-6

功能安全设计

ASIL-D要求：故障率 < 10 FIT (10^-8/h)，99.999%可用性
多层冗余架构：

三重冗余安全架构：

Level 1: 硬件冗余
主处理器 ────→ [Lock-Step比对] ←──── 影子处理器
   ↓                  ↓                   ↓
主存储器(ECC)    仲裁器(ASIL-D)    备份存储器(ECC)
   ↓                  ↓                   ↓

Level 2: 软件冗余
主算法路径 ────→ [结果校验] ←──── 简化安全路径
                      ↓
                 安全监控器(QM)

Level 3: 系统冗余
执行器A ←────── [2oo3表决] ────────→ 执行器B
                      ↑
                  执行器C(备份)

故障响应时间：<50ms
安全状态切换：<10ms

热管理挑战

功耗挑战：域控制器功耗200W~500W，是传统ECU的10倍
散热方案对比：

散热技术演进：
┌────────────┬──────────┬──────────┬──────────┐
│ 方案        │ 散热能力  │ 成本     │ 应用案例  │
├────────────┼──────────┼──────────┼──────────┤
│ 被动散热    │ <50W     │ $10      │ 低端ADAS │
│ 风冷散热    │ 50-150W  │ $30      │ L2级系统  │
│ 液冷散热    │ 150-400W │ $200     │ L3/L4系统 │
│ 浸没式冷却  │ >400W    │ $500+    │ 数据中心  │
└────────────┴──────────┴──────────┴──────────┘

动态热管理策略(DVFS)：
• 温度<60°C：全速运行(100%频率)
• 60-70°C：降频至90%
• 70-80°C：降频至70%，关闭非关键功能
• >80°C：进入安全模式，仅保留基础功能

3.1.4 主要玩家布局

域控制器供应商格局（2021-2022）

| 厂商 | 域控制器平台 | 芯片方案 | 算力 | 首发车型 | 量产时间 | 单价 |

厂商	域控制器平台	芯片方案	算力	首发车型	量产时间	单价
博世	DASy 4.0	Mobileye EyeQ5	24 TOPS	大众ID.4	2021 Q2	$1800
大陆	ADCU	NVIDIA Xavier	30 TOPS	蔚来ET7	2022 Q1	$2200
德赛西威	IPU04	地平线征程5×2	256 TOPS	理想L9	2022 Q2	$1500
华为	MDC 610	昇腾610	200 TOPS	极狐αS HI	2021 Q4	$2800
采埃孚	ProAI	NVIDIA Orin	254 TOPS	奔驰EQS	2022 Q3	$3500
安波福	SVA	Xilinx+Orin	300 TOPS	Lyft L4	2022 Q4	$4000
电装	-	瑞萨R-Car V3H	4 TOPS	丰田Mirai	2021 Q3	$800

技术路线对比

不同厂商技术路线特点：

博世(传统Tier1代表)：
• 策略：与芯片厂深度绑定，提供完整解决方案
• 优势：功能安全经验丰富，ASIL-D认证完善
• 劣势：创新速度慢，成本高

华为(ICT巨头)：
• 策略：全栈自研，从芯片到算法到云服务
• 优势：端云协同，5G-V2X集成
• 劣势：国际市场受限，生态封闭

新势力供应商(德赛西威等)：
• 策略：灵活选择芯片，快速迭代
• 优势：成本控制好，响应速度快
• 劣势：技术积累不足，安全认证经验少

3.2 地平线征程5：国产算力突破

3.2.1 芯片架构创新

征程5（Journey 5）采用地平线自研BPU（Brain Processing Unit）架构：

征程5芯片架构
┌────────────────────────────────────────────────────────────┐
│                     Journey 5 SoC架构                       │
├────────────────────────────────────────────────────────────┤
│  ┌──────────────────────────────────────────────────┐     │
│  │            CPU子系统（8x Cortex-A55）              │     │
│  │  ┌────┐ ┌────┐ ┌────┐ ┌────┐                   │     │
│  │  │Core│ │Core│ │Core│ │Core│  主频: 1.2GHz      │     │
│  │  └────┘ └────┘ └────┘ └────┘                   │     │
│  │  ┌────┐ ┌────┐ ┌────┐ ┌────┐                   │     │
│  │  │Core│ │Core│ │Core│ │Core│  L2: 2MB          │     │
│  │  └────┘ └────┘ └────┘ └────┘                   │     │
│  └────────────────────┬─────────────────────────────┘     │
│                       │                                    │
│  ┌────────────────────┼─────────────────────────────┐     │
│  │     BPU子系统       │      (贝叶斯架构3.0)         │     │
│  │  ┌─────────┐ ┌─────┴────┐ ┌─────────┐          │     │
│  │  │  BPU-0  │ │  BPU-1    │ │  BPU-2  │          │     │
│  │  │ 42.7TOPS│ │ 42.7TOPS  │ │ 42.7TOPS│          │     │
│  │  └─────┬───┘ └─────┬────┘ └────┬────┘          │     │
│  │        └───────────┬┴────────────┘               │     │
│  │                    ↓                              │     │
│  │          ┌────────────────────┐                  │     │
│  │          │   共享SRAM (8MB)    │                  │     │
│  │          └────────────────────┘                  │     │
│  └───────────────────────────────────────────────────┘     │
│                                                            │
│  ┌────────────────────────────────────────────────────┐   │
│  │                  片上互联 (NoC)                      │   │
│  │    带宽: 400GB/s   延迟: <100ns   QoS: 4级          │   │
│  └────────────────────────────────────────────────────┘   │
│                           ↓                                │
│  ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐    │
│  │   ISP     │ │   DSP    │ │   VPU    │ │  安全岛   │    │
│  │ 8路MIPI  │ │ 2x C71x  │ │ H.265    │ │ Cortex-R5 │    │
│  └──────────┘ └──────────┘ └──────────┘ └──────────┘    │
│                                                            │
│  ┌────────────────────────────────────────────────────┐   │
│  │              内存控制器 (LPDDR4)                     │   │
│  │    位宽: 64bit   频率: 3200MHz   带宽: 25.6GB/s     │   │
│  └────────────────────────────────────────────────────┘   │
└────────────────────────────────────────────────────────────┘

制程: 16nm FinFET (TSMC)
功耗: 30W (典型)
封装: FCBGA 37.5x37.5mm

3.2.2 BPU贝叶斯架构深度解析

地平线BPU采用创新的贝叶斯架构，专为视觉感知优化，是征程5实现高能效比的核心：

架构设计理念

BPU 3.0 贝叶斯架构核心设计：
┌──────────────────────────────────────────────────────┐
│                    BPU核心架构                         │
├──────────────────────────────────────────────────────┤
│  ┌─────────────────────────────────────────────┐    │
│  │           计算核心阵列 (Compute Core Array)   │    │
│  │  ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐      │    │
│  │  │ MAC   │ │ MAC   │ │ MAC   │ │ MAC   │      │    │
│  │  │ 4096  │ │ 4096  │ │ 4096  │ │ 4096  │      │    │
│  │  └───┬──┘ └───┬──┘ └───┬──┘ └───┬──┘      │    │
│  │      └─────────┴─────────┴─────────┘         │    │
│  │                    ↓                          │    │
│  │         ┌─────────────────────┐              │    │
│  │         │  向量处理单元 (VPU)   │              │    │
│  │         │  SIMD-1024宽度       │              │    │
│  │         └─────────────────────┘              │    │
│  └─────────────────────────────────────────────┘    │
│                        ↓                              │
│  ┌─────────────────────────────────────────────┐    │
│  │         层次化存储系统 (Memory Hierarchy)      │    │
│  │  L0: 寄存器组  (256KB/核)                     │    │
│  │  L1: SRAM     (2MB/簇)                       │    │
│  │  L2: 共享缓存  (8MB全局)                      │    │
│  │  L3: LPDDR4   (8GB外存)                      │    │
│  └─────────────────────────────────────────────┘    │
└──────────────────────────────────────────────────────┘

核心创新点

稀疏计算优化

稀疏度加速机制：
• 动态稀疏检测：硬件自动识别零值，跳过计算
• 结构化剪枝：

  - 2:4稀疏(50%稀疏度)：2.0x加速
  - 4:8稀疏(50%稀疏度)：1.8x加速
  - 块稀疏(8x8 block)：3.2x加速
• 稀疏索引压缩：减少40%内存带宽

实测性能提升(ResNet-50)：
密集计算：1.2ms/帧
50%稀疏：0.6ms/帧
75%稀疏：0.4ms/帧

混合精度计算

数据类型支持与性能：
┌──────────────────────────────────────────────┐
│ 数据类型 │ 峰值算力 │ 典型功耗 │ 应用场景      │
├──────────────────────────────────────────────┤
│ INT4    │ 256 TOPS│ 15W     │ 分类网络      │
│ INT8    │ 128 TOPS│ 20W     │ 检测网络      │
│ INT16   │ 64 TOPS │ 25W     │ 关键点检测    │
│ FP16    │ 32 TOPS │ 30W     │ 在线学习      │
│ BF16    │ 32 TOPS │ 28W     │ Transformer  │
└──────────────────────────────────────────────┘

自动混合精度策略：
• 首层/末层：INT16保证精度
• 中间层：INT8平衡精度与性能
• 激活值：动态量化

算子融合技术

融合模式：
• Conv+BN+ReLU：3合1融合，减少2次内存访问
• Conv+Add+ReLU：残差块优化
• MatMul+Softmax：Attention优化
• 自定义融合：通过编译器指令

内存访问优化效果：
未融合：100%内存带宽占用
融合后：40%内存带宽占用
性能提升：2.5倍

与竞品对比优势

特性	征程5 BPU	Mobileye EyeQ5	NVIDIA Xavier
算力效率(TOPS/W)	4.3	2.4	1.3
ResNet-50延迟	0.8ms	1.2ms	1.5ms
YOLOv5s FPS	240	160	180
动态范围量化	支持	不支持	部分支持

3.2.3 软件生态与工具链

天工开物（Horizon OpenExplorer）平台

开发流程
┌──────────┐     ┌──────────┐     ┌──────────┐     ┌──────────┐
│ AI模型    │────→│ 模型转换  │────→│ 量化优化  │────→│ 部署运行  │
│ PyTorch  │     │ ONNX     │     │ INT8     │     │ Runtime  │
│ TensorFlow│     │ Converter│     │ Calibrate│     │ Engine   │
└──────────┘     └──────────┘     └──────────┘     └──────────┘
     ↓                 ↓                 ↓                 ↓
支持模型：           精度保证：         性能优化：         部署便利：
• YOLO系列        • <1%精度损失      • 自动算子融合     • C++/Python API
• CenterNet       • PTQ/QAT支持      • 内存优化        • ROS集成
• BEVFormer       • 逐层分析工具      • 多流并发        • Docker镜像

算法适配案例

BEV感知算法优化

原始FP32模型：45ms/帧
INT8量化后：12ms/帧
BPU专用优化：8ms/帧
精度损失：mAP下降 < 0.5%

3.2.4 商业落地与市场表现

主要客户与项目

理想汽车 - L9/L8/L7全系标配 - 双征程5方案（256 TOPS） - 支持高速NOA功能
长城汽车 - 魏牌摩卡DHT-PHEV - 单征程5 + 高算力MCU - 城市记忆泊车功能
比亚迪 - 高端品牌仰望U8 - 四征程5级联（512 TOPS） - L3级自动驾驶预研

成本优势分析

成本对比（2022年Q4批量价格）
┌────────────────────────────────────┐
│ 征程5单片：      ~$120            │
│ EyeQ5单片：      ~$200            │
│ Xavier模组：     ~$450            │
│ Orin模组：       ~$800            │
└────────────────────────────────────┘
性价比指标：$/TOPS
征程5:  0.94
EyeQ5:  8.33
Xavier: 15.0
Orin:   2.91

3.3 黑芝麻华山二号A1000系列：高端突破

3.3.1 产品矩阵与定位

黑芝麻智能在2021年推出华山二号A1000系列，形成完整产品矩阵：

A1000系列产品线
┌──────────────────────────────────────────────────────────┐
│  型号      算力      目标市场        典型应用            │
├──────────────────────────────────────────────────────────┤
│  A1000L    16 TOPS   L2级ADAS       行泊一体入门版      │
│  A1000     40 TOPS   L2+级ADAS      高速NOA            │
│  A1000 Pro 58 TOPS   L2++级         城市NOA            │
│  A1000-SE  116 TOPS  L3/L4级        Robotaxi预研        │
└──────────────────────────────────────────────────────────┘

3.3.2 核心技术架构

NeuralIQ ISP + NPU融合架构

A1000 Pro架构框图
┌─────────────────────────────────────────────────────────────┐
│                      A1000 Pro SoC                           │
├─────────────────────────────────────────────────────────────┤
│  ┌───────────────────────────────────────────────────┐      │
│  │              CPU Complex (8核ARM)                  │      │
│  │   ┌─────────────────┐  ┌─────────────────┐       │      │
│  │   │ 4x Cortex-A76    │  │ 4x Cortex-A55   │       │      │
│  │   │ @ 2.0GHz         │  │ @ 1.5GHz        │       │      │
│  │   └────────┬─────────┘  └────────┬────────┘       │      │
│  │            └──────────┬───────────┘                │      │
│  │                       ↓                            │      │
│  │              ┌─────────────────┐                  │      │
│  │              │  L3 Cache (4MB) │                  │      │
│  │              └─────────────────┘                  │      │
│  └───────────────────────┬───────────────────────────┘      │
│                          │                                   │
│  ┌───────────────────────┼───────────────────────────┐      │
│  │          NeuralIQ Engine (NPU + ISP融合)          │      │
│  │                       │                           │      │
│  │   ┌──────────┐  ┌────┴─────┐  ┌──────────┐     │      │
│  │   │  ISP-0   │  │  NPU-0    │  │  ISP-1   │     │      │
│  │   │ 4K@30fps │  │  29 TOPS  │  │ 4K@30fps │     │      │
│  │   └────┬─────┘  └─────┬────┘  └────┬─────┘     │      │
│  │        │               │             │            │      │
│  │   ┌────┴────────────────┴────────────┴────┐      │      │
│  │   │         统一内存池 (UMA)               │      │      │
│  │   │    智能调度 | 零拷贝 | 动态分配        │      │      │
│  │   └────────────────────────────────────────┘      │      │
│  │                                                   │      │
│  │   ┌──────────┐  ┌──────────┐  ┌──────────┐     │      │
│  │   │  NPU-1   │  │   DSP    │  │   VPU    │     │      │
│  │   │ 29 TOPS  │  │  Vector  │  │  H.265   │     │      │
│  │   └──────────┘  └──────────┘  └──────────┘     │      │
│  └───────────────────────────────────────────────────┘      │
│                                                              │
│  ┌───────────────────────────────────────────────────┐      │
│  │                 高速互联架构                       │      │
│  │   PCIe 4.0 | CAN-FD | Ethernet TSN | MIPI CSI-2  │      │
│  └───────────────────────────────────────────────────┘      │
│                                                              │
│  功耗: 15W (典型) | 制程: 16nm | 内存: LPDDR4X 64bit       │
└─────────────────────────────────────────────────────────────┘

关键创新技术

感知前融合（ISP-NPU协同） - RAW数据直接进入NPU处理 - 减少ISP处理导致的信息损失 - 夜间场景识别率提升40%
动态异构调度 - CPU/NPU/DSP任务自动分配 - 基于负载的功耗管理 - 实时性保证 < 10ms
自研DynamIQ技术 - 动态量化精度调整 - 关键层FP16，非关键层INT4 - 整体精度损失 < 0.3%

3.3.3 算法优化与部署

山海工具链平台

算法部署流程
┌────────────────────────────────────────────────────────┐
│                     山海平台架构                         │
├────────────────────────────────────────────────────────┤
│  模型输入层                                             │
│  ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐      │
│  │Caffe │ │PyTorch│ │TensorFlow│ │MXNet│ │PaddlePaddle│ │
│  └───┬──┘ └───┬──┘ └───┬──┘ └───┬──┘ └───┬──┘      │
│      └────────┴────────┴────────┴────────┘            │
│                        ↓                                │
│  ┌────────────────────────────────────────────────┐   │
│  │           模型转换器 (Model Converter)          │   │
│  │  • ONNX中间表示  • 图优化  • 算子映射           │   │
│  └────────────────────────────────────────────────┘   │
│                        ↓                                │
│  ┌────────────────────────────────────────────────┐   │
│  │           量化工具 (Quantization Tool)          │   │
│  │  • 自动混合精度  • 敏感度分析  • 校准数据集     │   │
│  └────────────────────────────────────────────────┘   │
│                        ↓                                │
│  ┌────────────────────────────────────────────────┐   │
│  │           编译优化器 (Compiler)                 │   │
│  │  • 算子融合  • 内存规划  • 并行策略生成        │   │
│  └────────────────────────────────────────────────┘   │
│                        ↓                                │
│  ┌────────────────────────────────────────────────┐   │
│  │           运行时引擎 (Runtime)                  │   │
│  │  • 多核调度  • 资源管理  • 性能监控            │   │
│  └────────────────────────────────────────────────┘   │
└────────────────────────────────────────────────────────┘

典型算法性能表现

模型	输入分辨率	A1000 Pro延迟	功耗	精度(mAP)
YOLOv5s	640×640	3.2ms	8W	56.8%
YOLOv7	640×640	5.1ms	10W	69.7%
YOLOX-L	640×640	7.8ms	12W	73.2%
CenterNet	512×512	4.5ms	9W	61.4%
PillarNet	点云	12ms	14W	79.1%

3.3.4 市场应用与客户案例

一汽红旗E-HS9项目

配置：双A1000 Pro (116 TOPS)
传感器：12V5R1L方案
功能：高速NOA + 记忆泊车
量产时间：2022年Q3

江汽集团思皓系列

配置：A1000标准版 (40 TOPS)
成本优势：相比进口方案降低35%
本土化支持：现场技术团队驻场

东风岚图FREE

配置：A1000L (16 TOPS) + 域控制器
特色：首个量产ISP-NPU融合方案
夜间性能：检测距离提升25%

3.3.5 技术发展路线图

黑芝麻技术演进
2020        2021         2022         2023         2024
A500 ───→ A1000 ────→ A1000Pro ───→ 武当C1200 ──→ 武当C1600
(5T)      (40T)       (58T)        (200T)       (400T)
28nm      16nm        16nm         7nm          5nm
 │         │           │            │            │
 └─────────┴───────────┴────────────┴────────────┘
        关键里程碑：
        • ISP融合  • 跨域计算  • Chiplet  • 3D封装

3.4 Intel/Mobileye EyeQ6战略转型

3.4.1 收购后的战略调整

2022年，Intel完成对Mobileye的分拆上市，但保持多数股权控制。这一举措反映了新的战略方向：

Mobileye战略转型
┌──────────────────────────────────────────────────────┐
│  阶段一：垂直整合（2017-2020）                         │
│  • Intel收购，整合制造能力                             │
│  • EyeQ5量产，巩固ADAS市场                           │
│  • REM地图众包平台建设                                │
├──────────────────────────────────────────────────────┤
│  阶段二：开放生态（2021-2022）                         │
│  • EyeQ6架构开放                                      │
│  • 支持外部算法部署                                    │
│  • True AI计算架构发布                                │
├──────────────────────────────────────────────────────┤
│  阶段三：全栈方案（2023-）                            │
│  • SuperVision全栈系统                               │
│  • Chauffeur L4方案                                  │
│  • 自动驾驶即服务(ADaaS)                             │
└──────────────────────────────────────────────────────┘

3.4.2 EyeQ6架构革新

双芯片设计理念

EyeQ6H/EyeQ6L架构对比
┌─────────────────────────────────────────────────────────┐
│                    EyeQ6H (High)                         │
│  ┌─────────────────────────────────────────────┐       │
│  │  CPU集群：12x RISC-V @ 1.5GHz                │       │
│  │  ┌─────┐ ┌─────┐ ┌─────┐ ┌─────┐         │       │
│  │  │Core │ │Core │ │Core │ │Core │ ...     │       │
│  │  └─────┘ └─────┘ └─────┘ └─────┘         │       │
│  └─────────────────────────────────────────────┘       │
│  ┌─────────────────────────────────────────────┐       │
│  │  加速器集群                                   │       │
│  │  • 2x DLA (深度学习)  @ 34 TOPS each       │       │
│  │  • 2x VMP (视觉处理)  @ 12 TOPS each       │       │
│  │  • 1x PMA (策略映射)  @ 8 TOPS            │       │
│  │  • 1x TPC (跟踪预测)  @ 6 TOPS            │       │
│  └─────────────────────────────────────────────┘       │
│  总算力：128 TOPS | 功耗：35W | 制程：7nm              │
└─────────────────────────────────────────────────────────┘

┌─────────────────────────────────────────────────────────┐
│                    EyeQ6L (Lite)                         │
│  ┌─────────────────────────────────────────────┐       │
│  │  CPU集群：8x RISC-V @ 1.2GHz                 │       │
│  └─────────────────────────────────────────────┘       │
│  ┌─────────────────────────────────────────────┐       │
│  │  加速器集群                                   │       │
│  │  • 1x DLA @ 25 TOPS                        │       │
│  │  • 1x VMP @ 10 TOPS                        │       │
│  │  • 共享加速器资源                            │       │
│  └─────────────────────────────────────────────┘       │
│  总算力：35 TOPS | 功耗：15W | 制程：7nm              │
└─────────────────────────────────────────────────────────┘

关键技术特性

True AI架构 - 完全可编程的加速器 - 支持新兴网络结构（Transformer、GNN） - 无需硬件改动即可适配新算法
RSS安全模型 - 责任敏感安全(Responsibility-Sensitive Safety) - 数学验证的安全决策 - 冗余感知路径
开放策略转变 - 支持客户自定义算法 - 提供SDK和工具链 - 不再强制绑定Mobileye算法栈

3.4.3 SuperVision全栈系统

系统架构

SuperVision系统架构
┌────────────────────────────────────────────────────┐
│                  感知层                             │
│  11个高清摄像头 + 雷达融合                          │
│  ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐           │
│  │前视×3 │ │侧视×4 │ │后视×1 │ │环视×3 │           │
│  └───┬──┘ └───┬──┘ └───┬──┘ └───┬──┘           │
│      └─────────┴─────────┴─────────┘              │
│                      ↓                             │
├────────────────────────────────────────────────────┤
│                  计算层                             │
│         2×EyeQ6H (256 TOPS)                        │
│  ┌────────────┐        ┌────────────┐            │
│  │  主计算单元  │←------→│  备份单元   │            │
│  │  感知+规划  │        │  安全冗余   │            │
│  └────────────┘        └────────────┘            │
│         ↓                    ↓                     │
├────────────────────────────────────────────────────┤
│                  算法层                             │
│  • 端到端深度学习        • RSS安全模型              │
│  • REM高精地图          • 多任务网络               │
│         ↓                                          │
├────────────────────────────────────────────────────┤
│                  执行层                             │
│  横向控制 | 纵向控制 | 故障处理                      │
└────────────────────────────────────────────────────┘

部署案例

极氪001 FR版

首发SuperVision系统
高速NOA + 城市领航辅助
2022年Q4交付

宝马iX xDrive50

定制化SuperVision
欧洲法规适配
2023年量产

3.4.4 市场策略与挑战

竞争优势

算法积累：20年+视觉算法经验
数据优势：1.5亿辆车部署，海量路测数据
安全认证：首个获得德国TÜV认证的L4系统

面临挑战

激光雷达缺位：纯视觉路线在中国市场接受度低
开放生态晚：相比NVIDIA生态成熟度不足
成本压力：中国厂商价格竞争激烈

3.5 域控制器时代的产业影响

3.5.1 供应链重构

供应链演变
传统模式（2020前）              域控时代（2021-2022）
┌──────────┐                   ┌──────────┐
│   OEM    │                   │   OEM    │
└─────┬────┘                   └─────┬────┘
      ↓                               ↓
┌──────────┐                   ┌──────────┐
│  Tier1   │                   │  Tier0.5 │←--- 新角色
│ (博世等)  │                   │ (华为等)  │
└─────┬────┘                   └─────┬────┘
      ↓                               ↓
┌──────────┐                   ┌──────────┐
│  Tier2   │                   │芯片厂商   │←--- 地位提升
│ (零部件)  │                   │ (直供OEM) │
└──────────┘                   └──────────┘

变化要点：
• Tier1角色弱化，部分转型Tier0.5
• 芯片厂商直接与OEM合作
• 软件能力成为核心竞争力
• OEM自研比例大幅提升

3.5.2 技术标准演进

主要标准对比

| 标准维度 | 2020年 | 2022年 | 变化趋势 |

标准维度	2020年	2022年	变化趋势
算力要求	2-10 TOPS	50-200 TOPS	20倍增长
通信带宽	CAN (1Mbps)	车载以太网 (1Gbps)	1000倍提升
软件架构	Classic AUTOSAR	Adaptive AUTOSAR	面向服务
安全等级	ASIL-B为主	ASIL-D标配	安全要求提升
OTA能力	部分支持	全面支持	成为标配

3.5.3 成本结构变化

整车成本占比变化
2020年传统车型                 2022年智能车型
┌────────────────┐            ┌────────────────┐
│ 机械部件  45%   │            │ 机械部件  35%   │
│ 动力系统  25%   │            │ 动力系统  20%   │
│ 内饰     15%   │            │ 电子电气  25%   │←─ 大幅提升
│ 电子电气  10%   │            │ 软件     10%   │←─ 新增项
│ 其他      5%   │            │ 内饰      7%   │
└────────────────┘            │ 其他      3%   │
                              └────────────────┘

域控制器成本构成（以智驾域为例）：
• 芯片：40-50%
• PCB及被动元件：20-25%
• 存储器：15-20%
• 连接器：10-15%
• 散热及结构件：5-10%

3.6 本章总结与展望

3.6.1 关键芯片性能对比

2021-2022年主流芯片综合对比
┌──────────────────────────────────────────────────────────────┐
│ 芯片型号    │ 算力   │ 功耗 │ 制程 │ 内存带宽 │ 单价  │ 量产 │
├──────────────────────────────────────────────────────────────┤
│ 地平线J5   │ 128T  │ 30W │ 16nm│ 25.6GB/s│ $120 │ 2021Q4│
│ 黑芝麻A1000│ 58T   │ 15W │ 16nm│ 19.2GB/s│ $80  │ 2021Q3│
│ EyeQ6H     │ 128T  │ 35W │ 7nm │ 38.4GB/s│ $250 │ 2022Q4│
│ Orin-X     │ 275T  │ 60W │ 7nm │ 204GB/s │ $450 │ 2022Q1│
│ TDA4-Mid   │ 8T    │ 15W │ 28nm│ 17GB/s  │ $45  │ 2021Q1│
│ 高通SA8540 │ 100T  │ 45W │ 5nm │ 64GB/s  │ $200 │ 2022Q3│
└──────────────────────────────────────────────────────────────┘
T = TOPS

3.6.2 技术发展趋势

架构融合趋势 - ISP与NPU深度融合 - CPU/GPU/NPU统一内存架构 - 跨域计算资源共享
算法硬件协同 - Transformer专用加速单元 - BEV感知硬件优化 - 端到端网络部署支持
生态开放化 - 工具链标准化 - 中间件通用化 - 算法模型可移植

3.6.3 市场格局预判

2022年底市场份额（中国市场）
┌────────────────────────────────┐
│ Mobileye      25% ↓            │
│ NVIDIA        20% ↑            │
│ 地平线         18% ↑↑           │
│ 高通          12% →            │
│ 黑芝麻         8%  ↑            │
│ TI            7%  ↓            │
│ 华为          5%  ↑            │
│ 其他          5%               │
└────────────────────────────────┘

关键观察：
• 国产化替代加速，本土厂商份额超30%
• NVIDIA凭借Orin快速增长
• Mobileye份额下滑但仍是领导者
• 新玩家不断涌入，竞争加剧

3.6.4 下一阶段展望

2023年将迎来更大变革：

超高算力时代：单芯片突破500 TOPS
中央计算架构：从域控向中央计算演进
大模型上车：Transformer成为标配
成本大战：芯片价格战全面打响

域控制器元年奠定了智能汽车计算架构的基础，为后续的爆发式增长铺平了道路。国产芯片的崛起不仅打破了国外垄断，更推动了整个产业的创新速度。下一章，我们将深入探讨大模型如何彻底改变自动驾驶芯片的设计理念。

注：本章数据来源于各公司官方发布、行业研究报告及公开市场信息，截至2022年12月。