第3章:域控制器元年(2021-2022)

章节概述

2021-2022年是自动驾驶产业的关键转折点。整车电子电气架构从分布式ECU向域控制器演进,标志着汽车智能化进入新阶段。这一时期,国产芯片厂商快速崛起,地平线征程5以单颗128 TOPS的算力打破了国外垄断,黑芝麻华山二号A1000系列在高端市场站稳脚跟。同时,Intel完成对Mobileye的收购后,推出EyeQ6战略,试图在架构变革中重新定义市场格局。

3.1 E/E架构革命:从分布式到集中式

3.1.1 传统分布式架构的困境

2021年之前,汽车电子系统采用分布式ECU架构,一辆高端车型可能包含超过100个ECU,分别控制不同功能。以2020年奥迪A8为例,整车包含超过150个ECU,涵盖动力、底盘、车身、信息娱乐等各个领域:

传统分布式ECU架构(2020年典型配置)
┌─────────────────────────────────────────────────────────────┐
│  前视摄像头 ──→ [ECU1] ──┐                                  │
│  侧视摄像头 ──→ [ECU2] ──┤   处理器配置:                   │
│  后视摄像头 ──→ [ECU3] ──┤   • MCU: 32-bit @ 200MHz       │
│  毫米波雷达 ──→ [ECU4] ──┼──→ CAN/LIN总线 ──→ 中央网关      │
│  超声波雷达 ──→ [ECU5] ──┤   带宽: 500Kbps (CAN)          │
│  激光雷达   ──→ [ECU6] ──┤         ↓                       │
│                           │    各执行单元                     │
│  每个ECU独立配置:          │   (制动/转向/动力)               │
│  • CPU: ARM Cortex-M4     │                                 │
│  • RAM: 256KB-2MB         │   总线负载率: >70%              │
│  • Flash: 1MB-4MB         │   消息延迟: 10-100ms           │
└─────────────────────────────────────────────────────────────┘

关键问题详解:
• 线束复杂度高:

  - 总重量: 60-80kg (特斯拉Model 3仅15kg)
  - 线束长度: 5km+ (域控架构减少至1.5km)
  - 成本: $3000-4000 (占整车BOM 8-10%)
  - 装配工时: 20+ 小时

• 数据孤岛:

  - 各ECU独立处理,数据格式不统一
  - 跨ECU通信延迟高达100ms
  - 无法实现多传感器时空同步
  - 算法迭代需要多方协调

• 算力浪费:

  - 平均CPU利用率: 15-30%
  - 峰值负载不均衡
  - 冗余配置导致成本增加
  - 无法动态调配计算资源

• OTA困难:

  - 需要逐个更新ECU固件 (平均耗时2-4小时)
  - 版本依赖复杂,容易出现兼容性问题
  - 回滚机制不完善,风险高
  - 用户体验差,需要到店升级

3.1.2 域控制器架构优势

域控制器将功能相近的ECU整合到统一计算平台,实现了计算资源的集中化和标准化:

域控制器架构(2021-2022年主流方案)
┌──────────────────────────────────────────────────────────────────┐
│                         整车域控制器布局                           │
├──────────────────────────────────────────────────────────────────┤
│   ┌─────────────┐  ┌─────────────┐  ┌─────────────┐           │
│   │  智驾域      │  │  座舱域      │  │  车身域      │           │
│   │  (ADAS DC)  │  │  (CDC)       │  │  (BDC)      │           │
│   │ 芯片:Orin-X │  │ 芯片:8155   │  │ 芯片:TC397  │           │
│   │ 算力:275T   │  │ 算力:8T     │  │ 算力:2.5G   │           │
│   │  ·感知融合   │  │  ·信息娱乐   │  │  ·车灯控制   │           │
│   │  ·路径规划   │  │  ·仪表显示   │  │  ·门窗控制   │           │
│   │  ·决策控制   │  │  ·语音交互   │  │  ·空调系统   │           │
│   │ OS: QNX 7.1 │  │ OS: Android  │  │ OS: AUTOSAR  │           │
│   └──────┬──────┘  └──────┬──────┘  └──────┬──────┘           │
│          │                 │                 │                   │
│          └─────────────────┼─────────────────┘                   │
│                            ↓                                     │
│                    ┌───────────────┐                            │
│                    │  以太网骨干网   │                           │
│                    │  TSN + AVB     │                           │
│                    │  带宽:10Gbps  │                           │
│                    │  延迟:<1ms    │                           │
│                    └───────┬───────┘                            │
│                            ↓                                     │
│   ┌─────────────┐  ┌──────┴──────┐  ┌─────────────┐           │
│   │  动力域      │  │  中央网关    │  │  底盘域      │           │
│   │  (PDC)      │  │  (CGW)      │  │  (CDC)      │           │
│   │ 芯片:TC399  │  │ 芯片:S32G   │  │ 芯片:TC397  │           │
│   │  ·电机控制   │  │  ·路由管理   │  │  ·制动系统   │           │
│   │  ·电池管理   │  │  ·安全防护   │  │  ·转向系统   │           │
│   │  ·充电管理   │  │  ·OTA管理    │  │  ·悬架控制   │           │
│   │ ASIL-D认证  │  │  ·诊断服务   │  │ ASIL-D认证   │           │
│   └─────────────┘  └─────────────┘  └─────────────┘           │
└──────────────────────────────────────────────────────────────────┘

关键优势量化:
• 线束减少70%:从5km降至1.5km,重量减少40kg
• 算力利用率提升至60-80%:动态资源调配
• OTA时间缩短90%:整域更新仅需15分钟
• 开发周期缩短40%:标准化接口和中间件
• BOM成本降低25%:减少冗余硬件配置

3.1.3 技术挑战与解决方案

实时性保证

  • 问题:多传感器数据需要严格时间同步,毫秒级偏差即可导致感知失败
  • 方案:采用TSN(时间敏感网络)+ PTP(精确时间协议)
时间同步架构:
GPS/北斗授时 ──→ 主时钟(Grandmaster) 
                       ↓ PTP协议
       ┌──────────────┼──────────────┐
       ↓              ↓              ↓
   智驾域时钟     座舱域时钟     底盘域时钟
       ↓              ↓              ↓
   传感器同步     显示同步      执行器同步

关键指标:
• 时间同步精度:<100ns (802.1AS-2020标准)
• 网络延迟:<1ms (确定性保证)
• 抖动:<100μs
• 丢包率:<10^-6

功能安全设计

  • ASIL-D要求:故障率 < 10 FIT (10^-8/h),99.999%可用性
  • 多层冗余架构
三重冗余安全架构:

Level 1: 硬件冗余
主处理器 ────→ [Lock-Step比对] ←──── 影子处理器
   ↓                  ↓                   ↓
主存储器(ECC)    仲裁器(ASIL-D)    备份存储器(ECC)
   ↓                  ↓                   ↓

Level 2: 软件冗余
主算法路径 ────→ [结果校验] ←──── 简化安全路径
                      ↓
                 安全监控器(QM)

Level 3: 系统冗余
执行器A ←────── [2oo3表决] ────────→ 执行器B
                      ↑
                  执行器C(备份)

故障响应时间:<50ms
安全状态切换:<10ms

热管理挑战

  • 功耗挑战:域控制器功耗200W~500W,是传统ECU的10倍
  • 散热方案对比
散热技术演进:
┌────────────┬──────────┬──────────┬──────────┐
│ 方案        │ 散热能力  │ 成本     │ 应用案例  │
├────────────┼──────────┼──────────┼──────────┤
│ 被动散热    │ <50W     │ $10      │ 低端ADAS │
│ 风冷散热    │ 50-150W  │ $30      │ L2级系统  │
│ 液冷散热    │ 150-400W │ $200     │ L3/L4系统 │
│ 浸没式冷却  │ >400W    │ $500+    │ 数据中心  │
└────────────┴──────────┴──────────┴──────────┘

动态热管理策略(DVFS):
• 温度<60°C:全速运行(100%频率)
• 60-70°C:降频至90%
• 70-80°C:降频至70%,关闭非关键功能
• >80°C:进入安全模式,仅保留基础功能

3.1.4 主要玩家布局

域控制器供应商格局(2021-2022)

| 厂商 | 域控制器平台 | 芯片方案 | 算力 | 首发车型 | 量产时间 | 单价 |

厂商 域控制器平台 芯片方案 算力 首发车型 量产时间 单价
博世 DASy 4.0 Mobileye EyeQ5 24 TOPS 大众ID.4 2021 Q2 $1800
大陆 ADCU NVIDIA Xavier 30 TOPS 蔚来ET7 2022 Q1 $2200
德赛西威 IPU04 地平线征程5×2 256 TOPS 理想L9 2022 Q2 $1500
华为 MDC 610 昇腾610 200 TOPS 极狐αS HI 2021 Q4 $2800
采埃孚 ProAI NVIDIA Orin 254 TOPS 奔驰EQS 2022 Q3 $3500
安波福 SVA Xilinx+Orin 300 TOPS Lyft L4 2022 Q4 $4000
电装 - 瑞萨R-Car V3H 4 TOPS 丰田Mirai 2021 Q3 $800

技术路线对比

不同厂商技术路线特点:

博世(传统Tier1代表):
• 策略:与芯片厂深度绑定,提供完整解决方案
• 优势:功能安全经验丰富,ASIL-D认证完善
• 劣势:创新速度慢,成本高

华为(ICT巨头):
• 策略:全栈自研,从芯片到算法到云服务
• 优势:端云协同,5G-V2X集成
• 劣势:国际市场受限,生态封闭

新势力供应商(德赛西威等):
• 策略:灵活选择芯片,快速迭代
• 优势:成本控制好,响应速度快
• 劣势:技术积累不足,安全认证经验少

3.2 地平线征程5:国产算力突破

3.2.1 芯片架构创新

征程5(Journey 5)采用地平线自研BPU(Brain Processing Unit)架构:

征程5芯片架构
┌────────────────────────────────────────────────────────────┐
│                     Journey 5 SoC架构                       │
├────────────────────────────────────────────────────────────┤
│  ┌──────────────────────────────────────────────────┐     │
│  │            CPU子系统(8x Cortex-A55)              │     │
│  │  ┌────┐ ┌────┐ ┌────┐ ┌────┐                   │     │
│  │  │Core│ │Core│ │Core│ │Core│  主频: 1.2GHz      │     │
│  │  └────┘ └────┘ └────┘ └────┘                   │     │
│  │  ┌────┐ ┌────┐ ┌────┐ ┌────┐                   │     │
│  │  │Core│ │Core│ │Core│ │Core│  L2: 2MB          │     │
│  │  └────┘ └────┘ └────┘ └────┘                   │     │
│  └────────────────────┬─────────────────────────────┘     │
│                       │                                    │
│  ┌────────────────────┼─────────────────────────────┐     │
│  │     BPU子系统       │      (贝叶斯架构3.0)         │     │
│  │  ┌─────────┐ ┌─────┴────┐ ┌─────────┐          │     │
│  │  │  BPU-0  │ │  BPU-1    │ │  BPU-2  │          │     │
│  │  │ 42.7TOPS│ │ 42.7TOPS  │ │ 42.7TOPS│          │     │
│  │  └─────┬───┘ └─────┬────┘ └────┬────┘          │     │
│  │        └───────────┬┴────────────┘               │     │
│  │                    ↓                              │     │
│  │          ┌────────────────────┐                  │     │
│  │          │   共享SRAM (8MB)    │                  │     │
│  │          └────────────────────┘                  │     │
│  └───────────────────────────────────────────────────┘     │
│                                                            │
│  ┌────────────────────────────────────────────────────┐   │
│  │                  片上互联 (NoC)                      │   │
│  │    带宽: 400GB/s   延迟: <100ns   QoS: 4级          │   │
│  └────────────────────────────────────────────────────┘   │
│                           ↓                                │
│  ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐    │
│  │   ISP     │ │   DSP    │ │   VPU    │ │  安全岛   │    │
│  │ 8路MIPI  │ │ 2x C71x  │ │ H.265    │ │ Cortex-R5 │    │
│  └──────────┘ └──────────┘ └──────────┘ └──────────┘    │
│                                                            │
│  ┌────────────────────────────────────────────────────┐   │
│  │              内存控制器 (LPDDR4)                     │   │
│  │    位宽: 64bit   频率: 3200MHz   带宽: 25.6GB/s     │   │
│  └────────────────────────────────────────────────────┘   │
└────────────────────────────────────────────────────────────┘

制程: 16nm FinFET (TSMC)
功耗: 30W (典型)
封装: FCBGA 37.5x37.5mm

3.2.2 BPU贝叶斯架构深度解析

地平线BPU采用创新的贝叶斯架构,专为视觉感知优化,是征程5实现高能效比的核心:

架构设计理念

BPU 3.0 贝叶斯架构核心设计:
┌──────────────────────────────────────────────────────┐
│                    BPU核心架构                         │
├──────────────────────────────────────────────────────┤
│  ┌─────────────────────────────────────────────┐    │
│  │           计算核心阵列 (Compute Core Array)   │    │
│  │  ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐      │    │
│  │  │ MAC   │ │ MAC   │ │ MAC   │ │ MAC   │      │    │
│  │  │ 4096  │ │ 4096  │ │ 4096  │ │ 4096  │      │    │
│  │  └───┬──┘ └───┬──┘ └───┬──┘ └───┬──┘      │    │
│  │      └─────────┴─────────┴─────────┘         │    │
│  │                    ↓                          │    │
│  │         ┌─────────────────────┐              │    │
│  │         │  向量处理单元 (VPU)   │              │    │
│  │         │  SIMD-1024宽度       │              │    │
│  │         └─────────────────────┘              │    │
│  └─────────────────────────────────────────────┘    │
│                        ↓                              │
│  ┌─────────────────────────────────────────────┐    │
│  │         层次化存储系统 (Memory Hierarchy)      │    │
│  │  L0: 寄存器组  (256KB/核)                     │    │
│  │  L1: SRAM     (2MB/簇)                       │    │
│  │  L2: 共享缓存  (8MB全局)                      │    │
│  │  L3: LPDDR4   (8GB外存)                      │    │
│  └─────────────────────────────────────────────┘    │
└──────────────────────────────────────────────────────┘

核心创新点

  1. 稀疏计算优化
稀疏度加速机制:
• 动态稀疏检测:硬件自动识别零值,跳过计算
• 结构化剪枝:

  - 2:4稀疏(50%稀疏度):2.0x加速
  - 4:8稀疏(50%稀疏度):1.8x加速
  - 块稀疏(8x8 block):3.2x加速
• 稀疏索引压缩:减少40%内存带宽

实测性能提升(ResNet-50):
密集计算:1.2ms/帧
50%稀疏:0.6ms/帧
75%稀疏:0.4ms/帧
  1. 混合精度计算
数据类型支持与性能:
┌──────────────────────────────────────────────┐
│ 数据类型 │ 峰值算力 │ 典型功耗 │ 应用场景      │
├──────────────────────────────────────────────┤
│ INT4    │ 256 TOPS│ 15W     │ 分类网络      │
│ INT8    │ 128 TOPS│ 20W     │ 检测网络      │
│ INT16   │ 64 TOPS │ 25W     │ 关键点检测    │
│ FP16    │ 32 TOPS │ 30W     │ 在线学习      │
│ BF16    │ 32 TOPS │ 28W     │ Transformer  │
└──────────────────────────────────────────────┘

自动混合精度策略:
• 首层/末层:INT16保证精度
• 中间层:INT8平衡精度与性能
• 激活值:动态量化
  1. 算子融合技术
融合模式:
• Conv+BN+ReLU:3合1融合,减少2次内存访问
• Conv+Add+ReLU:残差块优化
• MatMul+Softmax:Attention优化
• 自定义融合:通过编译器指令

内存访问优化效果:
未融合:100%内存带宽占用
融合后:40%内存带宽占用
性能提升:2.5倍

与竞品对比优势

| 特性 | 征程5 BPU | Mobileye EyeQ5 | NVIDIA Xavier |

特性 征程5 BPU Mobileye EyeQ5 NVIDIA Xavier
算力效率(TOPS/W) 4.3 2.4 1.3
ResNet-50延迟 0.8ms 1.2ms 1.5ms
YOLOv5s FPS 240 160 180
动态范围量化 支持 不支持 部分支持

3.2.3 软件生态与工具链

天工开物(Horizon OpenExplorer)平台

开发流程
┌──────────┐     ┌──────────┐     ┌──────────┐     ┌──────────┐
│ AI模型    │────→│ 模型转换  │────→│ 量化优化  │────→│ 部署运行  │
│ PyTorch  │     │ ONNX     │     │ INT8     │     │ Runtime  │
│ TensorFlow│     │ Converter│     │ Calibrate│     │ Engine   │
└──────────┘     └──────────┘     └──────────┘     └──────────┘
     ↓                 ↓                 ↓                 ↓
支持模型:           精度保证:         性能优化:         部署便利:
• YOLO系列        • <1%精度损失      • 自动算子融合     • C++/Python API
• CenterNet       • PTQ/QAT支持      • 内存优化        • ROS集成
• BEVFormer       • 逐层分析工具      • 多流并发        • Docker镜像

算法适配案例

BEV感知算法优化

  • 原始FP32模型:45ms/帧
  • INT8量化后:12ms/帧
  • BPU专用优化:8ms/帧
  • 精度损失:mAP下降 < 0.5%

3.2.4 商业落地与市场表现

主要客户与项目

  1. 理想汽车 - L9/L8/L7全系标配 - 双征程5方案(256 TOPS) - 支持高速NOA功能

  2. 长城汽车 - 魏牌摩卡DHT-PHEV - 单征程5 + 高算力MCU - 城市记忆泊车功能

  3. 比亚迪 - 高端品牌仰望U8 - 四征程5级联(512 TOPS) - L3级自动驾驶预研

成本优势分析

成本对比(2022年Q4批量价格)
┌────────────────────────────────────┐
│ 征程5单片:      ~$120            │
│ EyeQ5单片:      ~$200            │
│ Xavier模组:     ~$450            │
│ Orin模组:       ~$800            │
└────────────────────────────────────┘
性价比指标:$/TOPS
征程5:  0.94
EyeQ5:  8.33
Xavier: 15.0
Orin:   2.91

3.3 黑芝麻华山二号A1000系列:高端突破

3.3.1 产品矩阵与定位

黑芝麻智能在2021年推出华山二号A1000系列,形成完整产品矩阵:

A1000系列产品线
┌──────────────────────────────────────────────────────────┐
│  型号      算力      目标市场        典型应用            │
├──────────────────────────────────────────────────────────┤
│  A1000L    16 TOPS   L2级ADAS       行泊一体入门版      │
│  A1000     40 TOPS   L2+级ADAS      高速NOA            │
│  A1000 Pro 58 TOPS   L2++级         城市NOA            │
│  A1000-SE  116 TOPS  L3/L4级        Robotaxi预研        │
└──────────────────────────────────────────────────────────┘

3.3.2 核心技术架构

NeuralIQ ISP + NPU融合架构

A1000 Pro架构框图
┌─────────────────────────────────────────────────────────────┐
│                      A1000 Pro SoC                           │
├─────────────────────────────────────────────────────────────┤
│  ┌───────────────────────────────────────────────────┐      │
│  │              CPU Complex (8核ARM)                  │      │
│  │   ┌─────────────────┐  ┌─────────────────┐       │      │
│  │   │ 4x Cortex-A76    │  │ 4x Cortex-A55   │       │      │
│  │   │ @ 2.0GHz         │  │ @ 1.5GHz        │       │      │
│  │   └────────┬─────────┘  └────────┬────────┘       │      │
│  │            └──────────┬───────────┘                │      │
│  │                       ↓                            │      │
│  │              ┌─────────────────┐                  │      │
│  │              │  L3 Cache (4MB) │                  │      │
│  │              └─────────────────┘                  │      │
│  └───────────────────────┬───────────────────────────┘      │
│                          │                                   │
│  ┌───────────────────────┼───────────────────────────┐      │
│  │          NeuralIQ Engine (NPU + ISP融合)          │      │
│  │                       │                           │      │
│  │   ┌──────────┐  ┌────┴─────┐  ┌──────────┐     │      │
│  │   │  ISP-0   │  │  NPU-0    │  │  ISP-1   │     │      │
│  │   │ 4K@30fps │  │  29 TOPS  │  │ 4K@30fps │     │      │
│  │   └────┬─────┘  └─────┬────┘  └────┬─────┘     │      │
│  │        │               │             │            │      │
│  │   ┌────┴────────────────┴────────────┴────┐      │      │
│  │   │         统一内存池 (UMA)               │      │      │
│  │   │    智能调度 | 零拷贝 | 动态分配        │      │      │
│  │   └────────────────────────────────────────┘      │      │
│  │                                                   │      │
│  │   ┌──────────┐  ┌──────────┐  ┌──────────┐     │      │
│  │   │  NPU-1   │  │   DSP    │  │   VPU    │     │      │
│  │   │ 29 TOPS  │  │  Vector  │  │  H.265   │     │      │
│  │   └──────────┘  └──────────┘  └──────────┘     │      │
│  └───────────────────────────────────────────────────┘      │
│                                                              │
│  ┌───────────────────────────────────────────────────┐      │
│  │                 高速互联架构                       │      │
│  │   PCIe 4.0 | CAN-FD | Ethernet TSN | MIPI CSI-2  │      │
│  └───────────────────────────────────────────────────┘      │
│                                                              │
│  功耗: 15W (典型) | 制程: 16nm | 内存: LPDDR4X 64bit       │
└─────────────────────────────────────────────────────────────┘

关键创新技术

  1. 感知前融合(ISP-NPU协同) - RAW数据直接进入NPU处理 - 减少ISP处理导致的信息损失 - 夜间场景识别率提升40%

  2. 动态异构调度 - CPU/NPU/DSP任务自动分配 - 基于负载的功耗管理 - 实时性保证 < 10ms

  3. 自研DynamIQ技术 - 动态量化精度调整 - 关键层FP16,非关键层INT4 - 整体精度损失 < 0.3%

3.3.3 算法优化与部署

山海工具链平台

算法部署流程
┌────────────────────────────────────────────────────────┐
│                     山海平台架构                         │
├────────────────────────────────────────────────────────┤
│  模型输入层                                             │
│  ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐      │
│  │Caffe │ │PyTorch│ │TensorFlow│ │MXNet│ │PaddlePaddle│ │
│  └───┬──┘ └───┬──┘ └───┬──┘ └───┬──┘ └───┬──┘      │
│      └────────┴────────┴────────┴────────┘            │
│                        ↓                                │
│  ┌────────────────────────────────────────────────┐   │
│  │           模型转换器 (Model Converter)          │   │
│  │  • ONNX中间表示  • 图优化  • 算子映射           │   │
│  └────────────────────────────────────────────────┘   │
│                        ↓                                │
│  ┌────────────────────────────────────────────────┐   │
│  │           量化工具 (Quantization Tool)          │   │
│  │  • 自动混合精度  • 敏感度分析  • 校准数据集     │   │
│  └────────────────────────────────────────────────┘   │
│                        ↓                                │
│  ┌────────────────────────────────────────────────┐   │
│  │           编译优化器 (Compiler)                 │   │
│  │  • 算子融合  • 内存规划  • 并行策略生成        │   │
│  └────────────────────────────────────────────────┘   │
│                        ↓                                │
│  ┌────────────────────────────────────────────────┐   │
│  │           运行时引擎 (Runtime)                  │   │
│  │  • 多核调度  • 资源管理  • 性能监控            │   │
│  └────────────────────────────────────────────────┘   │
└────────────────────────────────────────────────────────┘

典型算法性能表现

| 模型 | 输入分辨率 | A1000 Pro延迟 | 功耗 | 精度(mAP) |

模型 输入分辨率 A1000 Pro延迟 功耗 精度(mAP)
YOLOv5s 640×640 3.2ms 8W 56.8%
YOLOv7 640×640 5.1ms 10W 69.7%
YOLOX-L 640×640 7.8ms 12W 73.2%
CenterNet 512×512 4.5ms 9W 61.4%
PillarNet 点云 12ms 14W 79.1%

3.3.4 市场应用与客户案例

一汽红旗E-HS9项目

  • 配置:双A1000 Pro (116 TOPS)
  • 传感器:12V5R1L方案
  • 功能:高速NOA + 记忆泊车
  • 量产时间:2022年Q3

江汽集团思皓系列

  • 配置:A1000标准版 (40 TOPS)
  • 成本优势:相比进口方案降低35%
  • 本土化支持:现场技术团队驻场

东风岚图FREE

  • 配置:A1000L (16 TOPS) + 域控制器
  • 特色:首个量产ISP-NPU融合方案
  • 夜间性能:检测距离提升25%

3.3.5 技术发展路线图

黑芝麻技术演进
2020        2021         2022         2023         2024
A500 ───→ A1000 ────→ A1000Pro ───→ 武当C1200 ──→ 武当C1600
(5T)      (40T)       (58T)        (200T)       (400T)
28nm      16nm        16nm         7nm          5nm
 │         │           │            │            │
 └─────────┴───────────┴────────────┴────────────┘
        关键里程碑:
        • ISP融合  • 跨域计算  • Chiplet  • 3D封装

3.4 Intel/Mobileye EyeQ6战略转型

3.4.1 收购后的战略调整

2022年,Intel完成对Mobileye的分拆上市,但保持多数股权控制。这一举措反映了新的战略方向:

Mobileye战略转型
┌──────────────────────────────────────────────────────┐
│  阶段一:垂直整合(2017-2020)                         │
│  • Intel收购,整合制造能力                             │
│  • EyeQ5量产,巩固ADAS市场                           │
│  • REM地图众包平台建设                                │
├──────────────────────────────────────────────────────┤
│  阶段二:开放生态(2021-2022)                         │
│  • EyeQ6架构开放                                      │
│  • 支持外部算法部署                                    │
│  • True AI计算架构发布                                │
├──────────────────────────────────────────────────────┤
│  阶段三:全栈方案(2023-)                            │
│  • SuperVision全栈系统                               │
│  • Chauffeur L4方案                                  │
│  • 自动驾驶即服务(ADaaS)                             │
└──────────────────────────────────────────────────────┘

3.4.2 EyeQ6架构革新

双芯片设计理念

EyeQ6H/EyeQ6L架构对比
┌─────────────────────────────────────────────────────────┐
│                    EyeQ6H (High)                         │
│  ┌─────────────────────────────────────────────┐       │
│  │  CPU集群:12x RISC-V @ 1.5GHz                │       │
│  │  ┌─────┐ ┌─────┐ ┌─────┐ ┌─────┐         │       │
│  │  │Core │ │Core │ │Core │ │Core │ ...     │       │
│  │  └─────┘ └─────┘ └─────┘ └─────┘         │       │
│  └─────────────────────────────────────────────┘       │
│  ┌─────────────────────────────────────────────┐       │
│  │  加速器集群                                   │       │
│  │  • 2x DLA (深度学习)  @ 34 TOPS each       │       │
│  │  • 2x VMP (视觉处理)  @ 12 TOPS each       │       │
│  │  • 1x PMA (策略映射)  @ 8 TOPS            │       │
│  │  • 1x TPC (跟踪预测)  @ 6 TOPS            │       │
│  └─────────────────────────────────────────────┘       │
│  总算力:128 TOPS | 功耗:35W | 制程:7nm              │
└─────────────────────────────────────────────────────────┘

┌─────────────────────────────────────────────────────────┐
│                    EyeQ6L (Lite)                         │
│  ┌─────────────────────────────────────────────┐       │
│  │  CPU集群:8x RISC-V @ 1.2GHz                 │       │
│  └─────────────────────────────────────────────┘       │
│  ┌─────────────────────────────────────────────┐       │
│  │  加速器集群                                   │       │
│  │  • 1x DLA @ 25 TOPS                        │       │
│  │  • 1x VMP @ 10 TOPS                        │       │
│  │  • 共享加速器资源                            │       │
│  └─────────────────────────────────────────────┘       │
│  总算力:35 TOPS | 功耗:15W | 制程:7nm              │
└─────────────────────────────────────────────────────────┘

关键技术特性

  1. True AI架构 - 完全可编程的加速器 - 支持新兴网络结构(Transformer、GNN) - 无需硬件改动即可适配新算法

  2. RSS安全模型 - 责任敏感安全(Responsibility-Sensitive Safety) - 数学验证的安全决策 - 冗余感知路径

  3. 开放策略转变 - 支持客户自定义算法 - 提供SDK和工具链 - 不再强制绑定Mobileye算法栈

3.4.3 SuperVision全栈系统

系统架构

SuperVision系统架构
┌────────────────────────────────────────────────────┐
│                  感知层                             │
│  11个高清摄像头 + 雷达融合                          │
│  ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐           │
│  │前视×3 │ │侧视×4 │ │后视×1 │ │环视×3 │           │
│  └───┬──┘ └───┬──┘ └───┬──┘ └───┬──┘           │
│      └─────────┴─────────┴─────────┘              │
│                      ↓                             │
├────────────────────────────────────────────────────┤
│                  计算层                             │
│         2×EyeQ6H (256 TOPS)                        │
│  ┌────────────┐        ┌────────────┐            │
│  │  主计算单元  │←------→│  备份单元   │            │
│  │  感知+规划  │        │  安全冗余   │            │
│  └────────────┘        └────────────┘            │
│         ↓                    ↓                     │
├────────────────────────────────────────────────────┤
│                  算法层                             │
│  • 端到端深度学习        • RSS安全模型              │
│  • REM高精地图          • 多任务网络               │
│         ↓                                          │
├────────────────────────────────────────────────────┤
│                  执行层                             │
│  横向控制 | 纵向控制 | 故障处理                      │
└────────────────────────────────────────────────────┘

部署案例

极氪001 FR版

  • 首发SuperVision系统
  • 高速NOA + 城市领航辅助
  • 2022年Q4交付

宝马iX xDrive50

  • 定制化SuperVision
  • 欧洲法规适配
  • 2023年量产

3.4.4 市场策略与挑战

竞争优势

  1. 算法积累:20年+视觉算法经验
  2. 数据优势:1.5亿辆车部署,海量路测数据
  3. 安全认证:首个获得德国TÜV认证的L4系统

面临挑战

  1. 激光雷达缺位:纯视觉路线在中国市场接受度低
  2. 开放生态晚:相比NVIDIA生态成熟度不足
  3. 成本压力:中国厂商价格竞争激烈

3.5 域控制器时代的产业影响

3.5.1 供应链重构

供应链演变
传统模式(2020前)              域控时代(2021-2022)
┌──────────┐                   ┌──────────┐
│   OEM    │                   │   OEM    │
└─────┬────┘                   └─────┬────┘
      ↓                               ↓
┌──────────┐                   ┌──────────┐
│  Tier1   │                   │  Tier0.5 │←--- 新角色
│ (博世等)  │                   │ (华为等)  │
└─────┬────┘                   └─────┬────┘
      ↓                               ↓
┌──────────┐                   ┌──────────┐
│  Tier2   │                   │芯片厂商   │←--- 地位提升
│ (零部件)  │                   │ (直供OEM) │
└──────────┘                   └──────────┘

变化要点:
• Tier1角色弱化,部分转型Tier0.5
• 芯片厂商直接与OEM合作
• 软件能力成为核心竞争力
• OEM自研比例大幅提升

3.5.2 技术标准演进

主要标准对比

| 标准维度 | 2020年 | 2022年 | 变化趋势 |

标准维度 2020年 2022年 变化趋势
算力要求 2-10 TOPS 50-200 TOPS 20倍增长
通信带宽 CAN (1Mbps) 车载以太网 (1Gbps) 1000倍提升
软件架构 Classic AUTOSAR Adaptive AUTOSAR 面向服务
安全等级 ASIL-B为主 ASIL-D标配 安全要求提升
OTA能力 部分支持 全面支持 成为标配

3.5.3 成本结构变化

整车成本占比变化
2020年传统车型                 2022年智能车型
┌────────────────┐            ┌────────────────┐
│ 机械部件  45%   │            │ 机械部件  35%   │
│ 动力系统  25%   │            │ 动力系统  20%   │
│ 内饰     15%   │            │ 电子电气  25%   │←─ 大幅提升
│ 电子电气  10%   │            │ 软件     10%   │←─ 新增项
│ 其他      5%   │            │ 内饰      7%   │
└────────────────┘            │ 其他      3%   │
                              └────────────────┘

域控制器成本构成(以智驾域为例):
• 芯片:40-50%
• PCB及被动元件:20-25%
• 存储器:15-20%
• 连接器:10-15%
• 散热及结构件:5-10%

3.6 本章总结与展望

3.6.1 关键芯片性能对比

2021-2022年主流芯片综合对比
┌──────────────────────────────────────────────────────────────┐
│ 芯片型号    │ 算力   │ 功耗 │ 制程 │ 内存带宽 │ 单价  │ 量产 │
├──────────────────────────────────────────────────────────────┤
│ 地平线J5   │ 128T  │ 30W │ 16nm│ 25.6GB/s│ $120 │ 2021Q4│
│ 黑芝麻A1000│ 58T   │ 15W │ 16nm│ 19.2GB/s│ $80  │ 2021Q3│
│ EyeQ6H     │ 128T  │ 35W │ 7nm │ 38.4GB/s│ $250 │ 2022Q4│
│ Orin-X     │ 275T  │ 60W │ 7nm │ 204GB/s │ $450 │ 2022Q1│
│ TDA4-Mid   │ 8T    │ 15W │ 28nm│ 17GB/s  │ $45  │ 2021Q1│
│ 高通SA8540 │ 100T  │ 45W │ 5nm │ 64GB/s  │ $200 │ 2022Q3│
└──────────────────────────────────────────────────────────────┘
T = TOPS

3.6.2 技术发展趋势

  1. 架构融合趋势 - ISP与NPU深度融合 - CPU/GPU/NPU统一内存架构 - 跨域计算资源共享

  2. 算法硬件协同 - Transformer专用加速单元 - BEV感知硬件优化 - 端到端网络部署支持

  3. 生态开放化 - 工具链标准化 - 中间件通用化 - 算法模型可移植

3.6.3 市场格局预判

2022年底市场份额(中国市场)
┌────────────────────────────────┐
│ Mobileye      25% ↓            │
│ NVIDIA        20% ↑            │
│ 地平线         18% ↑↑           │
│ 高通          12% →            │
│ 黑芝麻         8%  ↑            │
│ TI            7%  ↓            │
│ 华为          5%  ↑            │
│ 其他          5%               │
└────────────────────────────────┘

关键观察:
• 国产化替代加速,本土厂商份额超30%
• NVIDIA凭借Orin快速增长
• Mobileye份额下滑但仍是领导者
• 新玩家不断涌入,竞争加剧

3.6.4 下一阶段展望

2023年将迎来更大变革:

  • 超高算力时代:单芯片突破500 TOPS
  • 中央计算架构:从域控向中央计算演进
  • 大模型上车:Transformer成为标配
  • 成本大战:芯片价格战全面打响

域控制器元年奠定了智能汽车计算架构的基础,为后续的爆发式增长铺平了道路。国产芯片的崛起不仅打破了国外垄断,更推动了整个产业的创新速度。下一章,我们将深入探讨大模型如何彻底改变自动驾驶芯片的设计理念。


注:本章数据来源于各公司官方发布、行业研究报告及公开市场信息,截至2022年12月。