第3章:域控制器元年(2021-2022)
章节概述
2021-2022年是自动驾驶产业的关键转折点。整车电子电气架构从分布式ECU向域控制器演进,标志着汽车智能化进入新阶段。这一时期,国产芯片厂商快速崛起,地平线征程5以单颗128 TOPS的算力打破了国外垄断,黑芝麻华山二号A1000系列在高端市场站稳脚跟。同时,Intel完成对Mobileye的收购后,推出EyeQ6战略,试图在架构变革中重新定义市场格局。
3.1 E/E架构革命:从分布式到集中式
3.1.1 传统分布式架构的困境
2021年之前,汽车电子系统采用分布式ECU架构,一辆高端车型可能包含超过100个ECU,分别控制不同功能。以2020年奥迪A8为例,整车包含超过150个ECU,涵盖动力、底盘、车身、信息娱乐等各个领域:
传统分布式ECU架构(2020年典型配置)
┌─────────────────────────────────────────────────────────────┐
│ 前视摄像头 ──→ [ECU1] ──┐ │
│ 侧视摄像头 ──→ [ECU2] ──┤ 处理器配置: │
│ 后视摄像头 ──→ [ECU3] ──┤ • MCU: 32-bit @ 200MHz │
│ 毫米波雷达 ──→ [ECU4] ──┼──→ CAN/LIN总线 ──→ 中央网关 │
│ 超声波雷达 ──→ [ECU5] ──┤ 带宽: 500Kbps (CAN) │
│ 激光雷达 ──→ [ECU6] ──┤ ↓ │
│ │ 各执行单元 │
│ 每个ECU独立配置: │ (制动/转向/动力) │
│ • CPU: ARM Cortex-M4 │ │
│ • RAM: 256KB-2MB │ 总线负载率: >70% │
│ • Flash: 1MB-4MB │ 消息延迟: 10-100ms │
└─────────────────────────────────────────────────────────────┘
关键问题详解:
• 线束复杂度高:
- 总重量: 60-80kg (特斯拉Model 3仅15kg)
- 线束长度: 5km+ (域控架构减少至1.5km)
- 成本: $3000-4000 (占整车BOM 8-10%)
- 装配工时: 20+ 小时
• 数据孤岛:
- 各ECU独立处理,数据格式不统一
- 跨ECU通信延迟高达100ms
- 无法实现多传感器时空同步
- 算法迭代需要多方协调
• 算力浪费:
- 平均CPU利用率: 15-30%
- 峰值负载不均衡
- 冗余配置导致成本增加
- 无法动态调配计算资源
• OTA困难:
- 需要逐个更新ECU固件 (平均耗时2-4小时)
- 版本依赖复杂,容易出现兼容性问题
- 回滚机制不完善,风险高
- 用户体验差,需要到店升级
3.1.2 域控制器架构优势
域控制器将功能相近的ECU整合到统一计算平台,实现了计算资源的集中化和标准化:
域控制器架构(2021-2022年主流方案)
┌──────────────────────────────────────────────────────────────────┐
│ 整车域控制器布局 │
├──────────────────────────────────────────────────────────────────┤
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │
│ │ 智驾域 │ │ 座舱域 │ │ 车身域 │ │
│ │ (ADAS DC) │ │ (CDC) │ │ (BDC) │ │
│ │ 芯片:Orin-X │ │ 芯片:8155 │ │ 芯片:TC397 │ │
│ │ 算力:275T │ │ 算力:8T │ │ 算力:2.5G │ │
│ │ ·感知融合 │ │ ·信息娱乐 │ │ ·车灯控制 │ │
│ │ ·路径规划 │ │ ·仪表显示 │ │ ·门窗控制 │ │
│ │ ·决策控制 │ │ ·语音交互 │ │ ·空调系统 │ │
│ │ OS: QNX 7.1 │ │ OS: Android │ │ OS: AUTOSAR │ │
│ └──────┬──────┘ └──────┬──────┘ └──────┬──────┘ │
│ │ │ │ │
│ └─────────────────┼─────────────────┘ │
│ ↓ │
│ ┌───────────────┐ │
│ │ 以太网骨干网 │ │
│ │ TSN + AVB │ │
│ │ 带宽:10Gbps │ │
│ │ 延迟:<1ms │ │
│ └───────┬───────┘ │
│ ↓ │
│ ┌─────────────┐ ┌──────┴──────┐ ┌─────────────┐ │
│ │ 动力域 │ │ 中央网关 │ │ 底盘域 │ │
│ │ (PDC) │ │ (CGW) │ │ (CDC) │ │
│ │ 芯片:TC399 │ │ 芯片:S32G │ │ 芯片:TC397 │ │
│ │ ·电机控制 │ │ ·路由管理 │ │ ·制动系统 │ │
│ │ ·电池管理 │ │ ·安全防护 │ │ ·转向系统 │ │
│ │ ·充电管理 │ │ ·OTA管理 │ │ ·悬架控制 │ │
│ │ ASIL-D认证 │ │ ·诊断服务 │ │ ASIL-D认证 │ │
│ └─────────────┘ └─────────────┘ └─────────────┘ │
└──────────────────────────────────────────────────────────────────┘
关键优势量化:
• 线束减少70%:从5km降至1.5km,重量减少40kg
• 算力利用率提升至60-80%:动态资源调配
• OTA时间缩短90%:整域更新仅需15分钟
• 开发周期缩短40%:标准化接口和中间件
• BOM成本降低25%:减少冗余硬件配置
3.1.3 技术挑战与解决方案
实时性保证
- 问题:多传感器数据需要严格时间同步,毫秒级偏差即可导致感知失败
- 方案:采用TSN(时间敏感网络)+ PTP(精确时间协议)
时间同步架构:
GPS/北斗授时 ──→ 主时钟(Grandmaster)
↓ PTP协议
┌──────────────┼──────────────┐
↓ ↓ ↓
智驾域时钟 座舱域时钟 底盘域时钟
↓ ↓ ↓
传感器同步 显示同步 执行器同步
关键指标:
• 时间同步精度:<100ns (802.1AS-2020标准)
• 网络延迟:<1ms (确定性保证)
• 抖动:<100μs
• 丢包率:<10^-6
功能安全设计
- ASIL-D要求:故障率 < 10 FIT (10^-8/h),99.999%可用性
- 多层冗余架构:
三重冗余安全架构:
Level 1: 硬件冗余
主处理器 ────→ [Lock-Step比对] ←──── 影子处理器
↓ ↓ ↓
主存储器(ECC) 仲裁器(ASIL-D) 备份存储器(ECC)
↓ ↓ ↓
Level 2: 软件冗余
主算法路径 ────→ [结果校验] ←──── 简化安全路径
↓
安全监控器(QM)
Level 3: 系统冗余
执行器A ←────── [2oo3表决] ────────→ 执行器B
↑
执行器C(备份)
故障响应时间:<50ms
安全状态切换:<10ms
热管理挑战
- 功耗挑战:域控制器功耗200W~500W,是传统ECU的10倍
- 散热方案对比:
散热技术演进:
┌────────────┬──────────┬──────────┬──────────┐
│ 方案 │ 散热能力 │ 成本 │ 应用案例 │
├────────────┼──────────┼──────────┼──────────┤
│ 被动散热 │ <50W │ $10 │ 低端ADAS │
│ 风冷散热 │ 50-150W │ $30 │ L2级系统 │
│ 液冷散热 │ 150-400W │ $200 │ L3/L4系统 │
│ 浸没式冷却 │ >400W │ $500+ │ 数据中心 │
└────────────┴──────────┴──────────┴──────────┘
动态热管理策略(DVFS):
• 温度<60°C:全速运行(100%频率)
• 60-70°C:降频至90%
• 70-80°C:降频至70%,关闭非关键功能
• >80°C:进入安全模式,仅保留基础功能
3.1.4 主要玩家布局
域控制器供应商格局(2021-2022)
| 厂商 | 域控制器平台 | 芯片方案 | 算力 | 首发车型 | 量产时间 | 单价 |
| 厂商 | 域控制器平台 | 芯片方案 | 算力 | 首发车型 | 量产时间 | 单价 |
|---|---|---|---|---|---|---|
| 博世 | DASy 4.0 | Mobileye EyeQ5 | 24 TOPS | 大众ID.4 | 2021 Q2 | $1800 |
| 大陆 | ADCU | NVIDIA Xavier | 30 TOPS | 蔚来ET7 | 2022 Q1 | $2200 |
| 德赛西威 | IPU04 | 地平线征程5×2 | 256 TOPS | 理想L9 | 2022 Q2 | $1500 |
| 华为 | MDC 610 | 昇腾610 | 200 TOPS | 极狐αS HI | 2021 Q4 | $2800 |
| 采埃孚 | ProAI | NVIDIA Orin | 254 TOPS | 奔驰EQS | 2022 Q3 | $3500 |
| 安波福 | SVA | Xilinx+Orin | 300 TOPS | Lyft L4 | 2022 Q4 | $4000 |
| 电装 | - | 瑞萨R-Car V3H | 4 TOPS | 丰田Mirai | 2021 Q3 | $800 |
技术路线对比
不同厂商技术路线特点:
博世(传统Tier1代表):
• 策略:与芯片厂深度绑定,提供完整解决方案
• 优势:功能安全经验丰富,ASIL-D认证完善
• 劣势:创新速度慢,成本高
华为(ICT巨头):
• 策略:全栈自研,从芯片到算法到云服务
• 优势:端云协同,5G-V2X集成
• 劣势:国际市场受限,生态封闭
新势力供应商(德赛西威等):
• 策略:灵活选择芯片,快速迭代
• 优势:成本控制好,响应速度快
• 劣势:技术积累不足,安全认证经验少
3.2 地平线征程5:国产算力突破
3.2.1 芯片架构创新
征程5(Journey 5)采用地平线自研BPU(Brain Processing Unit)架构:
征程5芯片架构
┌────────────────────────────────────────────────────────────┐
│ Journey 5 SoC架构 │
├────────────────────────────────────────────────────────────┤
│ ┌──────────────────────────────────────────────────┐ │
│ │ CPU子系统(8x Cortex-A55) │ │
│ │ ┌────┐ ┌────┐ ┌────┐ ┌────┐ │ │
│ │ │Core│ │Core│ │Core│ │Core│ 主频: 1.2GHz │ │
│ │ └────┘ └────┘ └────┘ └────┘ │ │
│ │ ┌────┐ ┌────┐ ┌────┐ ┌────┐ │ │
│ │ │Core│ │Core│ │Core│ │Core│ L2: 2MB │ │
│ │ └────┘ └────┘ └────┘ └────┘ │ │
│ └────────────────────┬─────────────────────────────┘ │
│ │ │
│ ┌────────────────────┼─────────────────────────────┐ │
│ │ BPU子系统 │ (贝叶斯架构3.0) │ │
│ │ ┌─────────┐ ┌─────┴────┐ ┌─────────┐ │ │
│ │ │ BPU-0 │ │ BPU-1 │ │ BPU-2 │ │ │
│ │ │ 42.7TOPS│ │ 42.7TOPS │ │ 42.7TOPS│ │ │
│ │ └─────┬───┘ └─────┬────┘ └────┬────┘ │ │
│ │ └───────────┬┴────────────┘ │ │
│ │ ↓ │ │
│ │ ┌────────────────────┐ │ │
│ │ │ 共享SRAM (8MB) │ │ │
│ │ └────────────────────┘ │ │
│ └───────────────────────────────────────────────────┘ │
│ │
│ ┌────────────────────────────────────────────────────┐ │
│ │ 片上互联 (NoC) │ │
│ │ 带宽: 400GB/s 延迟: <100ns QoS: 4级 │ │
│ └────────────────────────────────────────────────────┘ │
│ ↓ │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │ ISP │ │ DSP │ │ VPU │ │ 安全岛 │ │
│ │ 8路MIPI │ │ 2x C71x │ │ H.265 │ │ Cortex-R5 │ │
│ └──────────┘ └──────────┘ └──────────┘ └──────────┘ │
│ │
│ ┌────────────────────────────────────────────────────┐ │
│ │ 内存控制器 (LPDDR4) │ │
│ │ 位宽: 64bit 频率: 3200MHz 带宽: 25.6GB/s │ │
│ └────────────────────────────────────────────────────┘ │
└────────────────────────────────────────────────────────────┘
制程: 16nm FinFET (TSMC)
功耗: 30W (典型)
封装: FCBGA 37.5x37.5mm
3.2.2 BPU贝叶斯架构深度解析
地平线BPU采用创新的贝叶斯架构,专为视觉感知优化,是征程5实现高能效比的核心:
架构设计理念
BPU 3.0 贝叶斯架构核心设计:
┌──────────────────────────────────────────────────────┐
│ BPU核心架构 │
├──────────────────────────────────────────────────────┤
│ ┌─────────────────────────────────────────────┐ │
│ │ 计算核心阵列 (Compute Core Array) │ │
│ │ ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐ │ │
│ │ │ MAC │ │ MAC │ │ MAC │ │ MAC │ │ │
│ │ │ 4096 │ │ 4096 │ │ 4096 │ │ 4096 │ │ │
│ │ └───┬──┘ └───┬──┘ └───┬──┘ └───┬──┘ │ │
│ │ └─────────┴─────────┴─────────┘ │ │
│ │ ↓ │ │
│ │ ┌─────────────────────┐ │ │
│ │ │ 向量处理单元 (VPU) │ │ │
│ │ │ SIMD-1024宽度 │ │ │
│ │ └─────────────────────┘ │ │
│ └─────────────────────────────────────────────┘ │
│ ↓ │
│ ┌─────────────────────────────────────────────┐ │
│ │ 层次化存储系统 (Memory Hierarchy) │ │
│ │ L0: 寄存器组 (256KB/核) │ │
│ │ L1: SRAM (2MB/簇) │ │
│ │ L2: 共享缓存 (8MB全局) │ │
│ │ L3: LPDDR4 (8GB外存) │ │
│ └─────────────────────────────────────────────┘ │
└──────────────────────────────────────────────────────┘
核心创新点
- 稀疏计算优化
稀疏度加速机制:
• 动态稀疏检测:硬件自动识别零值,跳过计算
• 结构化剪枝:
- 2:4稀疏(50%稀疏度):2.0x加速
- 4:8稀疏(50%稀疏度):1.8x加速
- 块稀疏(8x8 block):3.2x加速
• 稀疏索引压缩:减少40%内存带宽
实测性能提升(ResNet-50):
密集计算:1.2ms/帧
50%稀疏:0.6ms/帧
75%稀疏:0.4ms/帧
- 混合精度计算
数据类型支持与性能:
┌──────────────────────────────────────────────┐
│ 数据类型 │ 峰值算力 │ 典型功耗 │ 应用场景 │
├──────────────────────────────────────────────┤
│ INT4 │ 256 TOPS│ 15W │ 分类网络 │
│ INT8 │ 128 TOPS│ 20W │ 检测网络 │
│ INT16 │ 64 TOPS │ 25W │ 关键点检测 │
│ FP16 │ 32 TOPS │ 30W │ 在线学习 │
│ BF16 │ 32 TOPS │ 28W │ Transformer │
└──────────────────────────────────────────────┘
自动混合精度策略:
• 首层/末层:INT16保证精度
• 中间层:INT8平衡精度与性能
• 激活值:动态量化
- 算子融合技术
融合模式:
• Conv+BN+ReLU:3合1融合,减少2次内存访问
• Conv+Add+ReLU:残差块优化
• MatMul+Softmax:Attention优化
• 自定义融合:通过编译器指令
内存访问优化效果:
未融合:100%内存带宽占用
融合后:40%内存带宽占用
性能提升:2.5倍
与竞品对比优势
| 特性 | 征程5 BPU | Mobileye EyeQ5 | NVIDIA Xavier |
| 特性 | 征程5 BPU | Mobileye EyeQ5 | NVIDIA Xavier |
|---|---|---|---|
| 算力效率(TOPS/W) | 4.3 | 2.4 | 1.3 |
| ResNet-50延迟 | 0.8ms | 1.2ms | 1.5ms |
| YOLOv5s FPS | 240 | 160 | 180 |
| 动态范围量化 | 支持 | 不支持 | 部分支持 |
3.2.3 软件生态与工具链
天工开物(Horizon OpenExplorer)平台
开发流程
┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐
│ AI模型 │────→│ 模型转换 │────→│ 量化优化 │────→│ 部署运行 │
│ PyTorch │ │ ONNX │ │ INT8 │ │ Runtime │
│ TensorFlow│ │ Converter│ │ Calibrate│ │ Engine │
└──────────┘ └──────────┘ └──────────┘ └──────────┘
↓ ↓ ↓ ↓
支持模型: 精度保证: 性能优化: 部署便利:
• YOLO系列 • <1%精度损失 • 自动算子融合 • C++/Python API
• CenterNet • PTQ/QAT支持 • 内存优化 • ROS集成
• BEVFormer • 逐层分析工具 • 多流并发 • Docker镜像
算法适配案例
BEV感知算法优化
- 原始FP32模型:45ms/帧
- INT8量化后:12ms/帧
- BPU专用优化:8ms/帧
- 精度损失:mAP下降 < 0.5%
3.2.4 商业落地与市场表现
主要客户与项目
-
理想汽车 - L9/L8/L7全系标配 - 双征程5方案(256 TOPS) - 支持高速NOA功能
-
长城汽车 - 魏牌摩卡DHT-PHEV - 单征程5 + 高算力MCU - 城市记忆泊车功能
-
比亚迪 - 高端品牌仰望U8 - 四征程5级联(512 TOPS) - L3级自动驾驶预研
成本优势分析
成本对比(2022年Q4批量价格)
┌────────────────────────────────────┐
│ 征程5单片: ~$120 │
│ EyeQ5单片: ~$200 │
│ Xavier模组: ~$450 │
│ Orin模组: ~$800 │
└────────────────────────────────────┘
性价比指标:$/TOPS
征程5: 0.94
EyeQ5: 8.33
Xavier: 15.0
Orin: 2.91
3.3 黑芝麻华山二号A1000系列:高端突破
3.3.1 产品矩阵与定位
黑芝麻智能在2021年推出华山二号A1000系列,形成完整产品矩阵:
A1000系列产品线
┌──────────────────────────────────────────────────────────┐
│ 型号 算力 目标市场 典型应用 │
├──────────────────────────────────────────────────────────┤
│ A1000L 16 TOPS L2级ADAS 行泊一体入门版 │
│ A1000 40 TOPS L2+级ADAS 高速NOA │
│ A1000 Pro 58 TOPS L2++级 城市NOA │
│ A1000-SE 116 TOPS L3/L4级 Robotaxi预研 │
└──────────────────────────────────────────────────────────┘
3.3.2 核心技术架构
NeuralIQ ISP + NPU融合架构
A1000 Pro架构框图
┌─────────────────────────────────────────────────────────────┐
│ A1000 Pro SoC │
├─────────────────────────────────────────────────────────────┤
│ ┌───────────────────────────────────────────────────┐ │
│ │ CPU Complex (8核ARM) │ │
│ │ ┌─────────────────┐ ┌─────────────────┐ │ │
│ │ │ 4x Cortex-A76 │ │ 4x Cortex-A55 │ │ │
│ │ │ @ 2.0GHz │ │ @ 1.5GHz │ │ │
│ │ └────────┬─────────┘ └────────┬────────┘ │ │
│ │ └──────────┬───────────┘ │ │
│ │ ↓ │ │
│ │ ┌─────────────────┐ │ │
│ │ │ L3 Cache (4MB) │ │ │
│ │ └─────────────────┘ │ │
│ └───────────────────────┬───────────────────────────┘ │
│ │ │
│ ┌───────────────────────┼───────────────────────────┐ │
│ │ NeuralIQ Engine (NPU + ISP融合) │ │
│ │ │ │ │
│ │ ┌──────────┐ ┌────┴─────┐ ┌──────────┐ │ │
│ │ │ ISP-0 │ │ NPU-0 │ │ ISP-1 │ │ │
│ │ │ 4K@30fps │ │ 29 TOPS │ │ 4K@30fps │ │ │
│ │ └────┬─────┘ └─────┬────┘ └────┬─────┘ │ │
│ │ │ │ │ │ │
│ │ ┌────┴────────────────┴────────────┴────┐ │ │
│ │ │ 统一内存池 (UMA) │ │ │
│ │ │ 智能调度 | 零拷贝 | 动态分配 │ │ │
│ │ └────────────────────────────────────────┘ │ │
│ │ │ │
│ │ ┌──────────┐ ┌──────────┐ ┌──────────┐ │ │
│ │ │ NPU-1 │ │ DSP │ │ VPU │ │ │
│ │ │ 29 TOPS │ │ Vector │ │ H.265 │ │ │
│ │ └──────────┘ └──────────┘ └──────────┘ │ │
│ └───────────────────────────────────────────────────┘ │
│ │
│ ┌───────────────────────────────────────────────────┐ │
│ │ 高速互联架构 │ │
│ │ PCIe 4.0 | CAN-FD | Ethernet TSN | MIPI CSI-2 │ │
│ └───────────────────────────────────────────────────┘ │
│ │
│ 功耗: 15W (典型) | 制程: 16nm | 内存: LPDDR4X 64bit │
└─────────────────────────────────────────────────────────────┘
关键创新技术
-
感知前融合(ISP-NPU协同) - RAW数据直接进入NPU处理 - 减少ISP处理导致的信息损失 - 夜间场景识别率提升40%
-
动态异构调度 - CPU/NPU/DSP任务自动分配 - 基于负载的功耗管理 - 实时性保证 < 10ms
-
自研DynamIQ技术 - 动态量化精度调整 - 关键层FP16,非关键层INT4 - 整体精度损失 < 0.3%
3.3.3 算法优化与部署
山海工具链平台
算法部署流程
┌────────────────────────────────────────────────────────┐
│ 山海平台架构 │
├────────────────────────────────────────────────────────┤
│ 模型输入层 │
│ ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐ │
│ │Caffe │ │PyTorch│ │TensorFlow│ │MXNet│ │PaddlePaddle│ │
│ └───┬──┘ └───┬──┘ └───┬──┘ └───┬──┘ └───┬──┘ │
│ └────────┴────────┴────────┴────────┘ │
│ ↓ │
│ ┌────────────────────────────────────────────────┐ │
│ │ 模型转换器 (Model Converter) │ │
│ │ • ONNX中间表示 • 图优化 • 算子映射 │ │
│ └────────────────────────────────────────────────┘ │
│ ↓ │
│ ┌────────────────────────────────────────────────┐ │
│ │ 量化工具 (Quantization Tool) │ │
│ │ • 自动混合精度 • 敏感度分析 • 校准数据集 │ │
│ └────────────────────────────────────────────────┘ │
│ ↓ │
│ ┌────────────────────────────────────────────────┐ │
│ │ 编译优化器 (Compiler) │ │
│ │ • 算子融合 • 内存规划 • 并行策略生成 │ │
│ └────────────────────────────────────────────────┘ │
│ ↓ │
│ ┌────────────────────────────────────────────────┐ │
│ │ 运行时引擎 (Runtime) │ │
│ │ • 多核调度 • 资源管理 • 性能监控 │ │
│ └────────────────────────────────────────────────┘ │
└────────────────────────────────────────────────────────┘
典型算法性能表现
| 模型 | 输入分辨率 | A1000 Pro延迟 | 功耗 | 精度(mAP) |
| 模型 | 输入分辨率 | A1000 Pro延迟 | 功耗 | 精度(mAP) |
|---|---|---|---|---|
| YOLOv5s | 640×640 | 3.2ms | 8W | 56.8% |
| YOLOv7 | 640×640 | 5.1ms | 10W | 69.7% |
| YOLOX-L | 640×640 | 7.8ms | 12W | 73.2% |
| CenterNet | 512×512 | 4.5ms | 9W | 61.4% |
| PillarNet | 点云 | 12ms | 14W | 79.1% |
3.3.4 市场应用与客户案例
一汽红旗E-HS9项目
- 配置:双A1000 Pro (116 TOPS)
- 传感器:12V5R1L方案
- 功能:高速NOA + 记忆泊车
- 量产时间:2022年Q3
江汽集团思皓系列
- 配置:A1000标准版 (40 TOPS)
- 成本优势:相比进口方案降低35%
- 本土化支持:现场技术团队驻场
东风岚图FREE
- 配置:A1000L (16 TOPS) + 域控制器
- 特色:首个量产ISP-NPU融合方案
- 夜间性能:检测距离提升25%
3.3.5 技术发展路线图
黑芝麻技术演进
2020 2021 2022 2023 2024
A500 ───→ A1000 ────→ A1000Pro ───→ 武当C1200 ──→ 武当C1600
(5T) (40T) (58T) (200T) (400T)
28nm 16nm 16nm 7nm 5nm
│ │ │ │ │
└─────────┴───────────┴────────────┴────────────┘
关键里程碑:
• ISP融合 • 跨域计算 • Chiplet • 3D封装
3.4 Intel/Mobileye EyeQ6战略转型
3.4.1 收购后的战略调整
2022年,Intel完成对Mobileye的分拆上市,但保持多数股权控制。这一举措反映了新的战略方向:
Mobileye战略转型
┌──────────────────────────────────────────────────────┐
│ 阶段一:垂直整合(2017-2020) │
│ • Intel收购,整合制造能力 │
│ • EyeQ5量产,巩固ADAS市场 │
│ • REM地图众包平台建设 │
├──────────────────────────────────────────────────────┤
│ 阶段二:开放生态(2021-2022) │
│ • EyeQ6架构开放 │
│ • 支持外部算法部署 │
│ • True AI计算架构发布 │
├──────────────────────────────────────────────────────┤
│ 阶段三:全栈方案(2023-) │
│ • SuperVision全栈系统 │
│ • Chauffeur L4方案 │
│ • 自动驾驶即服务(ADaaS) │
└──────────────────────────────────────────────────────┘
3.4.2 EyeQ6架构革新
双芯片设计理念
EyeQ6H/EyeQ6L架构对比
┌─────────────────────────────────────────────────────────┐
│ EyeQ6H (High) │
│ ┌─────────────────────────────────────────────┐ │
│ │ CPU集群:12x RISC-V @ 1.5GHz │ │
│ │ ┌─────┐ ┌─────┐ ┌─────┐ ┌─────┐ │ │
│ │ │Core │ │Core │ │Core │ │Core │ ... │ │
│ │ └─────┘ └─────┘ └─────┘ └─────┘ │ │
│ └─────────────────────────────────────────────┘ │
│ ┌─────────────────────────────────────────────┐ │
│ │ 加速器集群 │ │
│ │ • 2x DLA (深度学习) @ 34 TOPS each │ │
│ │ • 2x VMP (视觉处理) @ 12 TOPS each │ │
│ │ • 1x PMA (策略映射) @ 8 TOPS │ │
│ │ • 1x TPC (跟踪预测) @ 6 TOPS │ │
│ └─────────────────────────────────────────────┘ │
│ 总算力:128 TOPS | 功耗:35W | 制程:7nm │
└─────────────────────────────────────────────────────────┘
┌─────────────────────────────────────────────────────────┐
│ EyeQ6L (Lite) │
│ ┌─────────────────────────────────────────────┐ │
│ │ CPU集群:8x RISC-V @ 1.2GHz │ │
│ └─────────────────────────────────────────────┘ │
│ ┌─────────────────────────────────────────────┐ │
│ │ 加速器集群 │ │
│ │ • 1x DLA @ 25 TOPS │ │
│ │ • 1x VMP @ 10 TOPS │ │
│ │ • 共享加速器资源 │ │
│ └─────────────────────────────────────────────┘ │
│ 总算力:35 TOPS | 功耗:15W | 制程:7nm │
└─────────────────────────────────────────────────────────┘
关键技术特性
-
True AI架构 - 完全可编程的加速器 - 支持新兴网络结构(Transformer、GNN) - 无需硬件改动即可适配新算法
-
RSS安全模型 - 责任敏感安全(Responsibility-Sensitive Safety) - 数学验证的安全决策 - 冗余感知路径
-
开放策略转变 - 支持客户自定义算法 - 提供SDK和工具链 - 不再强制绑定Mobileye算法栈
3.4.3 SuperVision全栈系统
系统架构
SuperVision系统架构
┌────────────────────────────────────────────────────┐
│ 感知层 │
│ 11个高清摄像头 + 雷达融合 │
│ ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐ │
│ │前视×3 │ │侧视×4 │ │后视×1 │ │环视×3 │ │
│ └───┬──┘ └───┬──┘ └───┬──┘ └───┬──┘ │
│ └─────────┴─────────┴─────────┘ │
│ ↓ │
├────────────────────────────────────────────────────┤
│ 计算层 │
│ 2×EyeQ6H (256 TOPS) │
│ ┌────────────┐ ┌────────────┐ │
│ │ 主计算单元 │←------→│ 备份单元 │ │
│ │ 感知+规划 │ │ 安全冗余 │ │
│ └────────────┘ └────────────┘ │
│ ↓ ↓ │
├────────────────────────────────────────────────────┤
│ 算法层 │
│ • 端到端深度学习 • RSS安全模型 │
│ • REM高精地图 • 多任务网络 │
│ ↓ │
├────────────────────────────────────────────────────┤
│ 执行层 │
│ 横向控制 | 纵向控制 | 故障处理 │
└────────────────────────────────────────────────────┘
部署案例
极氪001 FR版
- 首发SuperVision系统
- 高速NOA + 城市领航辅助
- 2022年Q4交付
宝马iX xDrive50
- 定制化SuperVision
- 欧洲法规适配
- 2023年量产
3.4.4 市场策略与挑战
竞争优势
- 算法积累:20年+视觉算法经验
- 数据优势:1.5亿辆车部署,海量路测数据
- 安全认证:首个获得德国TÜV认证的L4系统
面临挑战
- 激光雷达缺位:纯视觉路线在中国市场接受度低
- 开放生态晚:相比NVIDIA生态成熟度不足
- 成本压力:中国厂商价格竞争激烈
3.5 域控制器时代的产业影响
3.5.1 供应链重构
供应链演变
传统模式(2020前) 域控时代(2021-2022)
┌──────────┐ ┌──────────┐
│ OEM │ │ OEM │
└─────┬────┘ └─────┬────┘
↓ ↓
┌──────────┐ ┌──────────┐
│ Tier1 │ │ Tier0.5 │←--- 新角色
│ (博世等) │ │ (华为等) │
└─────┬────┘ └─────┬────┘
↓ ↓
┌──────────┐ ┌──────────┐
│ Tier2 │ │芯片厂商 │←--- 地位提升
│ (零部件) │ │ (直供OEM) │
└──────────┘ └──────────┘
变化要点:
• Tier1角色弱化,部分转型Tier0.5
• 芯片厂商直接与OEM合作
• 软件能力成为核心竞争力
• OEM自研比例大幅提升
3.5.2 技术标准演进
主要标准对比
| 标准维度 | 2020年 | 2022年 | 变化趋势 |
| 标准维度 | 2020年 | 2022年 | 变化趋势 |
|---|---|---|---|
| 算力要求 | 2-10 TOPS | 50-200 TOPS | 20倍增长 |
| 通信带宽 | CAN (1Mbps) | 车载以太网 (1Gbps) | 1000倍提升 |
| 软件架构 | Classic AUTOSAR | Adaptive AUTOSAR | 面向服务 |
| 安全等级 | ASIL-B为主 | ASIL-D标配 | 安全要求提升 |
| OTA能力 | 部分支持 | 全面支持 | 成为标配 |
3.5.3 成本结构变化
整车成本占比变化
2020年传统车型 2022年智能车型
┌────────────────┐ ┌────────────────┐
│ 机械部件 45% │ │ 机械部件 35% │
│ 动力系统 25% │ │ 动力系统 20% │
│ 内饰 15% │ │ 电子电气 25% │←─ 大幅提升
│ 电子电气 10% │ │ 软件 10% │←─ 新增项
│ 其他 5% │ │ 内饰 7% │
└────────────────┘ │ 其他 3% │
└────────────────┘
域控制器成本构成(以智驾域为例):
• 芯片:40-50%
• PCB及被动元件:20-25%
• 存储器:15-20%
• 连接器:10-15%
• 散热及结构件:5-10%
3.6 本章总结与展望
3.6.1 关键芯片性能对比
2021-2022年主流芯片综合对比
┌──────────────────────────────────────────────────────────────┐
│ 芯片型号 │ 算力 │ 功耗 │ 制程 │ 内存带宽 │ 单价 │ 量产 │
├──────────────────────────────────────────────────────────────┤
│ 地平线J5 │ 128T │ 30W │ 16nm│ 25.6GB/s│ $120 │ 2021Q4│
│ 黑芝麻A1000│ 58T │ 15W │ 16nm│ 19.2GB/s│ $80 │ 2021Q3│
│ EyeQ6H │ 128T │ 35W │ 7nm │ 38.4GB/s│ $250 │ 2022Q4│
│ Orin-X │ 275T │ 60W │ 7nm │ 204GB/s │ $450 │ 2022Q1│
│ TDA4-Mid │ 8T │ 15W │ 28nm│ 17GB/s │ $45 │ 2021Q1│
│ 高通SA8540 │ 100T │ 45W │ 5nm │ 64GB/s │ $200 │ 2022Q3│
└──────────────────────────────────────────────────────────────┘
T = TOPS
3.6.2 技术发展趋势
-
架构融合趋势 - ISP与NPU深度融合 - CPU/GPU/NPU统一内存架构 - 跨域计算资源共享
-
算法硬件协同 - Transformer专用加速单元 - BEV感知硬件优化 - 端到端网络部署支持
-
生态开放化 - 工具链标准化 - 中间件通用化 - 算法模型可移植
3.6.3 市场格局预判
2022年底市场份额(中国市场)
┌────────────────────────────────┐
│ Mobileye 25% ↓ │
│ NVIDIA 20% ↑ │
│ 地平线 18% ↑↑ │
│ 高通 12% → │
│ 黑芝麻 8% ↑ │
│ TI 7% ↓ │
│ 华为 5% ↑ │
│ 其他 5% │
└────────────────────────────────┘
关键观察:
• 国产化替代加速,本土厂商份额超30%
• NVIDIA凭借Orin快速增长
• Mobileye份额下滑但仍是领导者
• 新玩家不断涌入,竞争加剧
3.6.4 下一阶段展望
2023年将迎来更大变革:
- 超高算力时代:单芯片突破500 TOPS
- 中央计算架构:从域控向中央计算演进
- 大模型上车:Transformer成为标配
- 成本大战:芯片价格战全面打响
域控制器元年奠定了智能汽车计算架构的基础,为后续的爆发式增长铺平了道路。国产芯片的崛起不仅打破了国外垄断,更推动了整个产业的创新速度。下一章,我们将深入探讨大模型如何彻底改变自动驾驶芯片的设计理念。
注:本章数据来源于各公司官方发布、行业研究报告及公开市场信息,截至2022年12月。