自动驾驶算法演进史 (2016-2024)

导航

第一部分:编年史

  • 第1章:前深度学习时代与早期探索 (Pre-2016)
  • DARPA挑战赛的遗产
  • Google自动驾驶项目启动
  • 传统CV方法:HOG/SIFT/光流
  • 早期ADAS系统架构
  • 2014 Mercedes S-Class半自动驾驶

  • 第2章:深度学习革命开端 (2016-2018)

  • 2016 NVIDIA DAVE-2论文发表
  • 2016.5 Tesla Model S事故 (Joshua Brown) - 首起Autopilot致死案
  • 2016.10 MobileEye与Tesla分手
  • 2017 Waymo起诉Uber技术窃取案
  • 2018.3 Uber自动驾驶致死案 (Elaine Herzberg) - 首起L4致死
  • 2018 Apollo开源计划
  • CNN在感知中的统治地位

  • 第3章:感知架构大爆发 (2019-2020)

  • 2019 Tesla Autonomy Day展示FSD芯片
  • 多任务学习网络兴起
  • 伪激光雷达与深度估计
  • 2020.1 德国批准Tesla Autopilot合法
  • 2020 COVID推动无人配送发展
  • BEV感知初现端倪
  • 中国NOA功能开始落地

  • 第4章:BEV与Transformer变革 (2021-2022)

  • 2021 Tesla AI Day展示BEV+Transformer
  • BEVDet/BEVFormer等论文爆发
  • 2021.8 蔚来NOP事故引发辅助驾驶争议
  • 2022 FSD Beta北美大规模推送
  • Occupancy Network占据网络兴起
  • 2022.11 小鹏P7高速事故
  • 向量化地图与在线建图

  • 第5章:端到端浪潮 (2023-2024)

  • 2023.8 Tesla FSD V12纯端到端发布
  • 中国端到端方案井喷
  • 2023 Cruise拖行事故导致运营暂停
  • 世界模型与生成式方法
  • 2024 价格战与算力竞赛
  • 2024.2 Waymo凤凰城完全无人运营
  • 大模型驱动的自动驾驶

第二部分:专题深度分析

感知算法演进

规划控制算法

端到端架构深度剖析

第三部分:关键技术与争议

第四部分:产业格局与玩家分析

国际巨头

中国核心玩家

其他重要玩家

第五部分:未来展望

核心技术演进时间线

2016  ├─ NVIDIA DAVE-2 端到端驾驶开山之作
      ├─ MobileEye EyeQ4 ADAS统治时代
      │
2017  ├─ Tesla AP2.0 启动自研之路
      ├─ Waymo 公开大规模路测
      │
2018  ├─ Tesla AP3.0 自研芯片FSD Computer
      ├─ Apollo 3.0 开源自动驾驶平台
      │
2019  ├─ Tesla FSD Beta早期版本
      ├─ 感知进入多任务学习时代
      │
2020  ├─ BEV感知概念兴起 (DETR3D, BEVDet)
      ├─ Transformer开始渗透自动驾驶
      │
2021  ├─ Tesla BEV + Transformer重构
      ├─ 国内BEV感知百花齐放
      │
2022  ├─ Occupancy Network占据网络爆发
      ├─ 重感知轻地图成为共识
      │
2023  ├─ Tesla FSD V12 纯端到端
      ├─ 国内端到端方案井喷
      │
2024  ├─ 世界模型与生成式自动驾驶
      └─ 端到端成为行业标配

关键技术对比

L2 vs L4 技术栈差异

┌─────────────────────────────────────────────────────┐
│                    L2 (渐进式)                       │
├─────────────────────────────────────────────────────┤
│  • 成本约束: <$500 BOM                              │
│  • 算力约束: <100 TOPS                              │
│  • 传感器: 纯视觉为主                                │
│  • 地图依赖: 轻地图/无图                             │
│  • 场景: 高速+城区NOA                               │
│  • 代表: Tesla FSD, 小鹏XNGP                        │
└─────────────────────────────────────────────────────┘

┌─────────────────────────────────────────────────────┐
│                    L4 (跨越式)                       │
├─────────────────────────────────────────────────────┤
│  • 成本: >$10000                                    │
│  • 算力: >1000 TOPS                                 │
│  • 传感器: LiDAR+Camera+Radar                       │
│  • 地图: 高精地图依赖                                │
│  • 场景: 限定区域Robotaxi                           │
│  • 代表: Waymo, Cruise, 百度Apollo                  │
└─────────────────────────────────────────────────────┘

感知架构演进对比

| 年代 | 架构范式 | 关键技术 | 代表方案 |

年代 架构范式 关键技术 代表方案
2016-2018 2D感知 CNN, YOLO/SSD MobileEye, AP2.0
2019-2020 2.5D感知 伪3D, 深度估计 AP3.0早期
2021-2022 BEV感知 LSS, BEVFormer Tesla FSD Beta, BEVDet
2023-2024 4D感知 时序融合, 世界模型 FSD V12, 各家端到端

端到端技术路线对比

模块化方案 (Traditional)
┌──────┐    ┌──────┐    ┌──────┐    ┌──────┐
│ 感知 │ -> │ 预测 │ -> │ 规划 │ -> │ 控制 │
└──────┘    └──────┘    └──────┘    └──────┘
   ↓           ↓           ↓           ↓
 可解释     可调试     规则清晰    安全保证

端到端方案 (End-to-End)
┌────────────────────────────────────┐
│         Neural Network              │
│  Sensor ─────> Actions              │
└────────────────────────────────────┘
              ↓
        数据驱动,黑盒

中国自动驾驶算法玩家矩阵

主机厂自研

  • 特斯拉中国: FSD本土化适配
  • 小鹏汽车: XNGP (从辅助到端到端)
  • 理想汽车: AD Max (融合路线)
  • 蔚来汽车: NAD (多传感器融合)
  • 华为: ADS 2.0/3.0 (不依赖高精地图)

算法供应商

  • Momenta: 量产+L4双线
  • 地平线: 芯片+算法垂直整合
  • 大疆车载: 成本优化见长
  • 毫末智行: DriveGPT数据智能
  • 元戎启行: L4转L2
  • 文远知行: Robotaxi坚守者

芯片与算法协同

| 芯片平台 | 算力(TOPS) | 算法特点 | 主要客户 |

芯片平台 算力(TOPS) 算法特点 主要客户
地平线J5 128 BEV优化, INT8量化 理想、长城
地平线J6 560 Transformer加速 比亚迪、大众
英伟达Orin 254 通用架构 蔚来、小鹏
华为MDC610 200 自研架构 问界、极狐

技术争议焦点

1. 高精地图之争

  • 支持派: 提供先验,保证安全下限
  • 反对派: 成本高,更新慢,限制扩展

2. 纯视觉 vs 融合感知

  • Tesla路线: 纯视觉,第一性原理
  • 中国路线: 务实融合,渐进演进

3. 数据规模效应

  • 关键问题: 自动驾驶是否遵循Scaling Law?
  • Tesla观点: 数据+算力=智能涌现
  • 业界分歧: 长尾问题与安全保证

4. 仿真的作用

  • 乐观派: 仿真解决corner case
  • 保守派: Sim2Real gap难以逾越

阅读指南

  1. 快速了解: 阅读编年史部分(第1-5章)了解技术演进脉络
  2. 技术深入: 专题分析部分(第6-11章)深入特定技术领域
  3. 产业视角: 第20-30章了解主要玩家技术特点
  4. 趋势判断: 技术争议部分理解行业分歧与未来方向

本文档持续更新中,最后更新:2024年12月