2016-2018年是自动驾驶历史上的分水岭时期。深度学习从学术界的新奇实验快速渗透到工业界,彻底改变了自动驾驶的技术范式。这三年见证了端到端学习的首次尝试、第一起Autopilot致死事故、硅谷巨头间的技术战争,以及开源生态的形成。传统的规则驱动方法逐渐让位于数据驱动的深度神经网络,奠定了后续所有技术演进的基础。
2016年4月,NVIDIA发表了具有里程碑意义的论文《End to End Learning for Self-Driving Cars》,展示了DAVE-2(Driving Autonomous Vehicle Engine 2)系统。这标志着自动驾驶领域第一次系统性地将深度学习应用于端到端驾驶任务。
在DAVE-2之前,自动驾驶系统普遍采用模块化架构:感知、定位、规划、控制各司其职,每个模块都由人类专家精心设计规则。NVIDIA的研究团队提出了一个大胆的设想:能否让神经网络直接从原始图像学习到方向盘转角,跳过所有中间步骤?
这个想法的灵感来自1989年的ALVINN项目(Autonomous Land Vehicle In a Neural Network),但DAVE-2借助深度卷积神经网络的强大表征能力,将这个概念推向了实用化的边缘。
DAVE-2的网络架构在今天看来异常简洁,但在当时却是革命性的:
输入层 (Input)
↓
归一化层 (Normalization): 200x66x3 RGB图像
↓
卷积层1 (Conv1): 24个5x5滤波器,步长2x2,激活函数ReLU
↓
卷积层2 (Conv2): 36个5x5滤波器,步长2x2,激活函数ReLU
↓
卷积层3 (Conv3): 48个5x5滤波器,步长2x2,激活函数ReLU
↓
卷积层4 (Conv4): 64个3x3滤波器,步长1x1,激活函数ReLU
↓
卷积层5 (Conv5): 64个3x3滤波器,步长1x1,激活函数ReLU
↓
展平层 (Flatten): 1164个神经元
↓
全连接层1 (FC1): 100个神经元
↓
全连接层2 (FC2): 50个神经元
↓
全连接层3 (FC3): 10个神经元
↓
输出层 (Output): 1个神经元(方向盘转角)
整个网络只有约2700万个参数,以现代标准来看微不足道,但它证明了一个关键概念:驾驶行为可以通过神经网络隐式学习,而不需要显式编程。
关键设计决策:
NVIDIA的数据收集策略成为后续所有数据驱动方法的模板:
数据收集:
数据增强技术:
训练策略:
损失函数: MSE(predicted_angle, human_angle)
优化器: Adam
学习率: 1e-4
批次大小: 100
训练时长: ~30小时(单块NVIDIA TITAN X)
一个关键创新是”恢复训练”:通过使用左右摄像头的图像并添加补偿角度,训练网络学会从错误中恢复。这大大提高了系统的鲁棒性。
技术局限:
深远影响:
DAVE-2虽然从未商业化,但它开启了一个新时代。Tesla的Andrej Karpathy后来承认,FSD的早期原型深受DAVE-2启发。中国的百度、小鹏等公司也在其技术演进中借鉴了端到端的思想。
2016年5月7日,佛罗里达州威利斯顿,一辆开启Autopilot的Tesla Model S与一辆左转的白色半挂车相撞,40岁的Joshua Brown当场死亡。这是全球第一起涉及半自动驾驶系统的致死事故,永久改变了自动驾驶的发展轨迹。
事故时序重建:
14:36:00 - Autopilot激活,车速119km/h
14:36:25 - 前方500米出现左转半挂车
14:36:35 - 半挂车开始左转横穿道路
14:36:39 - 碰撞前1秒,系统未检测到障碍物
14:36:40 - Model S从挂车底部穿过,A柱被削断
14:36:42 - 车辆继续前行约100米后撞击路边
关键环境因素:
这次事故暴露了第一代Autopilot(AP1)的多个技术缺陷:
感知系统失效链:
算法架构问题:
AP1感知栈(简化):
摄像头 ──> MobileEye EyeQ3 ──> 车道线
├─> 车辆检测
└─> 限速标志
雷达 ────> 目标跟踪 ────────> 障碍物列表
融合层:简单的置信度加权,缺乏语义理解
决策逻辑缺陷:
EyeQ3作为当时最先进的ADAS芯片,其局限性在事故中完全暴露:
硬件规格限制: | 参数 | EyeQ3规格 | 实际需求 | |——|———–|———-| | 算力 | 0.256 TOPS | >1 TOPS | | 处理分辨率 | 1280x960 | >1920x1080 | | 帧率 | 36 FPS | >60 FPS | | 神经网络 | 简单CNN | 深度网络 |
算法能力边界:
MobileEye的”黑盒”问题:
Tesla输入 ──> EyeQ3黑盒 ──> 检测结果
↑ ↓ ↓
无法调试 无法优化 无法定制
这种封闭架构让Tesla无法针对具体问题进行优化,成为后续分手的技术根因。
即时影响:
技术路线反思:
各方技术响应对比: | 厂商 | 短期应对 | 长期战略 | |——|———-|———-| | Tesla | 增加雷达权重 | 全栈自研,摆脱依赖 | | MobileEye | 强调驾驶员责任 | 开发RSS安全模型 | | Waymo | 强调L4不同于L2 | 加倍投入冗余设计 | | 传统车企 | 放缓ADAS升级 | 观望,保守推进 |
深层次教训:
传感器冗余必要性:单一传感器模态存在固有盲区,多模态融合成为共识
人机交互困境:”半自动”造成责任模糊,驾驶员过度信任与注意力丧失的矛盾
传统汽车测试:百万英里
自动驾驶需求:数十亿英里
边缘案例:理论上无限
2016年7月,Joshua Brown事故后仅两个月,MobileEye宣布将在EyeQ4交付后终止与Tesla的合作。表面上是安全理念分歧,实际上是深层技术路线的根本冲突。
技术分歧的核心矛盾:
Tesla需求: 原始数据 ──> 可编程处理 ──> 自定义算法 完全控制,快速迭代
2. **功能边界之争**:
- MobileEye立场:EyeQ3设计用于L2辅助驾驶,不应承诺更高级功能
- Tesla立场:通过OTA不断提升能力,硬件能力应该充分挖掘
3. **数据所有权冲突**:
- Tesla要求:获取原始传感器数据用于算法训练
- MobileEye拒绝:只提供处理后的结果,保护核心IP
4. **迭代速度不匹配**:
| 维度 | MobileEye | Tesla |
|------|-----------|--------|
| 产品周期 | 3-4年 | 3-6个月 |
| 测试流程 | 传统汽车级验证 | 互联网式快速迭代 |
| 更新方式 | 硬件换代 | OTA软件升级 |
### 2.3.2 Tesla自研之路的开启
分手成为Tesla技术独立的转折点,开启了史上最激进的自动驾驶自研计划。
**Autopilot 2.0 硬件架构**(2016年10月发布):
传感器配置:
计算平台:
软件栈从零开始:
Jim Keller(前AMD架构师)和Andrej Karpathy(前OpenAI)的加入标志着Tesla的技术野心:
与Tesla分手反而加速了MobileEye的独立发展:
技术路线调整:
商业策略转型:
2016年前:Tier 2供应商
↓
2017年后:Tier 1+自动驾驶方案商
├─> EyeQ系列芯片
├─> 完整ADAS方案
└─> Robotaxi(Mobileye Drive)
Intel收购(2017年3月,153亿美元):
Tesla-MobileEye分手引发了整个自动驾驶供应链的重组:
新格局形成:
| 玩家类型 | 代表企业 | 策略选择 |
|---|---|---|
| 垂直整合派 | Tesla、Waymo | 全栈自研,不依赖供应商 |
| 平台赋能派 | NVIDIA、Qualcomm | 提供算力平台,开放生态 |
| 方案集成商 | MobileEye、百度Apollo | 软硬件打包方案 |
| 传统Tier1 | Bosch、Continental | 并购或合作,补齐算法短板 |
中国市场的机遇:
分手事件让中国厂商看到了突破机会:
技术独立性成为核心竞争力:
依赖供应商风险:
- 技术迭代受制于人
- 数据资产无法掌控
- 差异化能力受限
自研优势:
- 快速迭代响应市场
- 数据闭环持续优化
- 构建技术护城河
这次分手深刻影响了后续所有玩家的技术策略:要么全栈自研掌控命运,要么深度绑定确保供应链安全。”灵魂论”(上汽董事长陈虹语)成为行业共识。
2017年2月23日,Waymo向旧金山联邦法院提起诉讼,指控Uber及其收购的Otto公司窃取商业机密。案件的核心人物Anthony Levandowski,曾是Google自动驾驶项目的明星工程师,他的故事揭示了自动驾驶早期的技术积累有多么珍贵。
Levandowski在Google的核心贡献:
Levandowski从2007年加入Google,参与了街景项目,随后成为自动驾驶项目的技术骨干:
时间线:
2007 - 加入Google,负责街景车硬件
2009 - 转入秘密自动驾驶项目(Chauffeur)
2011 - 设计第一代激光雷达系统
2013 - 负责供应链和硬件集成
2015 - 领导地图和激光雷达团队
2016.1 - 离职创立Otto
窃取的技术机密详情:
根据法庭文件,Levandowski在离职前下载了14,000份机密文件,总计9.7GB,包括:
激光雷达技术的战略价值:
当时(2016年)激光雷达的技术和商业格局:
| 厂商 | 产品 | 价格 | 技术特点 |
|---|---|---|---|
| Velodyne | HDL-64E | $75,000 | 64线机械旋转 |
| Waymo | 自研”熊爪” | ~$7,500(目标) | 内部定制,降本90% |
| Quanergy | S3(开发中) | $250(承诺) | 固态,未量产 |
| Luminar | 早期原型 | N/A | 1550nm长波长 |
Waymo的自研激光雷达是其技术护城河的核心,每年投入超过1亿美元研发,目标是将成本降至量产可行水平。
诉讼揭示了几个关键技术争议点,这些争议定义了后续的行业竞争规则:
争议一:激光雷达架构相似性
法庭技术鉴定显示,Uber的”Spider”激光雷达与Waymo的设计存在多处相似:
设计对比:
Waymo设计 Uber Spider
发射器数量: 4个 4个
接收器布局: 同心圆排列 同心圆排列
光路设计: 专利透镜组 极其相似
电路架构: 定制ASIC 类似拓扑
争议二:员工挖角模式
Levandowski的离职带走了关键团队:
这种”整建制”挖角模式成为后续行业的常态,但也促使企业加强了知识产权保护。
争议三:收购时的尽职调查
Uber以6.8亿美元收购Otto时的决策过程受到质疑:
法庭证据显示,Uber前CEO Travis Kalanick在收购前就知道潜在的知识产权风险,但仍推进交易,反映了当时自动驾驶竞争的疯狂程度。
这场诉讼不仅是两家公司的纠纷,更深刻影响了整个自动驾驶产业的发展轨迹。
即时影响:
长期影响:
诉讼前(2016):
激光雷达是L4标配 ──> 所有公司追求类似架构
诉讼后(2017+):
├─> 继续激光雷达:Waymo、Cruise(技术领先)
├─> 转向纯视觉:Tesla(规避专利)
└─> 新型传感器:4D雷达、固态激光雷达(差异化)
| 变化维度 | 诉讼前 | 诉讼后 |
|---|---|---|
| 竞业期限 | 6-12个月 | 18-24个月 |
| 股权归属 | 4年标准 | 5-7年延长 |
| 知识产权 | 宽松审查 | 离职审计 |
| 招聘策略 | 整team挖角 | 分散招聘 |
诉讼暴露了自动驾驶产业的核心矛盾:技术积累与人才流动的平衡。
自动驾驶人才的特殊性:
中国市场的人才策略:
Waymo-Uber诉讼给中国企业上了一课,形成了独特的人才和知识产权策略:
技术传承的新模式:
后Waymo-Uber时代,行业形成了新的技术传承模式:
这场诉讼深刻改变了自动驾驶的竞争规则:从野蛮生长的人才争夺,转向了更加规范但也更加封闭的技术竞争。它标志着自动驾驶从研究项目真正转变为商业竞争,知识产权成为核心资产。
2018年3月18日晚9:58,亚利桑那州坦佩市,一辆Uber自动驾驶测试车(Volvo XC90)撞击并致死了推着自行车横穿马路的49岁女性Elaine Herzberg。这是全球首例L4级自动驾驶致死事故,技术分析揭示了令人震惊的系统性失败。
事故时序精确重建:
-6.0秒:系统首次检测到目标,分类为"未知物体"
-5.6秒:重新分类为"车辆"(错误)
-4.2秒:分类变更为"其他"
-2.6秒:分类为"自行车"(部分正确)
-1.5秒:分类为"其他"
-1.3秒:系统判定需要紧急制动
-1.3秒:紧急制动被禁用,未执行
-0.2秒:安全员发现危险,开始接管
0.0秒:碰撞发生,车速63km/h(39mph)
传感器配置与失效分析:
Uber ATG(Advanced Technologies Group)的测试车配置:
传感器套件:
┌─────────────────────────────────────┐
│ 车顶激光雷达:Velodyne HDL-64E │
│ - 64线,10Hz,120米范围 │
│ - 故障:未能稳定跟踪行人 │
├─────────────────────────────────────┤
│ 前向雷达:Delphi ESR 2.5 │
│ - 中长距,174米范围 │
│ - 故障:被系统忽略(调参错误) │
├─────────────────────────────────────┤
│ 摄像头阵列:7个(短中长焦) │
│ - 故障:夜间识别能力不足 │
└─────────────────────────────────────┘
感知系统的致命缺陷:
调查报告揭示了Uber ATG在系统架构层面的根本性设计缺陷。
缺陷一:主动安全系统被禁用
最令人震惊的发现:Volvo原厂的紧急制动系统被刻意禁用。
原因链:
Volvo原厂系统 ──> 与Uber系统冲突 ──> 决定禁用
↓
"相信我们的系统更好"
↓
实际:两个都没起作用
Uber的理由是避免两套系统的冲突导致意外制动,但这违背了安全系统的基本原则:冗余和降级。
缺陷二:决策逻辑的根本错误
# Uber ATG的简化决策逻辑(伪代码)
if confidence < threshold:
action = "continue_current_path" # 错误!
else:
if time_to_collision < 1.3:
action = "emergency_brake"
if in_autonomous_mode:
suppress_action() # 致命错误!
alert_safety_driver()
关键问题:
缺陷三:人机交互的失败设计
安全员监控界面问题:
安全员Rafaela Vasquez在事故前:
事故调查揭示了Uber ATG存在系统性的安全文化问题。
“增长优先”的恶果:
内部邮件和证词显示的压力:
忽视的指标:
安全流程的缺失:
| 安全实践 | Waymo | Uber ATG |
|---|---|---|
| 安全员培训 | 200小时+ | 3天 |
| 双安全员制度 | 标配 | 已取消 |
| 仿真测试 | 日行2500万英里 | 基本没有 |
| 安全案例分析 | 每周评审 | 无正式流程 |
| 第三方审计 | 定期 | 从未进行 |
工程伦理的崩塌:
多名工程师事后作证:
内部举报人Robbie Miller(事故前已离职):”这不是意外,是必然。”
这起事故引发了全球监管机构的强烈反应,自动驾驶行业进入了第一个”寒冬”。
立即后果:
相关股票表现(事故后一周):
Uber(未上市,估值):-10%
Nvidia:-7.8%
Aptiv(Delphi):-5.2%
传感器供应商平均:-8%
监管框架重构:
美国国家层面:
中国的反应:
2018.4 - 工信部发布智能网联汽车道路测试管理规范
2018.6 - 北京要求5000公里封闭测试才能上路
2018.9 - 上海要求购买1000万保险
产业深度反思:
技术路线调整:
L4直接跨越 vs L2渐进演化的争论:
事故前:L4是主流,认为L2-L3是危险区间
↓ 事故
事故后:L2+逐步演进获得更多认同
长期影响:
这起事故成为自动驾驶历史的分水岭:
2017-2018Q1:疯狂期,只看技术不看安全
2018Q2-2019:冷静期,安全成为首要考量
2020后:平衡期,安全与创新并重
这起悲剧用生命的代价给整个行业上了一课:在追求技术突破的同时,永远不能忘记安全是自动驾驶的第一原则。它标志着自动驾驶从技术狂欢期进入理性发展期。