self_driving_algo

第27章：Momenta - 量产与L4双线并进

27.1 公司背景与创立初衷

27.1.1 创始团队的学术基因

Momenta成立于2016年9月，创始人曹旭东拥有深厚的计算机视觉学术背景。曹旭东本科毕业于清华大学，博士毕业于香港科技大学，师从权龙教授，专注于深度学习与计算机视觉研究。在创立Momenta之前，曹旭东曾在微软亚洲研究院担任研究员，与孙剑等顶尖研究者共事，参与了ResNet等里程碑式工作。

创始团队的核心成员大多来自清华、北大、MIT等顶尖院校，以及微软、百度、Facebook等科技巨头的研究部门。这种浓厚的学术氛围奠定了Momenta”技术驱动”的公司基因。

27.1.2 2016年的时代机遇

2016年是深度学习在自动驾驶领域爆发的关键节点：

2016年行业背景
┌────────────────────────────────────────┐
│  • AlphaGo战胜李世石，AI能力获认可      │
│  • NVIDIA发布DAVE-2端到端驾驶          │
│  • Tesla与MobileEye分手，自研启动      │
│  • 中国资本开始关注自动驾驶            │
│  • 深度学习人才稀缺，窗口期明显        │
└────────────────────────────────────────┘

27.1.3 初期技术路线选择

与同期成立的自动驾驶公司不同，Momenta从一开始就确立了独特的技术理念：

数据驱动优先：相信数据规模是自动驾驶的核心竞争力
量产与L4并行：不做单一路线的赌注，两条腿走路
算法通用性：追求算法架构的可复用性和可扩展性

27.2 技术路线演进史

27.2.1 第一阶段：深度学习感知突破 (2016-2018)

初创期的Momenta聚焦于感知算法的研发：

2016-2017 关键里程碑：

发布首个基于深度学习的高精地图众包方案
在KITTI数据集上刷新多项检测记录
完成5000万美元A轮融资（蔚来资本领投）

2018 技术突破：

推出第一代量产级感知算法
车道线检测准确率达到99.3%
3D目标检测进入实用化阶段

早期感知架构
┌─────────────────────────────────────┐
│        Multi-Task CNN                │
├─────────────────────────────────────┤
│  输入：前视摄像头                     │
│    ├─> 2D检测分支 (车辆/行人/标志)    │
│    ├─> 车道线分割分支                │
│    └─> 可行驶区域分支                │
└─────────────────────────────────────┘

27.2.2 第二阶段：数据闭环体系构建 (2019-2020)

这一阶段，Momenta将重心转向数据闭环的构建：

2019 数据平台建设：

建立自动化数据标注流水线
开发主动学习(Active Learning)框架
启动”影子模式”数据收集

2020 闭环能力形成：

日处理数据量突破100TB
自动标注准确率达到95%
完成5亿美元融资（通用、丰田等参投）

数据闭环架构
┌──────────┐     ┌──────────┐     ┌──────────┐
│  车端采集 │ --> │ 云端处理 │ --> │ 模型训练 │
└──────────┘     └──────────┘     └──────────┘
      ↑                                   │
      └───────────────────────────────────┘
                  OTA更新

27.2.3 第三阶段：MSD战略成型 (2021-2022)

2021年，Momenta正式提出MSD（Momenta Self-Driving）双轨战略：

Mpilot（量产线）：

面向L2+/L3级别辅助驾驶
成本控制在1000美元以内
支持高速NOA和城市NOA功能

MSD（L4线）：

面向Robotaxi和无人配送
不计成本追求极致性能
在苏州等地开展示范运营

27.2.4 第四阶段：规模化量产 (2023-2024)

进入大规模量产阶段：

2023 量产突破：

上汽智己L7搭载Mpilot方案上市
累计量产车型超过10款
数据里程突破10亿公里

2024 技术升级：

发布端到端架构Mpilot X
BEV感知全面升级
向轻地图/无图方案演进

27.3 MSD双轨战略深度解析

27.3.1 战略设计理念

MSD双轨战略
┌────────────────────────────────────────────┐
│              数据与算法复用                  │
├──────────────────┬─────────────────────────┤
│    Mpilot量产     │      MSD L4             │
├──────────────────┼─────────────────────────┤
│  • 规模化部署     │  • 极限场景探索          │
│  • 海量数据收集   │  • 算法边界测试          │
│  • 成本优化      │  • 新技术验证            │
│  • 快速迭代      │  • 安全冗余设计          │
└──────────────────┴─────────────────────────┘
           ↓                ↓
       千万级用户        技术领先性

27.3.2 Mpilot量产方案架构

硬件配置（以2024年主流配置为例）：

计算平台：2颗地平线J5或1颗Orin-X
摄像头：11颗（前3后1侧4周视3）
毫米波雷达：5颗（可选）
超声波雷达：12颗

软件架构：

Mpilot软件栈
┌─────────────────────────────────────┐
│          应用层 (HMI/OTA)            │
├─────────────────────────────────────┤
│         决策规划层                   │
│   ├─ 行为决策                       │
│   ├─ 轨迹规划                       │
│   └─ 速度规划                       │
├─────────────────────────────────────┤
│         感知预测层                   │
│   ├─ BEV感知                        │
│   ├─ 目标跟踪                       │
│   └─ 轨迹预测                       │
├─────────────────────────────────────┤
│      传感器抽象层 (HAL)              │
└─────────────────────────────────────┘

27.3.3 MSD L4方案特点

硬件冗余设计：

计算：双Orin + 安全MCU
感知：4激光雷达 + 7摄像头 + 毫米波
定位：RTK + IMU + 视觉定位
通信：5G + V2X

软件安全机制：

功能安全：ASIL-D级别设计
故障检测与降级
远程监控与接管

27.4 核心算法架构

27.4.1 感知算法体系

Momenta的感知算法经历了从2D到3D再到BEV的演进：

第一代：2D多任务感知 (2016-2019)

2D感知网络
┌────────────────────────────────────┐
│      Backbone (ResNet-101)         │
├────────────────────────────────────┤
│           FPN特征金字塔              │
├──────┬──────┬──────┬──────────────┤
│ 检测 │ 分割 │深度  │ 关键点       │
└──────┴──────┴──────┴──────────────┘

第二代：伪3D感知 (2019-2021)

引入深度估计网络
单目3D检测
时序信息融合

第三代：BEV统一感知 (2021-至今)

BEV感知架构
┌──────────────────────────────────────────┐
│          多视角图像输入                    │
├──────────────────────────────────────────┤
│     2D特征提取 (Backbone + FPN)           │
├──────────────────────────────────────────┤
│    视角转换 (LSS/Transformer)             │
├──────────────────────────────────────────┤
│         BEV特征空间                       │
├────────┬────────┬────────┬───────────────┤
│3D检测  │车道线  │可行驶区 │ 语义分割      │
└────────┴────────┴────────┴───────────────┘

关键技术创新：

自适应特征聚合：根据场景复杂度动态调整特征融合策略
稀疏化加速：通过注意力机制减少无效计算
多尺度时序融合：不同时间尺度的特征分层融合

27.4.2 预测与规划框架

轨迹预测算法：

预测网络架构
┌─────────────────────────────────────┐
│     历史轨迹编码 (LSTM/Transformer)  │
├─────────────────────────────────────┤
│     场景上下文编码 (Graph/CNN)       │
├─────────────────────────────────────┤
│     交互建模 (Attention)            │
├─────────────────────────────────────┤
│     多模态轨迹生成 (GMM/VAE)        │
└─────────────────────────────────────┘
      输出：6秒未来轨迹 (概率分布)

规划算法演进：

阶段	方法	特点	应用场景
V1.0	基于规则	确定性强	高速公路
V2.0	混合A* + 样条曲线	全局最优	简单城区
V3.0	模仿学习 + 规则约束	人类驾驶风格	复杂城区
V4.0	端到端神经网络	数据驱动	全场景

27.4.3 数据闭环与自动标注

Momenta的数据闭环是其核心竞争力之一：

数据收集策略：

触发条件
┌────────────────────────────────────┐
│  硬触发条件：                       │
│  • 接管事件                        │
│  • 急刹/急转                       │
│  • 系统不确定性高                  │
├────────────────────────────────────┤
│  软触发条件：                       │
│  • 新场景检测                      │
│  • 预测误差大                      │
│  • 规划分歧                        │
└────────────────────────────────────┘

自动标注流程：

粗标注：使用预训练模型生成初始标注
时序一致性优化：利用多帧信息提升精度
主动学习筛选：识别高价值样本
人工审核：关键样本人工校验
模型更新：增量学习持续优化

标注效率提升：

2018年：人工标注为主，效率10帧/小时
2020年：半自动标注，效率100帧/小时
2022年：全自动标注，效率1000帧/小时
2024年：智能标注，效率10000帧/小时

27.4.4 仿真与测试体系

仿真平台架构：

三层仿真体系
┌─────────────────────────────────────┐
│       SIL (软件在环)                 │
│   纯软件仿真，算法快速迭代           │
├─────────────────────────────────────┤
│       HIL (硬件在环)                 │
│   真实硬件接入，时延测试             │
├─────────────────────────────────────┤
│       VIL (车辆在环)                 │
│   实车+虚拟环境，极限测试            │
└─────────────────────────────────────┘

场景生成方法：

Log回放：真实数据重现
场景重建：基于真实数据的变体生成
对抗生成：GAN生成挑战性场景
规则组合：参数化场景库

27.5 产品落地与合作伙伴

27.5.1 与上汽集团的深度绑定

2021年，Momenta与上汽集团达成深度战略合作，共同打造智能驾驶解决方案：

合作模式：

上汽持股并战略投资
联合研发中心成立
数据资源共享
供应链协同

落地车型： | 车型 | 上市时间 | 功能配置 | 技术特点 | |——|———|———-|———-| | 智己L7 | 2022.04 | 高速NOA | 首发Mpilot | | 智己LS7 | 2023.02 | 城市NOA | 去高精地图 | | 飞凡R7 | 2022.10 | 记忆泊车 | 视觉为主 | | 荣威RX9 | 2023.08 | 高速NOA+ | 成本优化 |

27.5.2 多元化客户拓展

比亚迪合作 (2023-)：

为高端品牌提供L2+方案
预计2025年量产
采用地平线J6平台

广汽集团 (2022-)：

埃安品牌导入
聚焦15-25万价格带
成本控制是重点

路特斯 (2024-)：

全球化车型适配
欧洲法规认证
高性能车型调校

27.5.3 L4示范运营

苏州项目：

2021年获得路测牌照
运营面积超过130平方公里
测试车队规模50+辆
累计自动驾驶里程超500万公里

技术验证重点：

L4运营数据 (2024年Q3)
┌────────────────────────────────┐
│  接管率：0.8次/百公里           │
│  可用度：98.5%                 │
│  平均响应时间：120ms           │
│  雨天可用率：95%               │
│  夜间可用率：97%               │
└────────────────────────────────┘

27.6 技术创新与竞争优势

27.6.1 数据驱动的核心理念

Momenta坚信”数据定义算法边界”，构建了业界领先的数据驱动体系：

数据飞轮效应：

数据飞轮
     ┌──────────┐
     │ 更多车辆  │
     └────┬─────┘
          │
     ┌────▼─────┐
     │ 更多数据  │
     └────┬─────┘
          │
     ┌────▼─────┐
     │ 更好算法  │
     └────┬─────┘
          │
     ┌────▼─────┐
     │ 更佳体验  │
     └────┬─────┘
          │
      (循环增强)

数据价值挖掘：

场景覆盖度分析：识别数据分布空白
困难样本挖掘：自动发现corner case
迁移学习应用：跨域数据复用
小样本学习：稀有场景泛化

27.6.2 算法工程化能力

模型压缩与加速： | 技术手段 | 压缩比 | 精度损失 | 应用阶段 | |———|——–|———-|———-| | INT8量化 | 4x | <1% | 全模型 | | 通道剪枝 | 2x | <2% | 卷积层 | | 知识蒸馏 | 3x | <3% | 整体 | | NAS搜索 | 5x | <5% | 架构级 |

部署优化技术栈：

部署流水线
┌─────────────────────────────────┐
│    PyTorch/TF训练模型            │
├─────────────────────────────────┤
│    ONNX中间表示转换              │
├─────────────────────────────────┤
│    TensorRT/OpenVINO优化         │
├─────────────────────────────────┤
│    芯片专用SDK适配               │
├─────────────────────────────────┤
│    实车部署与监控                │
└─────────────────────────────────┘

27.6.3 成本控制能力

硬件成本优化策略：

传感器选型：平衡性能与成本
- 摄像头：选用车规级CMOS，非工业级
- 毫米波：4D成像雷达替代部分激光雷达
- 计算平台：与地平线深度合作，定制优化
算法补偿硬件：
- 超分辨率：低分辨率摄像头+算法增强
- 时序融合：单帧检测不足，多帧补偿
- 先验知识：利用地图和规则减少计算

软件复用率：

核心算法模块复用率：>80%
不同车型适配周期：3-6个月
OTA更新频率：季度级别

27.6.4 全栈自研能力

全栈技术能力
┌────────────────────────────────┐
│         应用层                  │
│   HMI设计 / 用户交互            │
├────────────────────────────────┤
│         算法层                  │
│   感知/预测/规划/控制           │
├────────────────────────────────┤
│         中间件                  │
│   ROS2 / DDS / 通信框架         │
├────────────────────────────────┤
│         系统软件                │
│   实时OS / 调度 / 安全          │
├────────────────────────────────┤
│         工具链                  │
│   仿真/标注/训练/部署           │
└────────────────────────────────┘

27.6.5 与竞争对手的差异化

vs 华为ADS：

Momenta：更强调数据驱动，成本控制更优
华为：硬件能力更强，系统集成度更高

vs 小鹏XNGP：

Momenta：算法积累更深，B端经验丰富
小鹏：自有数据更多，迭代速度更快

vs 地平线：

Momenta：纯算法供应商，更加中立
地平线：芯片+算法绑定，垂直整合

27.7 未来展望与挑战

27.7.1 技术演进路线图

2024-2025：端到端转型期

Mpilot X端到端架构量产
视觉语言模型(VLM)集成
无图NOA全国覆盖

2026-2027：智能涌现期

通用场景理解能力
自主学习与进化
L3级别量产落地

2028-2030：规模化普及期

L4 Robotaxi商业化运营
10万元级别车型标配L2+
全球市场扩展

27.7.2 面临的挑战

技术挑战：

长尾问题：极端场景处理
泛化能力：跨地域、跨车型适配
实时性要求：端到端架构的延迟优化
可解释性：黑盒模型的安全验证

商业挑战：

竞争加剧：主机厂自研趋势明显
价格压力：硬件成本下降，软件价值体现难
国际化：海外市场法规和技术标准
商业模式：一次性授权vs持续服务费

27.7.3 战略布局

技术储备：

世界模型研究
具身智能探索
通用机器人算法

生态建设：

开发者社区
高校合作
行业标准制定

国际化战略：

东南亚市场：与中国车企出海协同
欧洲市场：通过路特斯等高端品牌进入
北美市场：技术授权模式探索

27.7.4 核心竞争力总结

Momenta核心优势
┌───────────────────────────────────┐
│   1. 数据驱动的算法理念           │
│      深度学习基因                 │
│      数据闭环能力                 │
│                                   │
│   2. 量产与L4双线并进             │
│      技术协同效应                 │
│      风险分散                     │
│                                   │
│   3. 工程化能力强                 │
│      快速量产落地                 │
│      成本控制优秀                 │
│                                   │
│   4. 客户基础扎实                 │
│      上汽深度绑定                 │
│      多元化拓展                   │
└───────────────────────────────────┘

27.8 总结

Momenta作为中国自动驾驶算法公司的代表，其”量产+L4”双轨并进策略在行业内独树一帜。通过数据驱动的技术路线、扎实的工程化能力，以及与主机厂的深度合作，Momenta在激烈的市场竞争中占据了一席之地。

从2016年创立至今，Momenta见证并参与了中国自动驾驶产业从0到1、从1到100的全过程。其技术演进路径——从单纯的感知算法到全栈解决方案，从模块化架构到端到端系统，反映了整个行业的发展趋势。

展望未来，Momenta面临着技术范式转换（端到端、大模型）、商业模式演进（软件定义汽车）、国际化扩展等多重机遇与挑战。其能否在保持技术领先性的同时，实现商业价值的最大化，将是决定其长期发展的关键因素。

作为中国自动驾驶产业的重要参与者，Momenta的发展轨迹为我们理解这个快速演进的行业提供了一个绝佳的观察窗口。无论是其数据驱动的技术理念，还是量产与L4并进的商业策略，都值得行业深入研究和借鉴。