小鹏汽车成立于2014年,但真正开始布局自动驾驶是在2016年。创始人何小鹏作为前UC浏览器创始人,深刻理解软件定义的重要性,但在自动驾驶领域,小鹏经历了从依赖供应商到全栈自研的艰难转型。
2014-2018 小鹏自动驾驶早期探索
┌────────────────────────────────────────┐
│ 2014 公司成立,专注电动车研发 │
│ ↓ │
│ 2016 开始组建ADAS团队 │
│ ↓ │
│ 2017 G3立项,采用Mobileye方案 │
│ ↓ │
│ 2018 G3上市,L2级辅助驾驶 │
│ • Mobileye EyeQ4芯片 │
│ • 基础ACC+LCC功能 │
│ • 依赖供应商黑盒方案 │
└────────────────────────────────────────┘
关键决策点:
2019年是小鹏自动驾驶的转折点。吴新宙(前高通自动驾驶负责人)加入小鹏,带来了完整的自研团队和技术路线。
自研转型的核心驱动力:
P7平台架构转型 (2019-2020)
┌─────────────────────────────────────────────┐
│ 硬件升级 │
│ • Xavier计算平台 (30 TOPS) │
│ • 14个摄像头 + 5个毫米波雷达 + 12个超声波 │
│ • 高精定位模块 (RTK+IMU) │
├─────────────────────────────────────────────┤
│ 软件自研 │
│ • 感知算法自研 (基于深度学习) │
│ • 规划控制自研 │
│ • 高精地图合作 (高德) │
│ • OTA能力建设 │
└─────────────────────────────────────────────┘
2021年1月,小鹏正式推送NGP(Navigation Guided Pilot)高速自主导航驾驶功能,成为中国首个量产高速NOA功能的车企。
NGP核心能力:
技术特点:
NGP用户数据增长曲线
│
10万├─────────────────────● 2022.12
│ ╱
5万├──────────────●╱ 2022.06
│ ╱
1万├────────●╱ 2021.12
│ ╱
0.1万├──●╱ 2021.01
└────────────────────────
2021Q1 Q3 2022Q1 Q3
里程碑事件:
2023年是小鹏的”智驾元年”,XNGP(小鹏下一代自动驾驶)正式发布,标志着从高速到城市的全场景覆盖。
XNGP的革命性升级:
XNGP技术架构演进
NGP (2021-2022) XNGP (2023-2024)
┌──────────────┐ ┌──────────────┐
│ 高精地图 │ → │ 轻地图 │
│ 规则决策 │ → │ 神经网络 │
│ 模块化架构 │ → │ 端到端 │
│ 高速场景 │ → │ 全场景 │
│ 30 TOPS │ → │ 508 TOPS │
└──────────────┘ └──────────────┘
XNGP Max版本演进:
2024年,小鹏宣布全面转向端到端架构,这是继特斯拉之后,全球第二家大规模部署端到端自动驾驶的车企。
端到端转型的关键决策:
小鹏端到端架构路线图
第一阶段 (2024Q1-Q2):神经网络规划
• 保留模块化感知
• 规划模块神经网络化
• 控制保持经典方法
第二阶段 (2024Q3-Q4):感知规控一体
• 感知到规划端到端
• 控制仍然独立
• 引入时序建模
第三阶段 (2025+):完全端到端
• 传感器到执行器
• 引入世界模型
• 强化学习优化
关键技术投入:
NGP采用了经典的多传感器融合架构,这在2021年是主流选择。
NGP感知架构
传感器层
┌─────────────────────────────────────┐
│ 5个毫米波雷达 14个摄像头 12个超声波 │
└────┬──────────┬──────────┬──────────┘
↓ ↓ ↓
预处理层
┌─────────────────────────────────────┐
│ 点云处理 图像处理 距离处理 │
└────┬──────────┬──────────┬──────────┘
↓ ↓ ↓
特征提取
┌─────────────────────────────────────┐
│ 3D目标检测 2D检测 车道线检测 │
│ ResNet50 YOLO LaneNet │
└────┬──────────┬──────────┬──────────┘
└──────────┼──────────┘
↓
后融合层
┌─────────────────────────────────────┐
│ 卡尔曼滤波 目标关联 轨迹预测 │
└─────────────────────────────────────┘
↓
3D场景理解
技术特点:
感知模块详解:
| 模块 | 算法 | 输入 | 输出 | 性能指标 |
|---|---|---|---|---|
| 车辆检测 | YOLOv4改进版 | 图像 | 3D框 | mAP>85% |
| 车道线检测 | LaneNet+后处理 | 图像 | 多项式参数 | F1>90% |
| 可行驶区域 | PSPNet | 图像 | 语义分割图 | IoU>88% |
| 目标跟踪 | 多假设跟踪 | 检测结果 | 轨迹 | MOTA>80% |
| 速度估计 | 卡尔曼滤波 | 雷达+视觉 | 3D速度 | 误差<0.5m/s |
NGP的定位系统强依赖高精地图,这是其能够实现稳定性能的关键。
定位系统架构
GNSS+RTK ──→ 绝对定位 (米级)
↓
IMU ────────→ 相对定位 (厘米级)
↓
轮速计 ──────→ 航位推算
↓
视觉定位 ────→ 地图匹配 ←── 高精地图
↓
┌─────────────────────┐
│ 融合定位结果 │
│ • 精度: <10cm │
│ • 频率: 100Hz │
│ • 延迟: <20ms │
└─────────────────────┘
高精地图依赖分析:
NGP的规划系统采用了经典的分层规划架构:
规划系统分层架构
任务规划 (Mission Planning)
├─ 路线规划:A*算法
└─ 任务分解:有限状态机
↓
行为规划 (Behavior Planning)
├─ 场景识别:规则引擎
├─ 决策制定:决策树
└─ 行为选择:成本函数
↓
轨迹规划 (Trajectory Planning)
├─ 轨迹生成:五次多项式
├─ 轨迹评估:多目标优化
└─ 轨迹选择:动态规划
↓
最优轨迹输出
关键算法细节:
变道决策伪代码:
if (前车速度 < 期望速度 - 10km/h) and
(目标车道安全距离 > 100m) and
(横向加速度 < 0.2g) and
(地图允许变道):
执行变道
else:
保持车道
NGP的控制层采用成熟的经典控制理论:
控制系统架构
轨迹跟踪控制器
├─ 横向控制
│ ├─ Pure Pursuit (低速)
│ ├─ LQR (中速)
│ └─ MPC (高速)
│
└─ 纵向控制
├─ PID控制器
├─ 前馈补偿
└─ 自适应巡航
↓
执行器接口
├─ 转向控制
├─ 油门控制
└─ 制动控制
控制性能指标:
NGP的一大特色是完整的OTA体系:
数据闭环流程
车端数据采集
↓
边缘触发上传 (4G/5G)
↓
云端数据清洗
↓
场景挖掘 & 自动标注
↓
模型训练 & 验证
↓
仿真回归测试
↓
OTA推送 (灰度发布)
↓
效果评估 & 迭代
数据采集策略:
OTA升级节奏:
2023年,小鹏发布了全新的XNet感知架构,这是中国车企中最早大规模部署BEV+Transformer架构的案例之一。
XNet 2.0 感知架构
多视角输入 (8个摄像头)
┌──┬──┬──┬──┬──┬──┬──┬──┐
│前│前│前│左│右│左│右│后│
│左│中│右│前│前│后│后│ │
└─┬┴─┬┴─┬┴─┬┴─┬┴─┬┴─┬┴─┬┘
└──┼──┼──┼──┼──┼──┼──┘
↓ ↓ ↓ ↓ ↓ ↓
┌────────────────────────┐
│ Vision Transformer │
│ (Backbone: ResNet101) │
└────────────────────────┘
↓
┌────────────────────────┐
│ BEV Transform │
│ (LSS + Transformer) │
└────────────────────────┘
↓
┌────────────────────────┐
│ Temporal Fusion │
│ (多帧时序融合) │
└────────────────────────┘
↓
┌────────────────────────┐
│ Multi-Task Heads │
│ • 3D检测 │
│ • 车道线 │
│ • 可行驶区域 │
│ • 占据网格 │
└────────────────────────┘
XNet的核心创新:
时序融合示意图
t-3 t-2 t-1 t
│ │ │ │
↓ ↓ ↓ ↓
[F] [F] [F] [F] ← 特征提取
│ │ │ │
└────┴────┴────┘
↓
Temporal Transformer
↓
融合特征
性能对比:
| 指标 | NGP (2021) | XNGP (2023) | 提升 |
|---|---|---|---|
| 检测距离 | 150m | 200m | +33% |
| 检测精度(mAP) | 72% | 89% | +24% |
| 车道线准确率 | 85% | 95% | +12% |
| 推理延迟 | 85ms | 45ms | -47% |
| 算力需求 | 30 TOPS | 100 TOPS | +233% |
XNGP最大的突破是摆脱了对高精地图的依赖,采用”轻地图”方案。
轻地图架构
导航地图 (道路拓扑)
↓
实时建图模块
├─ 车道线检测
├─ 道路边界识别
├─ 交通标志识别
└─ 拓扑关系推理
↓
局部地图构建 (500m范围)
├─ 车道级拓扑
├─ 可行驶区域
├─ 静态障碍物
└─ 交通规则
↓
地图匹配与更新
├─ 多车协同建图
├─ 云端地图更新
└─ 离线地图缓存
轻地图 vs 高精地图对比:
| 维度 | 高精地图 | 轻地图 |
|---|---|---|
| 精度要求 | 厘米级 | 米级 |
| 要素丰富度 | 20+层 | 3-5层 |
| 更新频率 | 季度/月度 | 实时 |
| 覆盖成本 | 1km=1000元 | 1km<10元 |
| 鲜度保证 | 困难 | 实时感知 |
| 扩展性 | 受限 | 不受限 |
实时建图算法:
关联交通规则 ```
XNGP的规划模块实现了从规则到学习的转变,这是其能够处理复杂城市场景的关键。
神经网络规划架构
场景编码器
├─ BEV特征 (来自XNet)
├─ 目标轨迹预测
├─ 地图信息编码
└─ 历史轨迹编码
↓
┌─────────────────────┐
│ Scenario Encoder │
│ (Transformer) │
└─────────────────────┘
↓
┌─────────────────────┐
│ Planning Network │
│ • 意图预测 │
│ • 交互建模 │
│ • 轨迹生成 │
└─────────────────────┘
↓
┌─────────────────────┐
│ 轨迹优化器 │
│ • 安全性约束 │
│ • 舒适性约束 │
│ • 规则约束 │
└─────────────────────┘
↓
最终轨迹输出
神经网络规划的优势:
驾驶风格建模
激进型 ────────────── 保守型
│ │
快速变道 谨慎跟车
小间距 大间距
高加速度 缓加速
│ │
└──────── 自适应 ───────┘
规划网络训练策略:
| 训练阶段 | 数据来源 | 训练目标 | 数据规模 |
|---|---|---|---|
| 预训练 | 人工驾驶数据 | 模仿学习 | 1000万公里 |
| 微调 | 安全驾驶员接管 | 纠正学习 | 100万场景 |
| 强化学习 | 仿真环境 | 策略优化 | 10亿公里 |
| 在线学习 | 用户反馈 | 持续优化 | 实时更新 |
XNGP通过大规模数据驱动实现了城市场景的泛化。
城市场景泛化策略
数据多样性
├─ 地理多样性 (100+城市)
├─ 时间多样性 (全天候)
├─ 天气多样性 (雨雪雾)
└─ 场景多样性 (100万+)
↓
特征解耦
├─ 场景无关特征
│ • 物理规律
│ • 交通规则
│ • 安全约束
│
└─ 场景特定特征
• 本地驾驶习惯
• 道路特征
• 交通流特征
↓
泛化模型训练
典型城市场景处理能力:
XNGP采用了NVIDIA双Orin计算平台,这是算力的巨大飞跃。
计算平台架构
┌────────────────────────────┐
│ 主Orin-X (254 TOPS) │
│ • 感知计算 │
│ • BEV转换 │
│ • 目标检测与跟踪 │
└────────────────────────────┘
↓↑
高速互联 (PCIe 4.0)
↓↑
┌────────────────────────────┐
│ 副Orin-X (254 TOPS) │
│ • 规划决策 │
│ • 轨迹优化 │
│ • 冗余备份 │
└────────────────────────────┘
总算力:508 TOPS
算力分配策略:
| 模块 | 算力占比 | TOPS | 主要计算 |
|---|---|---|---|
| 感知 | 40% | 203 | CNN+Transformer |
| 预测 | 20% | 102 | RNN+Attention |
| 规划 | 25% | 127 | 搜索+优化 |
| 控制 | 5% | 25 | MPC计算 |
| 冗余 | 10% | 51 | 安全备份 |
优化技术:
小鹏的自动驾驶团队建设经历了从0到1500+人的快速扩张,形成了完整的人才梯队。
团队组织架构 (2024)
┌─────────────────────────────┐
│ VP of Autonomous │
│ 吴新宙 (前高通) │
└──────────┬──────────────────┘
↓
┌──────────┴──────────┐
│ │
感知团队 规控团队
├─ 视觉感知 ├─ 行为规划
├─ 激光雷达 ├─ 轨迹规划
├─ 传感器融合 ├─ 决策控制
└─ 地图定位 └─ 预测模块
│ │
↓ ↓
基础设施团队 数据智能团队
├─ 训练平台 ├─ 数据挖掘
├─ 仿真系统 ├─ 自动标注
├─ 工具链 ├─ 场景理解
└─ 部署优化 └─ 评测体系
人才来源分析:
核心技术负责人背景:
| 职位 | 背景 | 专长领域 |
|---|---|---|
| 感知负责人 | 前Waymo | 3D视觉、多传感器融合 |
| 规划负责人 | 前Uber ATG | 运动规划、强化学习 |
| 仿真负责人 | 前NVIDIA | 物理仿真、神经渲染 |
| 数据负责人 | 前特斯拉 | 大规模数据处理 |
| 地图负责人 | 前百度 | SLAM、高精地图 |
人才培养体系:
小鹏在2023年建成了”扶摇”智算中心,这是其AI能力的基础。
扶摇智算中心架构
┌─────────────────────────────────┐
│ 计算集群 (600P FLOPS) │
│ ┌─────────────────────────┐ │
│ │ 训练集群 (400P) │ │
│ │ • 2000 x A100 GPU │ │
│ │ • InfiniBand网络 │ │
│ └─────────────────────────┘ │
│ ┌─────────────────────────┐ │
│ │ 推理集群 (200P) │ │
│ │ • 1000 x A30 GPU │ │
│ │ • 低延迟优化 │ │
│ └─────────────────────────┘ │
└─────────────────────────────────┘
↓
┌─────────────────────────────────┐
│ 存储系统 (100PB) │
│ • 原始数据:50PB │
│ • 训练数据:30PB │
│ • 模型版本:20PB │
└─────────────────────────────────┘
数据处理能力:
训练效率优化:
| 优化技术 | 提升效果 | 应用场景 |
|---|---|---|
| 混合精度训练 | 2.5x加速 | 大模型训练 |
| 数据并行 | 线性扩展 | 多GPU训练 |
| 模型并行 | 支持超大模型 | Transformer训练 |
| 梯度累积 | 节省显存50% | Batch size优化 |
| 动态图优化 | 1.8x加速 | 推理加速 |
小鹏自研的X-Sim仿真平台是验证算法的关键工具。
X-Sim仿真平台架构
场景生成层
├─ 真实场景重建
│ • Log回放
│ • 场景泛化
│ • 参数随机化
│
├─ 合成场景生成
│ • 程序化生成
│ • 对抗样本
│ • 极端场景
│
└─ 场景库管理
• 100万+场景
• 分类标签
• 难度分级
↓
仿真引擎层
├─ 物理仿真
│ • 车辆动力学
│ • 传感器模型
│ • 环境物理
│
├─ 渲染引擎
│ • 光线追踪
│ • 神经渲染
│ • 天气系统
│
└─ 交通流仿真
• 智能体行为
• 交通规则
• 事件触发
↓
评测分析层
├─ 性能指标
├─ 安全评估
├─ 舒适度评分
└─ 回归测试
仿真测试覆盖:
基础 进阶 极限
跟车 ✓ ✓ ✓
变道 ✓ ✓ ✓
超车 ✓ ✓ ✓
路口 ✓ ✓ ✓
泊车 ✓ ✓ ✓
应急 ✓ ✓ ✓
小鹏在硬件选型上经历了多次迭代,形成了明确的技术路线。
硬件平台演进
2019: Mobileye EyeQ4 (2.5 TOPS)
↓
2020: NVIDIA Xavier (30 TOPS)
↓
2023: 双NVIDIA Orin (508 TOPS)
↓
2025: 自研芯片? (1000+ TOPS)
芯片选型考量因素:
| 因素 | 权重 | Xavier | Orin | 地平线J5 | 华为MDC |
|---|---|---|---|---|---|
| 算力 | 30% | ★★★ | ★★★★★ | ★★★★ | ★★★★ |
| 功耗 | 20% | ★★★★ | ★★★ | ★★★★★ | ★★★★ |
| 成本 | 25% | ★★★ | ★★ | ★★★★ | ★★★ |
| 生态 | 15% | ★★★★★ | ★★★★★ | ★★★ | ★★★ |
| 供应链 | 10% | ★★★ | ★★★ | ★★★★★ | ★★★★★ |
硬件优化策略:
任务分配策略
Orin-1 (主芯片) Orin-2 (副芯片)
├─ 前视感知 ├─ 环视感知
├─ 主路径规划 ├─ 备选路径
├─ 主控制 ├─ 冗余控制
└─ 故障检测 └─ 安全备份
小鹏的自动驾驶技术已经开始向海外市场输出。
国际化布局
2023: 欧洲市场
├─ 挪威 (首个海外NGP)
├─ 丹麦
├─ 荷兰
└─ 德国 (筹备中)
2024: 东南亚市场
├─ 新加坡
├─ 泰国
└─ 马来西亚
2025: 计划市场
├─ 澳大利亚
├─ 中东
└─ 拉美
本地化适配挑战:
技术输出模式:
2024年,小鹏宣布全面拥抱端到端架构,这是继特斯拉之后全球第二家大规模部署端到端自动驾驶的车企。
端到端架构演进路线图
2023 Q4: 概念验证
├─ 小规模测试车队
├─ 基础端到端模型
└─ 数据收集准备
↓
2024 Q1-Q2: 混合架构
├─ 端到端规划先行
├─ 保留模块化感知
└─ 影子模式测试
↓
2024 Q3-Q4: 部分端到端
├─ 感知-规划端到端
├─ 控制独立
└─ 小批量用户测试
↓
2025: 完全端到端
├─ 传感器到执行器
├─ 统一神经网络
└─ 大规模部署
端到端架构设计:
XNGP端到端架构 (2024)
输入层 (多模态)
┌──────────────────────────────┐
│ 8个摄像头 + 车辆状态 + 导航 │
└───────────┬──────────────────┘
↓
┌──────────────────────────────┐
│ Encoder Network │
│ (ViT + Positional Encoding) │
│ 参数:500M │
└───────────┬──────────────────┘
↓
┌──────────────────────────────┐
│ Transformer Backbone │
│ (48层, 2048维, 32头注意力) │
│ 参数:3B │
└───────────┬──────────────────┘
↓
┌──────────────────────────────┐
│ Decoder Network │
│ (轨迹生成 + 控制指令) │
│ 参数:200M │
└───────────┬──────────────────┘
↓
输出层
├─ 轨迹序列 (未来3秒)
├─ 转向角度
├─ 加速度
└─ 置信度分数
关键技术突破:
损失函数设计:
L_total = λ1*L_trajectory + # 轨迹损失
λ2*L_control + # 控制损失
λ3*L_safety + # 安全损失
λ4*L_comfort + # 舒适性损失
λ5*L_auxiliary # 辅助任务损失
小鹏提出的”AI司机”概念,旨在打造一个真正理解驾驶场景和意图的智能系统。
AI司机能力模型
感知理解层
├─ 场景语义理解
├─ 意图识别
├─ 风险评估
└─ 社会交互理解
↓
认知决策层
├─ 目标设定
├─ 策略选择
├─ 行为预测
└─ 博弈决策
↓
执行控制层
├─ 轨迹规划
├─ 动作执行
├─ 实时调整
└─ 异常处理
AI司机的核心特征:
| 特征 | 传统自动驾驶 | AI司机 |
|---|---|---|
| 决策方式 | 规则驱动 | 数据驱动 |
| 场景理解 | 物体检测 | 语义理解 |
| 交互能力 | 被动避让 | 主动交互 |
| 学习能力 | 离线更新 | 持续学习 |
| 泛化能力 | 场景限定 | 全场景 |
| 个性化 | 统一模式 | 风格自适应 |
实现路径:
小鹏XNGP与特斯拉FSD的技术对比是业界关注的焦点。
技术对标分析
特斯拉FSD V12 小鹏XNGP 2024
算力: 2×FSD Chip 2×Orin-X
144 TOPS 508 TOPS
架构: 纯端到端 混合端到端
单一网络 模块化+端到端
数据: 10亿英里 1亿公里
全球数据 中国为主
地图: 零依赖 轻地图
纯视觉建图 导航地图辅助
传感器: 8摄像头 8摄像头
纯视觉 可选毫米波
技术差异分析:
| 维度 | 特斯拉FSD | 小鹏XNGP | 分析 |
|---|---|---|---|
| 数据规模 | ★★★★★ | ★★★ | 特斯拉数据量优势明显 |
| 本土化 | ★★ | ★★★★★ | 小鹏更适应中国路况 |
| 技术激进度 | ★★★★★ | ★★★ | 特斯拉更激进 |
| 成本控制 | ★★★★ | ★★★ | 特斯拉自研芯片有优势 |
| 迭代速度 | ★★★★ | ★★★★★ | 小鹏OTA更频繁 |
| 安全冗余 | ★★★ | ★★★★ | 小鹏保留更多冗余 |
学习与创新:
成本控制是小鹏XNGP面临的关键挑战。
成本结构分析 (单车)
硬件成本
├─ 计算平台:$2000
│ └─ 双Orin芯片
├─ 传感器:$800
│ ├─ 8摄像头:$400
│ ├─ 毫米波:$300
│ └─ 超声波:$100
├─ 其他硬件:$200
└─ 总计:$3000
软件摊销
├─ 研发投入摊销:$500
├─ 数据成本:$200
├─ 云服务:$100
└─ 总计:$800
BOM总成本:~$3800
成本优化策略:
规模化成本曲线
成本($)
4000│●
3500│ ╲
3000│ ╲●
2500│ ╲
2000│ ╲●
1500│ ╲●
1000│ ╲●───
500│
└─────────────→
1万 10万 50万 100万 (年产量)
规模化挑战:
| 挑战 | 现状 | 目标 (2027) | 解决方案 |
|---|---|---|---|
| 渗透率 | 20% | 80% | 标配策略 |
| 单车成本 | $3800 | $1000 | 技术降本 |
| 算力需求 | 508 TOPS | 200 TOPS | 算法优化 |
| 开城速度 | 50城/年 | 全国覆盖 | 轻地图方案 |
| 用户接受度 | 30% | 70% | 体验提升 |
小鹏自动驾驶技术路线图
2025 里程碑
├─ Q1: 端到端大规模推送
├─ Q2: AI司机1.0发布
├─ Q3: 无图方案全国覆盖
└─ Q4: L3级别认证(特定场景)
2026 目标
├─ 完全端到端架构
├─ 单芯片方案量产
├─ 成本降至$1500
├─ 泊车场景全自动
└─ 国际市场扩展
2027 愿景
├─ L4试运营(限定区域)
├─ AI司机2.0
├─ 千元级方案
├─ 全球化部署
└─ 开放平台战略
技术演进重点:
关键技术投资:
| 领域 | 2025 | 2026 | 2027 | 累计(亿元) |
|---|---|---|---|---|
| 算法研发 | 15 | 20 | 25 | 60 |
| 数据基础设施 | 10 | 12 | 15 | 37 |
| 芯片研发 | 5 | 10 | 15 | 30 |
| 仿真平台 | 3 | 5 | 7 | 15 |
| 测试验证 | 2 | 3 | 3 | 8 |
| 总计 | 35 | 50 | 65 | 150 |
战略定位:
“小鹏的目标不仅是追赶特斯拉,而是要在中国市场创造最适合本土的自动驾驶体验,并将这种能力输出到全球。” - 何小鹏
小鹏汽车从NGP到XNGP的演进,展现了中国自动驾驶企业从跟随到创新的完整路径。通过全栈自研、数据驱动、本土化创新,小鹏正在走出一条有中国特色的自动驾驶发展道路。
核心竞争力:
未来挑战:
小鹏的自动驾驶之路,是中国汽车产业智能化转型的缩影,其成功与否,将对整个行业产生深远影响。