第20章：特斯拉FSD技术解密

章节大纲

20.1 FSD发展历程与关键里程碑

Autopilot到FSD的演进路径
关键版本迭代与技术突破
从规则驱动到数据驱动的转变

20.2 感知架构演进：从2D到BEV到占据网络

HydraNet多任务学习架构
BEV感知范式革命
占据网络与3D重建
时序融合与4D感知

20.3 规划控制算法：从模块化到神经网络规划

传统规划器到神经网络规划器
轨迹预测与交互式规划
向量空间与拓扑推理

20.4 端到端架构革命：FSD V12的技术突破

纯视觉端到端架构设计
神经网络直接输出控制信号
训练数据与模型规模
实车部署与优化

20.5 数据引擎与影子模式

影子模式数据收集机制
自动标注与数据挖掘
触发器与边缘案例收集
数据飞轮与持续改进

20.6 硬件演进与算力布局

从Mobileye到自研芯片
FSD Computer架构设计
HW4.0与未来算力需求
车端推理优化

20.7 技术理念与工程哲学

第一性原理思维
软件定义汽车
垂直整合vs水平分工
成本控制与规模化

20.1 FSD发展历程与关键里程碑

Autopilot时代 (2014-2016)

Tesla的自动驾驶之路始于2014年10月，当时发布的Autopilot 1.0基于Mobileye EyeQ3芯片，这是一个典型的ADAS系统：

Autopilot 1.0 硬件配置
┌────────────────────────────────────┐
│  • Mobileye EyeQ3 (2.5 TOPS)       │
│  • 1个前视摄像头 (单目)             │
│  • 12个超声波传感器                 │
│  • 1个前向毫米波雷达                │
└────────────────────────────────────┘
         ↓
   功能：车道保持 + ACC自适应巡航

这一时期的技术特点：

感知算法：基于Mobileye黑盒算法，Tesla无法修改
规划控制：简单的车道跟随和跟车逻辑
数据收集：无法获取原始传感器数据

自研转型期 (2016-2019)

2016年10月，Tesla与Mobileye分手后开启自研之路，这是自动驾驶史上的关键转折点：

Autopilot 2.0 (2016.10)

硬件：NVIDIA Drive PX2 (8 TOPS)
传感器：8个摄像头覆盖360度视野
软件：从零开始构建视觉感知栈

关键技术突破时间线：

| 时间 | 版本 | 技术突破 | 影响 |

时间	版本	技术突破	影响
2017.1	AP2.0	基础车道识别	功能追平AP1.0
2018.3	AP2.5	多摄像头融合	360度感知能力
2019.3	AP3.0	FSD Computer上线	算力提升至144 TOPS
2019.4	Navigate on Autopilot	自动变道决策	L2+功能实现

FSD Beta时代 (2020-2022)

2020年10月，FSD Beta开始小范围推送，标志着从高速公路向城市道路的扩展：

FSD Beta架构演进：

2020 FSD Beta v1-v8 (基于规则的规划器)
┌─────────┐    ┌─────────┐    ┌──────────┐
│  感知   │ -> │ 预测    │ -> │ 规则规划  │
│ HydraNet│    │ 轨迹    │    │ C++代码   │
└─────────┘    └─────────┘    └──────────┘

2021 FSD Beta v9-v10 (混合架构)
┌─────────┐    ┌─────────┐    ┌──────────┐
│  BEV    │ -> │ 向量化  │ -> │ 神经网络  │
│  感知   │    │ 预测    │    │ + 规则    │
└─────────┘    └─────────┘    └──────────┘

2022 FSD Beta v11 (统一栈)
┌────────────────────────────────────┐
│      统一神经网络架构               │
│   高速公路 + 城市道路 + 泊车        │
└────────────────────────────────────┘

端到端革命 (2023-2024)

2023年8月，FSD V12的发布彻底改变了自动驾驶的技术范式：

V12核心变革：

移除C++代码：30万行C++规划控制代码被神经网络替代
端到端学习：从传感器输入直接到控制输出
纯模仿学习：基于人类驾驶数据训练，无需手工规则

版本演进对比：

特性	FSD v11	FSD v12	变化意义
代码量	30万行C++	<1000行Python	复杂度降低99%
规划器	混合架构	纯神经网络	完全数据驱动
训练数据	自动标注	人类驾驶轨迹	学习人类直觉
模型大小	~100M参数	~1B参数	容量提升10倍
推理延迟	100ms	10ms	实时性提升

20.2 感知架构演进：从2D到BEV到占据网络

HydraNet多任务学习架构 (2018-2020)

Tesla最早采用的深度学习感知架构是HydraNet，这是一个共享骨干网络的多任务学习系统：

HydraNet架构示意图
                 ┌─> 车道线检测 Head
                 │
摄像头输入 -> ResNet -> ├─> 交通标志 Head
                 │
                 ├─> 车辆检测 Head
                 │
                 └─> 可行驶区域 Head

关键创新：
• 共享特征提取器减少计算
• 多任务联合训练提升泛化
• 任务间相互正则化

技术细节：

骨干网络：RegNet系列，针对车载部署优化
任务头设计：不同任务使用专门的解码器
损失函数权重：动态平衡不同任务的学习速率

BEV感知范式革命 (2021)

2021年AI Day，Tesla展示了革命性的BEV（鸟瞰图）感知架构：

为什么需要BEV？

传统2D感知问题：
┌──────────┐  ┌──────────┐  ┌──────────┐
│ 前视相机  │  │ 侧视相机  │  │ 后视相机  │
└────┬─────┘  └────┬─────┘  └────┬─────┘
     ↓              ↓              ↓
  2D检测结果    2D检测结果    2D检测结果
     ↓              ↓              ↓
     └──────> 后融合 <────────┘
              (不一致、重复、遮挡)

BEV统一表征：
所有相机 -> Transformer -> BEV空间
                ↓
          统一3D世界表征
         (一致、完整、可解释)

BEV Transformer架构：

# 伪代码展示BEV构建过程
class BEVTransformer:
    def __init__(self):
        self.image_encoder = RegNet()  # 图像特征提取
        self.bev_queries = nn.Parameter()  # BEV查询向量
        self.transformer = MultiHeadAttention()  # 交叉注意力

    def forward(self, multi_cam_images):
        # 1. 提取多相机特征
        img_features = [self.image_encoder(img) for img in multi_cam_images]

        # 2. BEV查询与图像特征交互
        bev_features = self.transformer(
            query=self.bev_queries,  # [H_bev, W_bev, C]
            key=img_features,         # [N_cam, H_img, W_img, C]
            value=img_features
        )

        # 3. 生成BEV表征
        return bev_features  # [H_bev, W_bev, C]

关键技术点：

位置编码：3D空间位置编码建立2D-3D对应关系
时序融合：多帧BEV特征通过RNN/Transformer融合
多尺度特征：FPN结构处理不同距离的目标

占据网络与3D重建 (2022)

2022年，Tesla进一步推出Occupancy Network（占据网络），实现精细的3D场景重建：

占据网络输出格式：
┌────────────────────────────────┐
│  3D Voxel Grid (体素网格)        │
│  • 分辨率: 200m × 200m × 10m    │
│  • 体素大小: 0.2m × 0.2m × 0.2m │
│  • 语义类别: 16类               │
└────────────────────────────────┘
         ↓
每个体素预测：

- 占据概率 (是否有物体)
- 语义标签 (车辆/行人/道路等)
- 运动向量 (动态物体速度)

占据网络优势：

通用表征：不需要预定义物体类别
处理异形物体：施工区域、散落物等
几何完整性：保留完整3D结构

4D感知与时序融合

Tesla的最新感知系统加入时间维度，实现4D感知：

时序融合架构：
t-3 ─┐
t-2 ─┼─> Temporal     -> 4D BEV
t-1 ─┤   Transformer      Feature
t   ─┘                    (包含运动信息)

优势：
• 处理遮挡：利用历史信息补全
• 速度估计：直接从时序特征学习
• 轨迹预测：基于历史运动模式

内存机制设计：

| 组件 | 功能 | 技术实现 |

组件	功能	技术实现
空间内存	存储静态地图特征	Spatial Memory Bank
时序内存	存储动态物体轨迹	Temporal Queue
注意力机制	动态检索相关信息	Cross-Attention

20.3 规划控制算法：从模块化到神经网络规划

传统规划架构 (2016-2020)

早期FSD采用经典的模块化规划架构：

传统规划pipeline：
感知输出 -> 行为预测 -> 轨迹规划 -> 运动控制
    ↓          ↓           ↓           ↓
  物体列表   他车轨迹    候选路径    控制指令

核心算法：
• A*搜索：全局路径规划
• Lattice规划：局部轨迹生成
• 优化求解：轨迹平滑与优化
• MPC控制：模型预测控制

Lattice规划器实现：

# 简化的Lattice规划算法
class LatticePlanner:
    def plan(self, ego_state, obstacles, goal):
        # 1. 生成候选轨迹
        trajectories = []
        for lateral_offset in [-3.5, 0, 3.5]:  # 车道偏移
            for velocity in [0, 30, 60, 90]:    # 目标速度
                traj = self.generate_trajectory(
                    ego_state, lateral_offset, velocity
                )
                trajectories.append(traj)

        # 2. 轨迹评估
        best_traj = None
        min_cost = float('inf')
        for traj in trajectories:
            cost = self.evaluate_trajectory(
                traj, obstacles, goal
            )
            if cost < min_cost:
                min_cost = cost
                best_traj = traj

        return best_traj

神经网络规划器 (2021-2022)

FSD Beta v9开始引入神经网络规划器，逐步替代规则：

混合规划架构：
┌──────────────┐     ┌──────────────┐
│  神经网络    │     │   规则后处理  │
│  规划器      │ --> │   安全检查    │
└──────────────┘     └──────────────┘
     ↓                      ↓
  初始轨迹              最终轨迹

神经网络输出：
• 轨迹候选集 (多模态)
• 轨迹置信度
• 交互意图

向量空间规划：

Tesla创新性地将规划问题转换到向量空间：

向量化场景表征：
道路 = {车道线向量, 路沿向量, 停止线向量}
物体 = {边界框向量, 速度向量, 加速度向量}
     ↓
  Transformer处理
     ↓
轨迹 = {路径点向量, 速度剖面, 加速度剖面}

交互式规划与博弈

处理复杂交互场景的关键技术：

交互建模：
┌─────────────────────────────────┐
│     Joint Prediction & Planning │
│  同时预测所有交通参与者的行为     │
└─────────────────────────────────┘
           ↓
    博弈论框架建模
           ↓
┌──────────┬──────────┬──────────┐
│  让行    │  并行    │  抢行     │
│ P=0.3    │ P=0.5    │ P=0.2     │
└──────────┴──────────┴──────────┘

关键创新点：

条件预测：基于自车意图预测他车反应
社会兼容性：学习人类驾驶的社会规范
风险感知：显式建模不确定性

20.4 端到端架构革命：FSD V12的技术突破

纯视觉端到端架构设计

FSD V12实现了真正的端到端学习，整个驾驶任务由单一神经网络完成：

V12架构简化图：
8个摄像头 -> Vision Transformer -> 控制输出
   (raw pixels)                    (方向盘/油门/刹车)

模型规模：
• 参数量：~1B (10亿)
• FLOPs：~100G per frame
• 推理延迟：10ms @ HW4.0

架构细节：

class FSDV12Model(nn.Module):
    def __init__(self):
        # 视觉编码器
        self.vision_encoder = VisionTransformer(
            img_size=1280,
            patch_size=16,
            embed_dim=1024,
            depth=24,
            num_heads=16
        )

        # 时序聚合
        self.temporal_fusion = nn.LSTM(
            input_size=1024,
            hidden_size=2048,
            num_layers=3
        )

        # 控制解码器
        self.control_head = nn.Sequential(
            nn.Linear(2048, 1024),
            nn.ReLU(),
            nn.Linear(1024, 512),
            nn.ReLU(),
            nn.Linear(512, 3)  # steering, throttle, brake
        )

    def forward(self, video_frames):
        # video_frames: [B, T, C, H, W]
        B, T = video_frames.shape[:2]

        # 编码每一帧
        frame_features = []
        for t in range(T):
            feat = self.vision_encoder(video_frames[:, t])
            frame_features.append(feat)

        # 时序融合
        features = torch.stack(frame_features, dim=1)
        lstm_out, _ = self.temporal_fusion(features)

        # 生成控制信号
        controls = self.control_head(lstm_out[:, -1])
        return controls

训练数据与规模

V12的训练需要海量高质量数据：

数据规模对比：
┌────────────────────────────────────┐
│  FSD V11：                         │
│  • 1M 小时视频                     │
│  • 自动标注为主                    │
│  • 仿真数据增强                    │
└────────────────────────────────────┘

┌────────────────────────────────────┐
│  FSD V12：                         │
│  • 10M+ 小时视频                   │
│  • 纯人类驾驶数据                  │
│  • 精选高质量驾驶员                │
└────────────────────────────────────┘

数据筛选策略：

| 维度 | 筛选标准 | 目的 |

维度	筛选标准	目的
驾驶员质量	无事故、低急刹	学习安全驾驶
场景覆盖	城市/高速/雨雪	泛化能力
行为多样性	变道/转弯/泊车	完整技能
地理分布	全球多地区	适应性

模型训练基础设施

训练集群配置：
┌────────────────────────────────────┐
│  Dojo超算中心                       │
│  • 10,000+ D1芯片                  │
│  • 1.1 ExaFLOP算力                 │
│  • 定制互联架构                    │
└────────────────────────────────────┘
         +
┌────────────────────────────────────┐
│  NVIDIA GPU集群                     │
│  • 10,000+ A100 GPUs               │
│  • 作为Dojo补充                    │
└────────────────────────────────────┘

训练优化技术：

数据并行：跨GPU分布式训练
模型并行：大模型分片训练
混合精度：FP16/BF16加速
梯度累积：模拟大batch训练

实车部署优化

将10亿参数模型部署到车端需要极致优化：

部署优化技术栈：
原始模型 (FP32, 4GB)
    ↓
量化 (INT8, 1GB)
    ↓  
剪枝 (去除冗余, 0.8GB)
    ↓
知识蒸馏 (小模型, 0.5GB)
    ↓
硬件优化 (NPU加速)
    ↓
最终：10ms延迟 @ 36 FPS

关键优化技术：

# INT8量化示例
def quantize_model(model):
    # 1. 收集激活值统计
    calibration_data = collect_calibration_data()

    # 2. 计算量化参数
    for name, module in model.named_modules():
        if isinstance(module, nn.Linear):
            # 计算权重量化范围
            w_min, w_max = module.weight.min(), module.weight.max()
            scale = (w_max - w_min) / 255
            zero_point = -w_min / scale

            # 量化权重
            module.weight = quantize(
                module.weight, scale, zero_point
            )

    return model

20.5 数据引擎与影子模式

影子模式机制

Tesla Fleet的每辆车都是数据收集器，影子模式是其核心：

影子模式工作流程：
┌──────────────┐     ┌──────────────┐
│  生产模型    │     │  开发模型    │
│  (控制车辆)  │     │  (影子运行)  │
└──────┬───────┘     └──────┬───────┘
       ↓                     ↓
    实际决策              预测决策
       ↓                     ↓
       └──────比较──────────┘
                ↓
         不一致时触发上传

触发器设计：

| 触发条件 | 数据价值 | 示例 |

触发条件	数据价值	示例
接管事件	极高	人工干预=模型失败
预测分歧	高	新旧模型输出不同
置信度低	高	模型不确定场景
罕见场景	中	分布外数据
随机采样	低	保持数据多样性

自动标注系统

V12之前的版本依赖自动标注系统：

自动标注Pipeline：
原始视频 -> 多模型投票 -> 时序一致性 -> 人工审核
            ↓              ↓              ↓
         初始标注      优化标注      最终标注

标注类型：
• 3D边界框
• 车道线
• 可行驶区域
• 交通标志/信号灯
• 静态障碍物

离线重建技术：

class OfflineReconstruction:
    """
    使用多帧信息进行高精度3D重建
    """
    def reconstruct(self, video_clip):
        # 1. 多视角几何重建
        point_cloud = multi_view_stereo(video_clip)

        # 2. 时序聚合
        accumulated_pc = temporal_fusion(point_cloud)

        # 3. 语义分割
        semantic_map = segment_point_cloud(accumulated_pc)

        # 4. 生成高质量标注
        annotations = generate_labels(semantic_map)

        return annotations

数据挖掘策略

从海量数据中找出最有价值的样本：

主动学习循环：
┌─────────────────────────────┐
│  1. 模型预测不确定性评估     │
│  2. 识别失败模式             │
│  3. 查询相似案例             │
│  4. 优先标注&训练            │
│  5. 模型更新                 │
└─────────────────────────────┘
            ↑__________|

长尾场景挖掘：

| 场景类型 | 挖掘方法 | 数据量需求 |

场景类型	挖掘方法	数据量需求
施工区域	视觉异常检测	10K clips
紧急车辆	音频+视觉	5K clips
恶劣天气	传感器退化检测	50K clips
异常行为	轨迹异常检测	100K clips

数据飞轮效果

数据飞轮增长曲线：
性能 ↑
     │     ╱─────── 规模效应显现
     │   ╱
     │  ╱
     │ ╱ ← 指数增长期
     │╱
     └────────────────→ 数据量
     100K  1M   10M  100M clips

关键指标：
• 接管率：1000英里/次 -> 10000英里/次
• 场景覆盖：90% -> 99.9%
• 模型置信度：85% -> 98%

20.6 硬件演进与算力布局

从Mobileye到自研芯片历程

硬件演进时间线：
2014  Mobileye EyeQ3 (2.5 TOPS)
      └─> ADAS功能实现

2016  NVIDIA PX2 (8 TOPS)
      └─> 初步自研软件栈

2017  NVIDIA PX2+ (10 TOPS)
      └─> 过渡方案

2019  FSD Computer HW3.0 (144 TOPS)
      └─> 完全自研芯片

2023  FSD Computer HW4.0 (>500 TOPS)
      └─> 支持更大模型

FSD Computer架构设计

HW3.0芯片架构：

FSD Computer HW3.0 (2019)
┌──────────────────────────────────┐
│  双芯片冗余设计                    │
├──────────────────────────────────┤
│  芯片规格 (单片)：                 │
│  • 工艺：14nm FinFET              │
│  • 晶体管：60亿                   │
│  • NPU：2个，36 TOPS each         │
│  • CPU：12核 ARM A72              │
│  • GPU：1 TOPS (Mali)             │
│  • SRAM：32MB                     │
│  • DRAM：4GB LPDDR4               │
└──────────────────────────────────┘

NPU架构特点：
• 96×96 MAC阵列
• INT8/FP16混合精度
• 定制指令集
• 硬件级批处理

HW4.0升级要点：

| 参数 | HW3.0 | HW4.0 | 提升 |

参数	HW3.0	HW4.0	提升
工艺	14nm	7nm	2代
算力	144 TOPS	500+ TOPS	3.5x
内存	8GB	20GB	2.5x
摄像头	8×1.2MP	8×5MP	4x像素
功耗	72W	100W	1.4x

神经网络加速器设计

NPU微架构：
┌─────────────────────────────────┐
│         Instruction Decoder      │
└────────────┬────────────────────┘
             ↓
┌─────────────────────────────────┐
│      MAC Array (96×96)          │
│  ┌────┬────┬────┬────┐         │
│  │MAC │MAC │MAC │MAC │         │
│  ├────┼────┼────┼────┤         │
│  │MAC │MAC │MAC │MAC │         │
│  └────┴────┴────┴────┘         │
└─────────────────────────────────┘
             ↓
┌─────────────────────────────────┐
│      Activation Functions       │
│      (ReLU, Sigmoid, Tanh)      │
└─────────────────────────────────┘

优化特性：
• 零跳过：跳过零值计算
• 权重压缩：稀疏权重存储
• 流水线：多层并行执行

车端推理优化

模型部署流程：

# 编译优化流程
def compile_for_fsd_computer(pytorch_model):
    # 1. 导出ONNX
    onnx_model = torch.onnx.export(pytorch_model)

    # 2. 图优化
    optimized = optimize_graph(onnx_model)
    # - 算子融合
    # - 常量折叠
    # - 死代码消除

    # 3. 量化
    quantized = quantize_int8(optimized)

    # 4. 硬件映射
    npu_program = map_to_npu(quantized)
    # - 算子分配
    # - 内存规划
    # - 并行策略

    # 5. 生成二进制
    return compile_to_binary(npu_program)

内存优化策略：

内存层次结构：
┌─────────────┐
│  DRAM (4GB) │ ← 模型权重
└──────┬──────┘
       ↓ 100GB/s
┌─────────────┐
│  SRAM (32MB)│ ← 中间激活值
└──────┬──────┘
       ↓ 2TB/s
┌─────────────┐
│  寄存器文件  │ ← 当前计算
└─────────────┘

优化技术：
• 权重复用：最小化DRAM访问
• 激活值压缩：减少内存占用
• 算子调度：优化数据流

Dojo训练芯片

Tesla不仅自研推理芯片，还开发了训练超算Dojo：

Dojo系统架构：
D1芯片 (单片)
• 7nm工艺
• 500亿晶体管
• 362 TFLOPS BF16
• 带宽：10 TB/s

训练瓦片 (25个D1)
• 9 PFLOPS计算力
• 36TB/s带宽
• 无缝互联

机柜 (120个瓦片)
• 1.1 EFLOPS
• 定制冷却系统

20.7 技术理念与工程哲学

第一性原理思维

Elon Musk的第一性原理深刻影响FSD开发：

传统思维 vs 第一性原理：

传统：激光雷达是必需的
  ↓
第一性原理分析：
• 人类只用眼睛驾驶
• 摄像头信息理论上充足
• 神经网络可以学习深度
  ↓
结论：纯视觉可行

传统：需要高精地图
  ↓  
第一性原理分析：
• 人类不需要厘米级地图
• 实时感知可以构建地图
• 地图维护成本不可持续
  ↓
结论：无图方案

软件定义汽车

传统汽车 vs 软件定义：

传统架构：
ECU1 -> 功能1 (固定)
ECU2 -> 功能2 (固定)
ECU3 -> 功能3 (固定)

Tesla架构：
中央计算 -> 所有功能 (OTA升级)
         ↓
    持续功能改进
    新功能推送
    性能优化

OTA升级案例：

| 版本 | 新增功能 | 技术突破 |

版本	新增功能	技术突破
2019.36	增程10%	电池管理优化
2020.48	绿灯提醒	信号灯识别
2021.44	FSD Beta	城市自动驾驶
2023.26	自动泊车	端到端泊车

垂直整合vs水平分工

Tesla垂直整合：
┌─────────────────┐
│   芯片设计       │ <- 自研
├─────────────────┤
│   系统软件       │ <- 自研
├─────────────────┤
│   AI算法         │ <- 自研
├─────────────────┤
│   数据收集       │ <- 自有车队
├─────────────────┤
│   训练基础设施   │ <- Dojo
└─────────────────┘

优势：
• 快速迭代
• 深度优化
• 成本控制
• 知识产权

成本控制哲学

成本优化策略：
硬件成本：
• 去除激光雷达：-$5000
• 去除毫米波雷达：-$500
• 自研芯片：-$1000
• 规模效应：-$2000
总计：<$1500 BOM成本

软件摊销：
研发投入：$10B
车辆规模：10M辆
单车成本：$1000
随规模递减

工程文化

快速迭代：

传统车企：3-5年开发周期
Tesla：2周发布周期

SpaceX方法论：

1. 快速原型
2. 测试失败
3. 快速改进
4. 规模部署

数据驱动决策：

| 决策类型 | 数据依据 | 频率 |

决策类型	数据依据	频率
功能优先级	用户使用率	每周
模型选择	A/B测试	每版本
硬件规格	仿真验证	每代

未来展望

FSD技术路线图推测：
2024：
• V12全面推广
• HW4.0规模部署
• 全球市场扩展

2025：
• V13多模态输入
• 语音交互
• 个性化驾驶风格

2026+：
• 通用机器人技术
• Robotaxi规模运营
• AGI驾驶能力

本章小结

Tesla FSD代表了自动驾驶技术的一种独特路径：

核心特点：

纯视觉坚持：第一性原理驱动的技术选择
端到端革命：从规则到数据的范式转变
垂直整合：从芯片到算法的全栈自研
规模效应：百万级车队的数据优势
快速迭代：软件定义下的持续进化

技术启示：

数据规模可能比算法创新更重要
端到端学习是未来趋势
硬件软件协同设计带来极致优化
工程化能力决定落地成败

争议与挑战：

纯视觉在极端场景的局限
端到端的可解释性问题
安全验证的困难
监管合规的挑战

Tesla FSD的成功不仅来自技术创新，更来自其独特的工程文化、商业模式和执行力。这种模式是否可以复制，仍是行业讨论的焦点。但毫无疑问，Tesla已经深刻改变了自动驾驶的技术范式和发展方向。