定位:仅讨论算法方案(从原理到实操细节),不讨论训练方法(loss、schedule、分布式训练等)与不讨论硬件部署(传感器选型、算力盒子、散热与电源等)。 术语约定:
- OCC/Occ:指3D 占据建模与占据栅格/体素/隐式场(occupancy)类方法。
- VLA 大-小脑:以视觉-语言-行动模型为“大脑(思考/规划)”,以轻量反射/控制脑为“小脑(反射/稳定器)”的混合架构。
- 读者:AI 科学家、资深工程师与中厂 infra 同学。
- 目标:在1B/10B 两档模型下,从零起步完成室内导航算法方案(含人形跟踪、脸部注册、避障、语义/语言导航、进阶场景),并落到数据方案:自采 + 合规抓取(优先官方 API 与 CC 授权)+ 开源数据 + 合成与数据治理。
说明:本章仅提供合规流程与算法要点,不提供任何绕过授权或反爬策略。
1 → 2 → 3(总览)→ 8(传统)→ 9(OCC)→ 10–11(VLA/语义)→ 7(避障)→ 5–6(跟踪/人脸)→ 12(规划控制)→ 13–18(数据与治理)→ 19(1B/10B)→ 20–21(进阶与评测)→ 22(骨架)→ 附录。
提示:每个 Chapter 将含可复用的算法接口、伪代码与数据清单,结合自采/源/合成三线推进,确保能在1B 与 10B 两档约束下落到可运行的导航算法方案。