1.4 数据经理的核心职责拆解
1.5 多模态数据团队典型角色与分工
2.1 多模态数据类型概览
2.4 标注类型与 Schema 设计
3.2 数据生命周期全景
4.4 抓取范围与采样策略
5.1 开源数据平台总览
5.4 视频 / 音频网站数据
5.5 图像素材网站
5.6 社交媒体数据
5.7 地理 / 街景 / 卫星图数据
5.8 开源数据集 License 解读
6.1 爬虫基础概念与架构
6.2 抓取方式
6.3 反爬虫与合规友好策略
7.1 线下数据供应商分类
7.4 供商评估维度
8.2 猪八戒等人力外包平台使用流程
8.3 标注任务拆解与计价
8.4 质量控制机制
8.5 防止作弊与数据泄露
9.1 原始数据接入与规范化
9.2 文本清洗
9.3 图像 / 视频 / 音频预处理
9.6 多模态对齐检查
10.1 数据集拆分原则
10.2 指令微调数据设计
10.3 安全与对齐数据
10.4 评测数据集设计
10.6 数据偏差与公平性分析
11.2 数据与代码的版本协同管理
11.4 存储分层策略
11.5 备份策略设计
11.6 冷存档方案与成本控制
12.1 数据质量的核心维度
12.3 自动化数据质检
12.4 数据问题管理流程
12.5 数据治理框架(Data Governance)
12.6 安全与隐私保护
13.1 多模态数据项目常见工具链概览
13.2 飞书多维表格基础
13.3 用多维表格搭建「数据资产台账」
13.4 数据进度管理设计
13.5 飞书 Dashboard 实战
14.1 利益相关方(Stakeholder)地图
14.2 会议类型与节奏设计
14.3 与算法团队的协作模式
14.4 与数据采集团队的协作
14.5 与 DA 的协作
15.4 综合练习:设计一套多模态数据方案
16.3 与其他岗位的职业迁移