svg_tutorial

SVG-MLLM:基于 SVG 的多模理解生成一体化大模型(中文教程)

本教程面向“理解 + 生成一体”的多模态大模型(MLLM),以 SVG(可解析的文本矢量图形)为核心媒介,系统讲解如何把 SVG 字符串 ↔ SVG 渲染图像 ↔ 自然语言三者打通:

文件组织:index.md + chapter1.mdchapter16.md(共 16 章)


你将完成的能力清单

目录(16 章)

每章文件:chapterN.md
章节内小节编号采用 N.M(例如 3.2 表示第 3 章第 2 节)


第 1 章:从 SVG 到 SVG-MLLM:问题定义与路线图


第 2 章:SVG 核心语法:从 XML 到几何表达


第 3 章:SVG 与 Web 联动:DOM、CSS、JS 与 three.js 协同


第 4 章:Web SVG 数据工程:采集、清洗、规范化与对齐


第 5 章:传统矢量化与图像追踪(Image Tracing)算法


第 6 章:SVG 结构化表示:从文本到 Token / AST / 图


第 7 章:渲染引擎与训练闭环:resvg 与 PyTorch-SVGRender


第 8 章:DeepSVG:学习式 SVG 表示与生成基线


第 9 章:从 Stroke 到 Path:Sketch 系列思想与贝塞尔生成


第 10 章:现代 SVG 工作谱系综述:StarVector、OmniSVG、InternSVG 等


第 11 章:SVG-MLLM 架构设计:理解与生成一体化


第 12 章:训练流程:预训练、指令微调、偏好对齐与有效性保障


第 13 章:评测体系:像素、结构、语义与可编辑性


第 14 章:SVG Animation:时间维度、交互与可控运动生成


第 15 章:应用专题 I:字体、字形生成与排版(SVG × Typography)


第 16 章:应用专题 II:BEV 矢量地图与系统落地(SVG × Map/Driving)


建议阅读路线(可选)