本教程面向“理解 + 生成一体”的多模态大模型(MLLM),以 SVG(可解析的文本矢量图形)为核心媒介,系统讲解如何把 SVG 字符串 ↔ SVG 渲染图像 ↔ 自然语言三者打通:
文件组织:
index.md+chapter1.md…chapter16.md(共 16 章)
resvg 等渲染引擎 + 可微渲染/近似渲染思路,建立“生成→渲染→监督/评测”的闭环每章文件:
chapterN.md
章节内小节编号采用N.M(例如 3.2 表示第 3 章第 2 节)
<svg>、命名空间、viewBox 与 viewport<path> 语言:M/L/H/V/C/S/Q/T/A/Z 命令与参数语义<text>、tspan、textPath、baseline、glyph<title> / <desc> 与语义增强<image>、<use>、symbol/sprite 与安全resvg:渲染一致性、支持特性、命令行/库集成PyTorch-SVGRender:接口设计、batch 渲染与可训练管线<animate>/<animateTransform>:关键帧、属性插值与 easing