随着大语言模型(LLM)和视觉语言模型(VLM)的广泛应用,如何在资源受限的边缘设备上高效部署这些模型成为了关键挑战。本教程面向工业专家和AI科学家,系统性地介绍边缘侧模型推理加速的核心技术,涵盖从底层算法优化到上层系统设计的完整技术栈。
本教程将持续更新,跟踪边缘AI领域的最新进展。欢迎反馈和建议。
最后更新:2025年1月