从图形加速到人工智能计算的三十年征程
1993 ├── NVIDIA 成立 (黄仁勋等三人,初始资金4万美元)
1995 ├── NV1 (失败但有教育意义,四边形渲染)
1997 ├── RIVA 128 (3D 加速,月销百万片)
1999 ├── GeForce 256 (GPU 概念诞生,硬件T&L)
2001 ├── GeForce 3 (可编程着色器,nfiniteFX引擎)
2006 ├── CUDA 发布 (通用计算革命,C语言扩展)
2008 ├── Tesla 架构 (统一着色器,GT200)
2010 ├── Fermi (计算专用设计,ECC内存)
2012 ├── Kepler (能效突破,动态并行)
2014 ├── Maxwell (架构优化,2倍能效比)
2016 ├── Pascal (深度学习加速,NVLink)
2017 ├── Volta (Tensor Core,640个张量核心)
2018 ├── Turing (RT Core + 光追,DLSS)
2020 ├── Ampere (第三代 Tensor Core,稀疏计算)
2022 ├── Hopper (Transformer Engine,DPX指令)
2024 ├── Blackwell (第五代 Tensor Core,FP4精度)
| 架构代号 | 年份 | 制程 | 晶体管数 | CUDA核心 | 关键创新 |
|---|---|---|---|---|---|
| Tesla | 2006 | 90nm | 6.8亿 | 128 | 统一着色器 |
| Fermi | 2010 | 40nm | 30亿 | 512 | 双精度计算 |
| Kepler | 2012 | 28nm | 71亿 | 2880 | 动态并行 |
| Maxwell | 2014 | 28nm | 52亿 | 2048 | 能效优化 |
| Pascal | 2016 | 16nm | 150亿 | 3840 | HBM2内存 |
| Volta | 2017 | 12nm | 211亿 | 5120 | Tensor Core |
| Turing | 2018 | 12nm | 186亿 | 4608 | RT Core |
| Ampere | 2020 | 7nm | 542亿 | 10752 | 稀疏计算 |
| Hopper | 2022 | 4nm | 800亿 | 16896 | Transformer引擎 |
| Blackwell | 2024 | 4nm | 2080亿 | 20480 | 第二代Transformer引擎 |
游戏显卡时代 (1999-2010)
├── GeForce 产品线
├── Quadro 专业卡
└── 授权费收入
数据中心转型 (2010-2020)
├── Tesla 计算卡
├── DGX 系统销售
├── CUDA 生态锁定
└── 云服务商合作
AI平台垄断 (2020-至今)
├── H100/H200 供不应求
├── 软件订阅服务
├── Omniverse 云平台
├── DGX Cloud 服务
└── 主权AI方案
┌─────────────────────────────────────────────────┐
│ 应用层 │
│ 游戏引擎 | AI框架 | 科学计算 | 数据分析 │
├─────────────────────────────────────────────────┤
│ 软件栈 │
│ CUDA Runtime | cuDNN | TensorRT | OptiX │
├─────────────────────────────────────────────────┤
│ 驱动层 │
│ NVIDIA Driver | CUDA Driver │
├─────────────────────────────────────────────────┤
│ 硬件架构 │
│ SM阵列 | Tensor Core | RT Core | 内存子系统 │
└─────────────────────────────────────────────────┘
本文档持续更新中,最后修订:2024年