nvidia_history

NVIDIA 技术发展史

从图形加速到人工智能计算的三十年征程

目录结构

第一部分:编年史

第1章:创世纪 (1993-1999)

第2章:可编程时代 (2000-2005)

第3章:统一架构革命 (2006-2009)

第4章:并行计算成熟期 (2010-2015)

第5章:AI 加速时代 (2016-2020)

第6章:大模型纪元 (2021-2024)

第二部分:专题深度分析

第7章:GPU 架构演进

第8章:CUDA 生态系统

第9章:AI 加速技术栈

第10章:图形渲染革新

第11章:数据中心产品线

第12章:软件框架与生态

技术里程碑时间轴

1993 ├── NVIDIA 成立 (黄仁勋等三人,初始资金4万美元)
1995 ├── NV1 (失败但有教育意义,四边形渲染)
1997 ├── RIVA 128 (3D 加速,月销百万片)
1999 ├── GeForce 256 (GPU 概念诞生,硬件T&L)
2001 ├── GeForce 3 (可编程着色器,nfiniteFX引擎)
2006 ├── CUDA 发布 (通用计算革命,C语言扩展)
2008 ├── Tesla 架构 (统一着色器,GT200)
2010 ├── Fermi (计算专用设计,ECC内存)
2012 ├── Kepler (能效突破,动态并行)
2014 ├── Maxwell (架构优化,2倍能效比)
2016 ├── Pascal (深度学习加速,NVLink)
2017 ├── Volta (Tensor Core,640个张量核心)
2018 ├── Turing (RT Core + 光追,DLSS)
2020 ├── Ampere (第三代 Tensor Core,稀疏计算)
2022 ├── Hopper (Transformer Engine,DPX指令)
2024 ├── Blackwell (第五代 Tensor Core,FP4精度)

核心技术对比

架构代号 年份 制程 晶体管数 CUDA核心 关键创新
Tesla 2006 90nm 6.8亿 128 统一着色器
Fermi 2010 40nm 30亿 512 双精度计算
Kepler 2012 28nm 71亿 2880 动态并行
Maxwell 2014 28nm 52亿 2048 能效优化
Pascal 2016 16nm 150亿 3840 HBM2内存
Volta 2017 12nm 211亿 5120 Tensor Core
Turing 2018 12nm 186亿 4608 RT Core
Ampere 2020 7nm 542亿 10752 稀疏计算
Hopper 2022 4nm 800亿 16896 Transformer引擎
Blackwell 2024 4nm 2080亿 20480 第二代Transformer引擎

竞争格局演变

图形时代对手 (1995-2006)

计算时代竞争 (2006-2020)

AI时代新势力 (2020-2024)

商业模式演进

游戏显卡时代 (1999-2010)
├── GeForce 产品线
├── Quadro 专业卡
└── 授权费收入

数据中心转型 (2010-2020)
├── Tesla 计算卡
├── DGX 系统销售
├── CUDA 生态锁定
└── 云服务商合作

AI平台垄断 (2020-至今)
├── H100/H200 供不应求
├── 软件订阅服务
├── Omniverse 云平台
├── DGX Cloud 服务
└── 主权AI方案

阅读指南

技术架构简图

┌─────────────────────────────────────────────────┐
│                  应用层                          │
│  游戏引擎 | AI框架 | 科学计算 | 数据分析          │
├─────────────────────────────────────────────────┤
│                 软件栈                           │
│  CUDA Runtime | cuDNN | TensorRT | OptiX        │
├─────────────────────────────────────────────────┤
│                 驱动层                           │
│          NVIDIA Driver | CUDA Driver            │
├─────────────────────────────────────────────────┤
│                硬件架构                          │
│   SM阵列 | Tensor Core | RT Core | 内存子系统    │
└─────────────────────────────────────────────────┘

本文档持续更新中,最后修订:2024年