nvidia_history

├── NVIDIA 成立 (黄仁勋等三人，初始资金4万美元)
├── NV1 (失败但有教育意义，四边形渲染)
├── RIVA 128 (3D 加速，月销百万片)
├── GeForce 256 (GPU 概念诞生，硬件T&L)
├── GeForce 3 (可编程着色器，nfiniteFX引擎)
├── CUDA 发布 (通用计算革命，C语言扩展)
├── Tesla 架构 (统一着色器，GT200)
├── Fermi (计算专用设计，ECC内存)
├── Kepler (能效突破，动态并行)
├── Maxwell (架构优化，2倍能效比)
├── Pascal (深度学习加速，NVLink)
├── Volta (Tensor Core，640个张量核心)
├── Turing (RT Core + 光追，DLSS)
├── Ampere (第三代 Tensor Core，稀疏计算)
├── Hopper (Transformer Engine，DPX指令)
├── Blackwell (第五代 Tensor Core，FP4精度)

核心技术对比

架构代号	年份	制程	晶体管数	CUDA核心	关键创新
Tesla	2006	90nm	6.8亿	128	统一着色器
Fermi	2010	40nm	30亿	512	双精度计算
Kepler	2012	28nm	71亿	2880	动态并行
Maxwell	2014	28nm	52亿	2048	能效优化
Pascal	2016	16nm	150亿	3840	HBM2内存
Volta	2017	12nm	211亿	5120	Tensor Core
Turing	2018	12nm	186亿	4608	RT Core
Ampere	2020	7nm	542亿	10752	稀疏计算
Hopper	2022	4nm	800亿	16896	Transformer引擎
Blackwell	2024	4nm	2080亿	20480	第二代Transformer引擎

竞争格局演变

图形时代对手 (1995-2006)

3dfx (1995-2000)：Voodoo系列霸主，被NVIDIA收购
ATI (1985-2006)：Radeon系列，2006年被AMD收购
S3 Graphics：Savage系列，逐渐边缘化
Matrox：专业图形市场，退守小众领域

计算时代竞争 (2006-2020)

AMD (2006-至今)：收购ATI后的主要对手，RDNA架构
Intel (2010-至今)：Xeon Phi失败，Arc独显重新入局
Google TPU (2015-至今)：专用AI芯片，云端竞争
华为昇腾 (2018-至今)：中国市场本土化方案

AI时代新势力 (2020-2024)

AMD MI300X (2023)：HBM3内存，挑战H100
Intel Gaudi3 (2024)：Habana Labs技术，企业市场
Google TPU v5 (2023)：专注训练优化
Amazon Trainium (2022)：云原生AI训练
特斯拉Dojo (2023)：自动驾驶专用

商业模式演进

游戏显卡时代 (1999-2010)
├── GeForce 产品线
├── Quadro 专业卡
└── 授权费收入

数据中心转型 (2010-2020)
├── Tesla 计算卡
├── DGX 系统销售
├── CUDA 生态锁定
└── 云服务商合作

AI平台垄断 (2020-至今)
├── H100/H200 供不应求
├── 软件订阅服务
├── Omniverse 云平台
├── DGX Cloud 服务
└── 主权AI方案

阅读指南

硬件工程师：重点阅读第7章（架构演进）和第11章（数据中心产品）
软件开发者：关注第8章（CUDA）和第12章（软件框架）
AI研究者：聚焦第9章（AI加速）和第5-6章（近期发展）
图形开发者：参考第10章（图形渲染）和早期章节
商业分析师：关注关键事件与商业模式演进部分

技术架构简图

┌─────────────────────────────────────────────────┐
│                  应用层                          │
│  游戏引擎 | AI框架 | 科学计算 | 数据分析          │
├─────────────────────────────────────────────────┤
│                 软件栈                           │
│  CUDA Runtime | cuDNN | TensorRT | OptiX        │
├─────────────────────────────────────────────────┤
│                 驱动层                           │
│          NVIDIA Driver | CUDA Driver            │
├─────────────────────────────────────────────────┤
│                硬件架构                          │
│   SM阵列 | Tensor Core | RT Core | 内存子系统    │
└─────────────────────────────────────────────────┘

本文档持续更新中，最后修订：2024年