Nvidia CUDA Architecture
Fermi Architecture
- Host Interface: GPU,CPU,Memory通信的接口
- Giga Thread Engine:任务管理器,管理所有正在进行的工作
- Fermi架构拥有16个SM,SM属于硬件实体。每一个SM拥有21个CUDA core,每一个CUDA core拥有一个INT和一个FP计算单元;一个SM有16个LOAD/STORE单元,可以提供16线程同时读取/存储数据的能力;4个SFU单元,SFU:Special Function Unit,特殊函数计算单元,包括sin,cos函数。
Kepler Architecture
Kepler架构将SM重命名为SMX,其中大致结构并未改变,最明显的是增加了CUDA Core的数量。一个SMX中有192个CUDA Core。
Maxwell Architecture
SMM变得更多了,架构变化不大。
Pascal Architecture
第一个加入Deep Learning相关硬件设置的架构,即:DP Unit。
Volta Architecture
第一个以Deep Learning为主的GPU架构。原本的CUDA Core变成FP64,INT,FP32,TENSOR Core。