NVLink
NVLink主要加速CPU和NVIDIA GPU之间的互联速度,需要CPU的支持,例如IBM的Power的某些CPU支持,intel的CPU不支持;
也用于加速NVIDIA GPU和NVIDIA GPU之间的互联速度;
是一种点对点结构的串行通信协议;
版本 | 速度 | Lans Per Link |
单向速度 Per Link |
Link数 | In Speed | Out Speed |
2014年 NVLink 1.0 |
20GT/s | 8+8 In + Out |
8bit*20GT/s=20GB/s | 4 Links | 80GB/s | 80GB/s |
2018年 NVLink 2.0 |
25GT/s | 8+8 In + Out |
8bit*25GT/s=25GB/s | 6 Links | 150GB/s | 150GB/s |
PCIe Gen3 X16的速度是16bit*8GT/s=16GB/s
eg1: GPU与GPU通过NVLink1.0互联
eg2: GPU与GPU通过NVLink1.0互联
NVSwitch
NVSwitch是的1个Server支持16个GPU
8对GPU之间的带宽都是300GB/s,那么合计的带宽就是300GB/s*8=2.4TB/s
一个NVLink是6个Link,8个NVLink就是48Link,单向速度也可以这样计算48Link*25GB/s=1.2TB/s
Switch存在的作用是避免GPU和GPU之间的通信会存在多跳;
参考文献:https://www.nvidia.com/en-us/data-center/nvlink/
万事走心 精益求美