今年3月份的分析师大会上,AMD宣布GPU架构分家,游戏GPU会继续使用RDNA架构,而计算卡则会使用CDNA架构,专门针对深度学习、高性能计算优化,架构跟RDNA会有很多不同。

之前大家关注的多是RDNA2架构,也就是年底前big Navi家族的高端显卡,其性能比RDNA提升50%,使用7nm+工艺,而第一代CDNA架构细节不详,所知的主要是跟二代IF总线搭配,性能及规格欠奉。

比安培GPU强70% AMD计算卡CDNA曝光:2GHz+频率、32GB HBM2-冯金伟博客园

不出意外的话,CDNA架构会应用下一代的Radeon Instinct MI100加速卡上,日前AdoredTV获得了MI100加速卡的最新爆料,披露了一些性能数据,可以从中一窥CDNA架构的情况。

比安培GPU强70% AMD计算卡CDNA曝光:2GHz+频率、32GB HBM2-冯金伟博客园

比安培GPU强70% AMD计算卡CDNA曝光:2GHz+频率、32GB HBM2-冯金伟博客园

上面两张图的信息还是比较靠谱的,4路MI100加速卡提供了136TFLOPS的性能,128GB HBM内存及4.9TB/s的带宽,后者比较好算,意味着MI100单卡使用的是32GB HBM2显存,带宽1.2TB/s,算下来就是单颗8GB、等效2.4Gbps频率的HBM2显存了。

至于性能,4路136T、8路272T算下来相当于单卡34TFLOPS性能,这个性能要比NVIDIA最新的7nm安培A100的19.5T性能要高得多,增加了70%以上,虽然夸张倒也不意外,不过AMD的显卡架构在FP32纸面性能上一向比N卡高,现在的MI60加速卡的FP32性能都有14.75T。

根据这个性能来算的话,CDNA架构应该是至少8192个流处理器单元,是MI60的两倍,同时频率还要超过2GHz,达到2.1GHz以上。

2.1GHz的频率也创造高性能GPU的频率记录了,不过索尼的PS5的GPU频率可以加速到2.23GHz,所以CDNA使用7nm+工艺应该也不难做到,毕竟TDP空间更充足。

总的来说,CDNA架构是面向高性能计算的专用架构,8192个流处理器单元、2GHz+频率、32GB HBM2显存的规格很好很强大,34T的浮点性能也可以说是傲视群雄了,整体的规模很恐怖。

比安培GPU强70% AMD计算卡CDNA曝光:2GHz+频率、32GB HBM2-冯金伟博客园