日前,,基于6nm工艺、CNDA2架构,内部封装两颗GPU、八颗HBM2e,最多14080个计算核心、880个矩阵核心、128GB显存内存。

AMD 6nm MI250X加速卡被扒开:1个节点1小时5度电-冯金伟博客园

AMD 6nm MI250X加速卡被扒开:1个节点1小时5度电-冯金伟博客园

作为AMD的第一款百亿亿次计算级别产品,MI250系列已经得到了很多客户方案,尤其是联合美国能源部的超算“Frontier”,已经整装待发,峰值性能超过150亿亿次。

AMD 6nm MI250X加速卡被扒开:1个节点1小时5度电-冯金伟博客园

AMD 6nm MI250X加速卡被扒开:1个节点1小时5度电-冯金伟博客园

这就是MI250X加速卡的真容,中间两颗大的芯片自然是MI200计算模块,周边八颗小的就是HBM2e内存,单颗32GB,通过2.5D EFB桥接技术彼此互连。

整卡采用OAM形态,也就是基于开放计算项目(OCP)指定的加速卡模组标准,NVIDIA、Intel也都采纳。

AMD 6nm MI250X加速卡被扒开:1个节点1小时5度电-冯金伟博客园

AMD 6nm MI250X加速卡被扒开:1个节点1小时5度电-冯金伟博客园

AMD 6nm MI250X加速卡被扒开:1个节点1小时5度电-冯金伟博客园

这是1U半高刀片规格的单个节点集成八块MI250X,另有两颗霄龙处理器,代号“Trento”,基于三代霄龙7003 Milan的定制版,主要加强了Infinity Fabric IO部分,便于控制八路加速卡。

而且,这还没算上12通道内存、硬盘、网络等等。

AMD 6nm MI250X加速卡被扒开:1个节点1小时5度电-冯金伟博客园

美国的三大百亿亿次超级计算机中,除了AMD Frontier,,采用超过1.8万颗下一代可扩展至强Sapphire Rapids、超过5.4万块全新加速卡Ponte Vecchio,每个节点双路CPU加六路GPU,号称性能超过200亿亿次,但进度最慢。

AMD 6nm MI250X加速卡被扒开:1个节点1小时5度电-冯金伟博客园

,联合AMD第三代霄龙,打造了“Polaris”,分别有1120颗、2240块,每个节点双路配四块卡,性能相对最低,但因为都是成熟硬件,进度是最快的,今年年内上线,明年还会升级一次。

AMD 6nm MI250X加速卡被扒开:1个节点1小时5度电-冯金伟博客园