28 核心 56 线程,英特尔带着新至强处理器来了-冯金伟博客园

  至强处理器是一个传说,曾经不少发烧友消费级用户会在各种渠道淘入门级的至强处理器来 DIY 一台性能强劲价格低廉的电脑。

  不过很明显,英特尔不希望原本属于商用领域的至强处理器流落到消费级用户手里,后来的至强处理器便多存在于服务器之中,在远端计算服务用户。在 2017 年的时候,英特尔将原来 E3、E5、E7 的至强处理器分级改为了铜牌、银牌、金牌和铂金的全新划分。

  在 6 月 19 日的「芯存高远智者更强」英特尔数据创新峰会暨新品发布会。英特尔宣布推出最新的数据平台产品组合,包括集成 AI 加速的英特尔第三代至强可扩展处理器、英特尔首个人工智能优化 FPGA Stratix 10 NX、第二代英特尔傲腾持久内存、最新英特尔 3D NAND SSD 及相关软件解决方案。这些新品的服务对象嘛,就是数据中心、云和智能边缘计算,毕竟现在对于人工智能和数据分析的需求越来越大。

  英特尔援引 IDC 的预测表示,到 2021 年,75% 的商业企业的各类应用将应用人工智能;到 2025 年,所有数据中将有约四分之一是实时产生的,而在这一庞大的增量中有 95% 的数据将通过各种物联网(IoT)设备产生。

28 核心 56 线程,英特尔带着新至强处理器来了-冯金伟博客园

  所以为了应对这种趋势,本次英特尔发布的一系列新品也是主打 AI 和数据分析两点。这些新品分别是:

  • 全新第三代英特尔至强可扩展处理器:英特尔在全新第三代至强可扩展处理器中继续加大其在内置 AI 加速方面的投入,将 bfloat16 支持整合到其独有的深度学习加速技术当中。bfloat16 是一个精简的数据格式,与如今的 32 位浮点数(FP32)相比,bfloat16 只通过一半的比特数且仅需对软件做出很小程度的修改(如必要),就可达到与 FP32 同等水平的模型精度。新增的 bfloat16 支持同时为 CPU 的 AI 训练和推理性能提供加速。英特尔针对领先的深度学习框架(包括 TensorFlow 和 Pytorch)优化过的版本将支持 bfloat16,并通过英特尔 AI 分析工具包即可获得。英特尔同时为 OpenVINO 工具包和 ONNX Runtime 环境提供 bfloat16 优化,以简化推理的部署工作。第三代英特尔至强可扩展处理器(代号 Cooper Lake)是英特尔面向四路、八路处理器市场的产品。这一处理器专为深度学习、虚拟机(VM)密度、内存数据库、任务关键型应用及分析密集型工作负载而设计。与使用寿命已达 5 年的同等级四路平台相比,其有望在常见工作负载上获得预计约 1.9 倍的提升和高达 2.2 倍的虚拟机提升。其中最强的铂金至强 8380HL 处理器为 28 核心 56 线程,主频 2.9GHz,睿频可达 4.3GHz。
  • 全新英特尔傲腾持久内存:作为第三代至强可扩展平台的一部分,英特尔同时发布了英特尔傲腾持久内存 200 系列,为客户提供每路最高达 4.5TB 的容量,以进行内存数据库、密集虚拟化、分析及高耗能计算等数据密集型工作负载的管理。
  • 全新英特尔 3D NAND 固态盘:针对使用全闪阵列存储数据的系统,英特尔发布了新一代高容量英特尔 3D NAND 固态盘:英特尔 SSD D7-P5500 和 P5600。这些 3D NAND 固态盘采用了英特尔 TLC 3D NAND 技术以及全新低延迟 PCIe 控制器。
  • 英特尔首个针对高带宽、低延迟 AI 加速所打造的 AI 优化 FPGA 产品。此类 FPGA 可针对自然语言处理、欺诈识别等具有高计算要求的应用程序为客户提供可定制、可重新配置、可扩展的 AI 加速。英特尔 Stratix 10 NX FPGA 配备集成式高带宽内存(HBM)、高性能网络功能以及最新 AI 优化算法模块 AI Tensor Block,其含有 AI 模型算法常用的低精度乘法器密集阵列。

28 核心 56 线程,英特尔带着新至强处理器来了-冯金伟博客园

  除了硬件之外,英特尔也优化了 OneAPI 跨架构开发工具和解决方案,比如面向基因组分析的增强版英特尔精选解决方案正在全球范围内被应用于新冠疫苗研发。