4000 多个芯片串联而成，谷歌称其超级计算机比英伟达的更快、更节能

IT之家 4 月 5 日消息，Alphabet Inc.旗下谷歌公司周二公布了其用于训练人工智能模型的超级计算机的新细节，称这些系统比英伟达的同类系统更快更省电。
谷歌自主设计了一种名为张量处理单元（Tensor Processing Unit，简称 TPU）的芯片，用于训练人工智能模型，该公司 90% 以上的人工智能训练工作都使用这些芯片，这些模型可以用于诸如用人类语言回答问题或生成图像等任务。

据IT之家了解，谷歌的 TPU 现在已经是第四代了。谷歌周二发表了一篇科学论文，详细介绍了他们如何使用自己定制开发的光学开关将 4000 多个芯片串联成一台超级计算机。

改善这些连接已经成为建造人工智能超级计算机的公司之间竞争的关键点，因为为谷歌的 Bard 或 OpenAI 的 ChatGPT 等技术提供动力的所谓大型语言模型的规模已经爆炸性增长，这意味着它们太大，无法存储在单个芯片上。

这些模型必须被分割到数以千计的芯片中，然后这些芯片必须协同工作数周或更长时间来训练模型。谷歌的 PaLM 模型 —— 迄今为止其公开披露的最大的语言模型 —— 是通过将其分散到 4,000 个芯片的两台超级计算机上，历时 50 天进行训练的。

谷歌表示，其超级计算机可以轻松地实时重新配置芯片之间的连接，有助于避免问题并提高性能。

谷歌研究员 Norm Jouppi 和谷歌杰出工程师 David Patterson 在一篇关于该系统的博文中写道：“电路切换使我们很容易绕过故障部件。这种灵活性甚至允许我们改变超级计算机互连的拓扑结构，以加速 ML（机器学习）模型的性能。”

虽然谷歌现在才公布其超级计算机的细节，但它已经于 2020 年在内部上线，在美国俄克拉荷马州梅斯县（Mayes County）的一个数据中心运行。谷歌表示，初创公司 Midjourney 使用了该系统来训练其模型，该模型可以在输入文字后生成图像。

谷歌在论文中说，对于同等规模的系统，其超级计算机比基于 Nvidia A100 芯片的系统快 1.7 倍，节能 1.9 倍。谷歌表示，之所以没有将其第四代产品与 Nvidia 目前的旗舰产品 H100 芯片进行比较，因为 H100 是在谷歌的芯片之后上市的，而且是用更新的技术制造的。谷歌暗示他们可能正在开发一种新的 TPU，与 Nvidia H100 竞争。

4000 多个芯片串联而成，谷歌称其超级计算机比英伟达的更快、更节能

10 年前推出的谷歌 Now Launcher 即将退出历史舞台，4 月底停止运行

年内第二次！国内机票燃油附加费今起下调：最低仅30元

最新文章

现代汽车首次任命外籍CEO 现任CEO兼总裁将升任集团副会长

自动麻将桌的特点自动麻将桌基本介绍

琼脂是什么（琼脂哪里有卖的）

聚氯乙烯加工的主要用途是什么

阿里斯顿燃气壁挂炉好不好？阿里斯顿壁挂炉产品系列推荐

如何选购925银吊坠

中华人才网招聘（找工作哪个网站最真实）

公开选拔（公开选拔不拘一格降人才）

Fmea软件(具体怎么做fmea)

北京八中少儿班(北京八中少儿班2021)

标签

热评文章

GeoGebra 技术专题简介

安瓦尔·埃尔加齐技术专题简介

克里斯蒂安·埃里克森技术专题简介

埃里克·滕哈赫技术专题简介

WCF Data Services 技术专题简介

4000 多个芯片串联而成，谷歌称其超级计算机比英伟达的更快、更节能

10 年前推出的谷歌 Now Launcher 即将退出历史舞台，4 月底停止运行

年内第二次！国内机票燃油附加费今起下调：最低仅30元

最新文章

现代汽车首次任命外籍CEO 现任CEO兼总裁将升任集团副会长

标签

热评文章

GeoGebra 技术专题简介

安瓦尔·埃尔加齐 技术专题简介

克里斯蒂安·埃里克森 技术专题简介

埃里克·滕哈赫 技术专题简介

WCF Data Services 技术专题简介

关注我们的公众号

安瓦尔·埃尔加齐技术专题简介

克里斯蒂安·埃里克森技术专题简介

埃里克·滕哈赫技术专题简介