谷歌第四代TPU详细信息曝光 AI负载运行速度大幅提升

谷歌今天分享了有关最新一代TPU芯片的早期细节。该芯片用于运行人工智能工作负载，性能是上一代的2倍多。

谷歌的TPU（Tensor Processor Unit）是一种基于AI的、应用特定的集成电路。今天谷歌详细介绍的是第四代TPU的情况，第三代和第二代此前展示出了令人印象深刻的性能水平，谷歌通过 Google Cloud Platform向企业提供这两代芯片。

谷歌称，第四代TPU的平均性能比第三代TPU高出2.7倍。谷歌在最近MLPerf行业竞赛中对比了这两代芯片训练五个主流AI模型的速度。第四代TPU在运行Mask R-CNN模型（用于自动驾驶等用例的图像分割AI）时达到了最高性能，训练速度比上一代芯片快3.7倍。

性能上的大幅提升主要源自于底层的巨大改进。谷歌工程师Naveen Kumar在博客文章中详细介绍称，谷歌已经大幅提高了TPU的内存带宽，也就是芯片从内存中获取数据并进行处理的速度，提高了执行专有计算的性能。

Kumar在帖子中详细介绍说：“谷歌第四代TPU ASIC在运行矩阵乘法（AI模型用来处理数据的一种数学运算方式）的TFLOP性能是TPU v3的2倍多。”与第四代芯片相比，第三代TPU的浮点运算性能为420万亿次。

Kumar称，客户可以很快将会获得有关新一代TPU的更多信息。考虑到目前Google Cloud平台上已经有两个上一代TPU可供租用，所以新一代应用很有可能最终也将落地在Google Cloud在会上。但是，客户可能需要一段时间了，根据ExtremeTech报告称，第四代TPU在MLPerf竞赛期间被列为研究类，也就是说，这款芯片至少在六个月内是无法商用的。

新一代芯片在速度上的提升尤其引人注目，因为它在性能上超过了第三代，在同一项比赛中打破了多个记录。谷歌利用4090个第三代TPU打造了所谓全球最快的AI训练超级计算机。该系统在8个MLPerf基准测试中创下了6项新的记录，并在不到30秒的时间内训练了4个测试模型。

来源：siliconANGLE

TPU
谷歌

0赞

好文章，需要你的鼓励

谷歌第四代TPU详细信息曝光 AI负载运行速度大幅提升

来源：siliconANGLE

2020

07/30

13:40

分享

点赞

英伟达发布全新小型开源模型Nemotron-Nano-9B-v2，支持推理开关控制

谷歌翻译将集成AI功能并增加游戏化学习模式

边缘AI基础设施的现实挑战与解决方案

Hugging Face：企业在不牺牲性能下降低AI成本的5种方法

阿里推出Ovis2.5：多模态大语言模型的又一重要突破

对话谷歌副总裁Karen Teo：“短剧”“AI应用”现象级出海，我们看到中国开发者的三种内核

谷歌Gemini大模型登陆甲骨文云平台

Linux的微内核替代方案？Debian/Hurd证明微内核Unix梦想仍在继续

你的每一个问题、每一条评论，我都在记录

2035年最热门的十大颠覆性产业

AI"教父"提出让AI具备母性本能引发争议

生成式AI助力MIT科学家对抗超级细菌

专访DeepMind CEO：我们距离实现AGI只需5-10年

谷歌被罚款35位数！

十年一剑，TPU引领AI芯片时代

Google Cloud发布下一代TPU和GPU集群 增强AI Hypercomputer堆栈

AI芯片算力基础及关键参数

Gemini Live：足以秒杀Siri，却仍有明显瑕疵

谷歌CEO谈云业务、Gemini AI开发者以及与Oracle合作关系

Android 15进入Beta阶段！一文看懂有什么新功能

万字记录谷歌I/O全球专访：劈柴说“我有一个十年的路线图”

OpenAI和Google接连两天的大动作，都想让AI助手成“精”

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

Google Cloud发布下一代TPU和GPU集群增强AI Hypercomputer堆栈