谷歌发布Cloud TPU Pod以实现按需的AI超级计算机

作者：siliconangle

谷歌今天宣布对其云平台进行扩展，发布了一个新的基础设施选项Cloud TPU Pod，旨在满足那些需要大量计算能力的大型人工智能项目。

Cloud TPU Pod本质上是一组运行在谷歌数据中心中的服务器机架，每个机架都配备了谷歌的Tensor处理器单元（TPU）——完全为AI应用开发的定制芯片。谷歌已经在内部一系列服务中采用了这种芯片，包括谷歌的搜索引擎和谷歌翻译等。

此前TPU在Google Cloud上仅供单独租赁使用。与企业通常在AI项目中使用的GPU相比，TPU具有速度更快等诸多优势。去年12月公布的一项基准测试结果显示，在执行某些类型的任务时，TPU的性能比Nvidia同类硬件高出19％。

单个Cloud TPU Pod中包含256个或者1024个芯片，具体取决于配置。256个芯片的版本采用了谷歌在2017年推出的第二代TPU，峰值速度为11.5 petaflops。1024个芯片的版本采用了谷歌新推出的第三代TPU，峰值速度可达到107.5 petaflops。

这些性能数据表明该产品主要针对高性能计算机领域。目前全球最强大的超级计算机Summit峰值速度为200 petaflops。

事实上，Cloud TPU Pod在处理复杂性低于Summit等系统的数据时才能达到峰值性能，但总的来说它仍然是很强大的。谷歌通过API向用户提供Cloud TPU Pod，这样AI团队就可以像使用一个逻辑单元那样使用Cloud TPU Pod了，或者开发人员可以把一个Cloud TPU Pod的计算能力分散到多个应用中。

谷歌Cloud TPU高级产品经理Zak Stone在一篇博客文章中这样写道：“用户还可以使用更小‘切片’的Cloud TPU Pod。我们经常会看到ML团队在单独的Cloud TPU上开发他们最初的初始模型，然后通过数据并行和模型并行扩展到越来越大的Cloud TPU Pod切片。”

Cloud TPU Pod目前还处于测试阶段，早期客户包括eBay和总部位于犹他州的生物科技公司Recursion Pharmaceutical——该公司使用Cloud TPU Pod在对具有潜在医疗价值的分子进行测试。

来源：至顶网服务器频道

TPU
谷歌

0赞

好文章，需要你的鼓励

谷歌发布Cloud TPU Pod以实现按需的AI超级计算机

来源：至顶网服务器频道

2019

05/10

08:29

分享

点赞

Meta发布AI翻译功能，支持脸书和Instagram内容实时转换

HPE发布Nvidia Blackwell驱动的AI服务器，抢占AI市场需求

ISACA推出AI安全管理高级认证项目

谷歌推出智能体SOC系统提升安全事件响应速度

Lumen升级400GB数据中心连接基础设施助力AI发展

AI和流媒体推动，2030年面临"网络危机"

Pine64停产Pro手机转向RISC-V业务

日立Vantara将VSP One块存储扩展至Azure云平台

Finchetto光学数据包交换机：光无法存储的技术挑战与突破

Python开发者调查显示增长强劲，但基金会资金面临困境

多站点IT基础设施升级指南：告别VMware的替代方案

戴尔集成Elasticsearch与英伟达Blackwell GPU升级AI数据平台

专访DeepMind CEO：我们距离实现AGI只需5-10年

谷歌被罚款35位数！

十年一剑，TPU引领AI芯片时代

Google Cloud发布下一代TPU和GPU集群 增强AI Hypercomputer堆栈

AI芯片算力基础及关键参数

Gemini Live：足以秒杀Siri，却仍有明显瑕疵

谷歌CEO谈云业务、Gemini AI开发者以及与Oracle合作关系

Android 15进入Beta阶段！一文看懂有什么新功能

万字记录谷歌I/O全球专访：劈柴说“我有一个十年的路线图”

OpenAI和Google接连两天的大动作，都想让AI助手成“精”

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

Google Cloud发布下一代TPU和GPU集群增强AI Hypercomputer堆栈