谷歌发布Cloud TPU Pod以实现按需的AI超级计算机

谷歌今天宣布对其云平台进行扩展,发布了一个新的基础设施选项Cloud TPU Pod,旨在满足那些需要大量计算能力的大型人工智能项目。

谷歌今天宣布对其云平台进行扩展,发布了一个新的基础设施选项Cloud TPU Pod,旨在满足那些需要大量计算能力的大型人工智能项目。

谷歌发布Cloud TPU Pod以实现按需的AI超级计算机

Cloud TPU Pod本质上是一组运行在谷歌数据中心中的服务器机架,每个机架都配备了谷歌的Tensor处理器单元(TPU)——完全为AI应用开发的定制芯片。谷歌已经在内部一系列服务中采用了这种芯片,包括谷歌的搜索引擎和谷歌翻译等。

此前TPU在Google Cloud上仅供单独租赁使用。与企业通常在AI项目中使用的GPU相比,TPU具有速度更快等诸多优势。去年12月公布的一项基准测试结果显示,在执行某些类型的任务时,TPU的性能比Nvidia同类硬件高出19%。

单个Cloud TPU Pod中包含256个或者1024个芯片,具体取决于配置。256个芯片的版本采用了谷歌在2017年推出的第二代TPU,峰值速度为11.5 petaflops。1024个芯片的版本采用了谷歌新推出的第三代TPU,峰值速度可达到107.5 petaflops。

这些性能数据表明该产品主要针对高性能计算机领域。目前全球最强大的超级计算机Summit峰值速度为200 petaflops。

事实上,Cloud TPU Pod在处理复杂性低于Summit等系统的数据时才能达到峰值性能,但总的来说它仍然是很强大的。谷歌通过API向用户提供Cloud TPU Pod,这样AI团队就可以像使用一个逻辑单元那样使用Cloud TPU Pod了,或者开发人员可以把一个Cloud TPU Pod的计算能力分散到多个应用中。

谷歌Cloud TPU高级产品经理Zak Stone在一篇博客文章中这样写道:“用户还可以使用更小‘切片’的Cloud TPU Pod。我们经常会看到ML团队在单独的Cloud TPU上开发他们最初的初始模型,然后通过数据并行和模型并行扩展到越来越大的Cloud TPU Pod切片。”

Cloud TPU Pod目前还处于测试阶段,早期客户包括eBay和总部位于犹他州的生物科技公司Recursion Pharmaceutical——该公司使用Cloud TPU Pod在对具有潜在医疗价值的分子进行测试。

来源:至顶网服务器频道

0赞

好文章,需要你的鼓励

2019

05/10

08:29

分享

点赞

邮件订阅