谷歌今天宣布对其云平台进行扩展,发布了一个新的基础设施选项Cloud TPU Pod,旨在满足那些需要大量计算能力的大型人工智能项目。
Cloud TPU Pod本质上是一组运行在谷歌数据中心中的服务器机架,每个机架都配备了谷歌的Tensor处理器单元(TPU)——完全为AI应用开发的定制芯片。谷歌已经在内部一系列服务中采用了这种芯片,包括谷歌的搜索引擎和谷歌翻译等。
此前TPU在Google Cloud上仅供单独租赁使用。与企业通常在AI项目中使用的GPU相比,TPU具有速度更快等诸多优势。去年12月公布的一项基准测试结果显示,在执行某些类型的任务时,TPU的性能比Nvidia同类硬件高出19%。
单个Cloud TPU Pod中包含256个或者1024个芯片,具体取决于配置。256个芯片的版本采用了谷歌在2017年推出的第二代TPU,峰值速度为11.5 petaflops。1024个芯片的版本采用了谷歌新推出的第三代TPU,峰值速度可达到107.5 petaflops。
这些性能数据表明该产品主要针对高性能计算机领域。目前全球最强大的超级计算机Summit峰值速度为200 petaflops。
事实上,Cloud TPU Pod在处理复杂性低于Summit等系统的数据时才能达到峰值性能,但总的来说它仍然是很强大的。谷歌通过API向用户提供Cloud TPU Pod,这样AI团队就可以像使用一个逻辑单元那样使用Cloud TPU Pod了,或者开发人员可以把一个Cloud TPU Pod的计算能力分散到多个应用中。
谷歌Cloud TPU高级产品经理Zak Stone在一篇博客文章中这样写道:“用户还可以使用更小‘切片’的Cloud TPU Pod。我们经常会看到ML团队在单独的Cloud TPU上开发他们最初的初始模型,然后通过数据并行和模型并行扩展到越来越大的Cloud TPU Pod切片。”
Cloud TPU Pod目前还处于测试阶段,早期客户包括eBay和总部位于犹他州的生物科技公司Recursion Pharmaceutical——该公司使用Cloud TPU Pod在对具有潜在医疗价值的分子进行测试。
好文章,需要你的鼓励
数据分析平台公司Databricks完成10亿美元K轮融资,公司估值超过1000亿美元,累计融资总额超过200亿美元。公司第二季度收入运营率达到40亿美元,同比增长50%,AI产品收入运营率超过10亿美元。超过650家客户年消费超过100万美元,净收入留存率超过140%。资金将用于扩展Agent Bricks和Lakebase业务及全球扩张。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
医疗信息管理平台Predoc宣布获得3000万美元新融资,用于扩大运营规模并在肿瘤科、研究网络和虚拟医疗提供商中推广应用。该公司成立于2022年,利用人工智能技术提供端到端平台服务,自动化病历检索并整合为可操作的临床洞察。平台可实现病历检索速度提升75%,临床审查时间减少70%,旨在增强而非替代临床判断。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。