Google Cloud近日起全面推出NVIDIA T4 GPU，实现机器学习和其他计算工作负载的高效拓展

近日起，Google Cloud 面向全球各地推出NVIDIA T4 GPU，为包括高性能计算（HPC）、机器学习训练及推理、数据分析和图形处理等在内的各类云工作负载提供加速。

近日起，Google Cloud 面向全球各地推出NVIDIA T4 GPU，为包括高性能计算（HPC）、机器学习训练及推理、数据分析和图形处理等在内的各类云工作负载提供加速。今年1月，Google Cloud宣布推出了NVIDIA T4 GPU公测版，帮助客户以更快的速度和更低的成本运行推理工作负载。今年四月早些时候，在Google Next '19上，Google Cloud宣布在八个地区率先推出NVIDIA T4，使Google Cloud成为全球第一家基于NVIDIA T4提供服务的主要供应商。

注重速度与成本效益

每个T4 GPU都拥有16 GB的GPU内存，提供多精度（或数据类型）支持（FP32，FP16，INT8和INT4），具有可为训练提供加速的NVIDIA Tensor核心，以及可用于更快速的光线追踪的RTX硬件加速平台。用户可以使用四个T4 GPU、96个vCPU、624 GB主机内存和高达3 TB的服务器本地SSD，来搭建最能满足其需求的自定义VM配置。

自发布之时，在抢占式VM实例上，T4实例的售价仅为每GPU每小时0.29美元。按需实例的售价为每GPU每小时0.95美元起，而且持续使用还可享受高达30％的折扣。

可用于训练和推理的Tensor核心

凭借NVIDIA Turing架构，T4 GPU引入了第二代Tensor核心。Tensor 核心首次亮相于NVIDIA V100 GPU之上（Google Cloud平台（GCP）也提供基于NVIDIA V100 GPU的服务），支持混合精度，可以为在机器学习工作负载中普遍采用的矩阵乘法运算提供加速。如果您的训练工作量还未达到需要使用功能更加强大的V100的程度，那么T4将能够以更低的价格为您提供Tensor 核心的加速优势。T4非常适合应用于大规模训练工作负载中，特别是当您扩展更多资源来加快训练或训练更大的模型的时候。

Tensor核心也可以为推理提供加速，或运用机器学习模型加速生成预测，以实现低延迟或高吞吐量。当以混合精度启用Tensor核心时，与仅以FP32运行相比，借助于TensorRT， GCP上的T4 GPU可以将ResNet-50的推理速度提高10倍以上。受益于全球供货和谷歌的高速网络，GCP上的NVIDIA T4能够以高性价比，为那些需要高效运作的全球性服务供应商提供服务。例如，Snap就在使用NVIDIA T4为其全球用户群创建更有效的算法的同时，保持了低成本。

GCP额机器学习基础设施让Google与NVIDIA强强联手

借助于Google Cloud上的深度学习VM镜像（Deep Learning VM images），可以在NVIDIA T4 GPU上快速启动和运行机器学习模型的训练和服务推理工作负载。这些应用包括了您需要的所有软件：驱动程序，CUDA-X AI库，以及主流AI框架，如TensorFlow和PyTorch。此外，Google Cloud会为您进行软件更新，使您不必再为了兼容性和性能优化的问题额外费心。您只需创建一个新的Compute Engine实例，选择您的镜像，单击Start，几分钟后，您就可以访问和启用您的由T4赋能的实例。您也可以在Google Cloud的AI平台上启动您的实例，这是一个端到端的开发环境，可帮助机器学习开发人员和数据科学家在任何地方构建、共享和运行机器学习应用程序。一旦准备就绪，只需几行代码，您就可以借助于Tensor核心的自动混合精度实现加速。

NVIDIA T4 GPU还能为HPC批量计算和渲染工作负载带来卓越的性能和效率，将大规模部署的效用价值最大化。

T4 GPU也是运行虚拟工作站的绝佳选择，能够为工程师和专业创意人员提供支持。借助于GCP Marketplace中的NVIDIA Quadro虚拟工作站，用户可以运行基于NVIDIA RTX平台的应用程序，能在任何地方体验新一代计算机图形技术，包括实时光线追踪和AI增强型图形，以及视频和图像处理。

来源：业界供稿

0赞

好文章，需要你的鼓励

Google Cloud近日起全面推出NVIDIA T4 GPU，实现机器学习和其他计算工作负载的高效拓展

注重速度与成本效益

可用于训练和推理的Tensor核心

GCP额机器学习基础设施让Google与NVIDIA强强联手

来源：业界供稿

2019

05/09

11:23

分享

点赞

英伟达发布全新小型开源模型Nemotron-Nano-9B-v2，支持推理开关控制

谷歌翻译将集成AI功能并增加游戏化学习模式

边缘AI基础设施的现实挑战与解决方案

Hugging Face：企业在不牺牲性能下降低AI成本的5种方法

阿里推出Ovis2.5：多模态大语言模型的又一重要突破

对话谷歌副总裁Karen Teo：“短剧”“AI应用”现象级出海，我们看到中国开发者的三种内核

谷歌Gemini大模型登陆甲骨文云平台

Linux的微内核替代方案？Debian/Hurd证明微内核Unix梦想仍在继续

你的每一个问题、每一条评论，我都在记录

2035年最热门的十大颠覆性产业

AI"教父"提出让AI具备母性本能引发争议

生成式AI助力MIT科学家对抗超级细菌

AI 竞争加剧，GPT-4.5 发布：数据效率成为关键

为帮助 AI 理解世界，研究人员将其装入机器人

从 2.2 亿数据点到营收：AI 如何改变体育娱乐的投资回报

AI 研究显示：部分员工已过度依赖 AI 思考

Hugging Face 计划对 DeepSeek 的 R1 推理模型进行逆向工程

NVIDIA Blackwell 现已在云端全面可用

瑞典委员会提出推动人工智能改革路线图

AI 投资回报率难以说服 IT 决策者

谷歌 AI 为"自愈"路坑铺平道路

别让生成式 AI 在你脑中白住

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: