亚马逊借助NVIDIA T4 GPU将AI性能带到云端

AWS EC2 G4实例采用高效的Turing架构处理器，可部署加速超大规模AI推理、云游戏和最新RTX图形应用。

随着NVIDIA T4 Tensor Core GPU已陆续在北美、欧洲和亚洲地区AWS上线，云端用户现可享用多重功能，包括自动化与人性化兼得的客户服务、在任何互联设备端均能体验到的专业工作站性能以及电影级画质的PC游戏。

NVIDIA T4 GPU由一系列软件堆栈提供支持，为G4实例用户带来其所需性能及多种功能，并提升了效率。

NVIDIA的软件平台针对多种应用进行了优化，包括用于深度学习的NVIDIA cuDNN、用于数据分析及机器学习的NVIDIA RAPIDS 、用于云工作站图形的NVIDIA Quadro虚拟工作站、以及用于云游戏的NVIDIA GeForce。软件堆栈还包含了多种API、CUDA以及适用于特定领域的CUDA-X库，例如TensorRT、NCCL、OptiX和视频编解码SDK。

只需一个实例，AWS用户就能够无缝、高效地加速各类创作型工作负载。

AWS计算服务副总裁Matt Garman表示：“在利用计算密集型应用时，客户会面对各类棘手的挑战，而我们专注于解决这些挑战。AWS提供最全面的产品组合，帮助客户构建、训练并部署机器学习模型。Amazon EC2提供多种经过优化、适用于不同机器学习案例的实例类型以供用户选择。对于开发者而言，部署了T4 GPU的全新G4实例的出现，不仅让机器学习变得触手可及，也让其变得更加经济实惠。”

以更低成本实现更多AI功能

NVIDIA T4是第二代Tensor Core GPU，可谓GPU的华丽升级，它让AI应用能够实现最高性能，同时还能保持CUDA的可编程性。

图像分类、对象检测、自然语言理解、自动语音识别和推荐系统等AI应用的创新性、多样性和复杂性不断提升。NVIDIA T4凭借高达130TOPS的INT8性能，提供加速这些应用所需的混合精度张量处理功能。

亚马逊是业界率先针对训练和推理为NVIDIA GPU提供即用NVIDIA NGC容器支持的超大规模供应商之一。EC2 P3实例采用NVIDIA V100 Tensor Core GPU，让客户能够使用自动混合精度功能，将机器学习训练耗时从数天减少至数小时。借助EC2 G4，客户能够大规模部署AI服务，同时大幅降低运营成本。

根据NVIDIA在VMWorld期间发布的消息，VMware Cloud on AWS用户将会很快获得全新的高度可扩展的、安全的全新云服务（其中包括Amazon EC2裸机实例），该服务可通过NVIDIA T4 GPU和全新NVIDIA虚拟计算服务器（vComputeServer）软件进行加速。

使用这一企业级混合云平台，企业能够加速应用的现代化进程。从数据中心到AWS云，他们都能够基于一致的VMware基础架构来实现部署、迁移和运营的统一，以支持计算密集型工作负载，包括AI、机器学习和数据分析。

随时随地实现实时光线追踪和AI增强型图形

实时光线追踪是计算机图形学领域梦寐以求的技术，可实现栩栩如生的场景。借助逼真的实时渲染、AI增强型图形以及视频和图像处理，设计师和艺术家将使用全新方式开展内容创建。

NVIDIA T4是首款可用于云端的NVIDIA RTX光线追踪GPU。T4 GPU采用RT Core，这一专用型计算资源将告别过去昂贵的光线追踪方法，以非凡的效率实施光线追踪操作。

全新G4实例与NVIDIA Quadro 虚拟工作站（Quadro vWS）Amazon Machine Images相结合，支持最新光线追踪API，包括Microsoft DXR、NVIDIA Optix和Vulkan。传媒娱乐、建筑、制造、以及石油和天然气等行业的技术和创意专业人士可以在AWS云端运行最新图形软件应用。

有了AWS，只需不到5分钟就能部署虚拟工作站，简单快捷。用户可访问AWS Marketplace并选择NVIDIA Quadro vWS机器映像和G4实例，后者在Windows Server 2016和Windows Server 2019上可用。

GPU赋力的云游戏

T4采用的Turing架构也将NVIDIA在游戏领域的实力带到了AWS。该GPU的硬件编码器引擎可通过视频编解码SDK进行编程，使得要求最为严苛的游戏也能使用其进行渲染和流式传输。

游戏发行商可基于最新NVIDIA技术来构建自己的云游戏实例，而且几乎可以在任何设备端向玩家提供完整的PC游戏目录。

玩家可在高分辨率下以快速、流畅的帧速率尽享所有最新游戏的乐趣，而无需担心硬件升级或驱动程序、游戏补丁的更新。

支持此功能的NVIDIA驱动程序可通过AWS Marketplace获取，并可在Windows Server 2016、Windows Server 2019和Linux OS操作系统中的AWS G4实例上运行。

即刻开始AWS EC2 G4之旅

首批采用Amazon EC2 G4实例的客户包括Clarifai、Electronic Arts、GumGum和PurWeb，他们利用NVIDIA T4的全能算力和性能，能够大规模运行各类计算密集型工作负载。这几家公司都能够为客户提供强大的服务，同时降低客户的服务构建和部署成本。

未来几周内，G4实例还将支持Amazon Elastic Inference，用户可在Amazon EC2或Amazon SageMaker实例中添加GPU加速，以更低的成本实现更快速的推理，最高可节省75%的成本。

来源：业界供稿

0赞

好文章，需要你的鼓励

亚马逊借助NVIDIA T4 GPU将AI性能带到云端

以更低成本实现更多AI功能

随时随地实现实时光线追踪和AI增强型图形

GPU赋力的云游戏

即刻开始AWS EC2 G4之旅

来源：业界供稿

2019

09/23

15:04

分享

点赞

英伟达发布全新小型开源模型Nemotron-Nano-9B-v2，支持推理开关控制

谷歌翻译将集成AI功能并增加游戏化学习模式

边缘AI基础设施的现实挑战与解决方案

Hugging Face：企业在不牺牲性能下降低AI成本的5种方法

阿里推出Ovis2.5：多模态大语言模型的又一重要突破

对话谷歌副总裁Karen Teo：“短剧”“AI应用”现象级出海，我们看到中国开发者的三种内核

谷歌Gemini大模型登陆甲骨文云平台

Linux的微内核替代方案？Debian/Hurd证明微内核Unix梦想仍在继续

你的每一个问题、每一条评论，我都在记录

2035年最热门的十大颠覆性产业

AI"教父"提出让AI具备母性本能引发争议

生成式AI助力MIT科学家对抗超级细菌

NVIDIA Blackwell 现已在云端全面可用

为“代理式AI”装上“护栏” NVIDIA打造“三重防线”

黄仁勋现身北京致辞：60年后，计算机正被重新定义

CES 2025 | NVIDIA Isaac GR00T Blueprint 让人形机器人“加速进化”

未来，就在我们手中

CES 2025 | 代理式AI崛起：NVIDIA定义下一代“代理式 AI Blueprint”

深度学习最佳 GPU，知多少？

NVIDIA推出用于多语言生成式人工智能的NeMo Retriever微服务

NVIDIA 初创加速计划 | 2024 NVIDIA 创业企业展示完美收官!

老黄掏出“迷你版AI超算”，每秒67万亿次运算，仅售2070元人民币

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: