AWS EC2 G4实例采用高效的Turing架构处理器,可部署加速超大规模AI推理、云游戏和最新RTX图形应用。
随着NVIDIA T4 Tensor Core GPU已陆续在北美、欧洲和亚洲地区AWS上线,云端用户现可享用多重功能,包括自动化与人性化兼得的客户服务、在任何互联设备端均能体验到的专业工作站性能以及电影级画质的PC游戏。
NVIDIA T4 GPU由一系列软件堆栈提供支持,为G4实例用户带来其所需性能及多种功能,并提升了效率。
NVIDIA的软件平台针对多种应用进行了优化,包括用于深度学习的NVIDIA cuDNN、用于数据分析及机器学习的NVIDIA RAPIDS 、用于云工作站图形的NVIDIA Quadro虚拟工作站、以及用于云游戏的NVIDIA GeForce。软件堆栈还包含了多种API、CUDA以及适用于特定领域的CUDA-X库,例如TensorRT、NCCL、OptiX和视频编解码SDK。
只需一个实例,AWS用户就能够无缝、高效地加速各类创作型工作负载。
AWS计算服务副总裁Matt Garman表示:“在利用计算密集型应用时,客户会面对各类棘手的挑战,而我们专注于解决这些挑战。AWS提供最全面的产品组合,帮助客户构建、训练并部署机器学习模型。Amazon EC2提供多种经过优化、适用于不同机器学习案例的实例类型以供用户选择。对于开发者而言,部署了T4 GPU的全新G4实例的出现,不仅让机器学习变得触手可及,也让其变得更加经济实惠。”
NVIDIA T4是第二代Tensor Core GPU,可谓GPU的华丽升级,它让AI应用能够实现最高性能,同时还能保持CUDA的可编程性。
图像分类、对象检测、自然语言理解、自动语音识别和推荐系统等AI应用的创新性、多样性和复杂性不断提升。NVIDIA T4凭借高达130TOPS的INT8性能,提供加速这些应用所需的混合精度张量处理功能。
亚马逊是业界率先针对训练和推理为NVIDIA GPU提供即用NVIDIA NGC容器支持的超大规模供应商之一。EC2 P3实例采用NVIDIA V100 Tensor Core GPU,让客户能够使用自动混合精度功能,将机器学习训练耗时从数天减少至数小时。借助EC2 G4,客户能够大规模部署AI服务,同时大幅降低运营成本。
根据NVIDIA在VMWorld期间发布的消息,VMware Cloud on AWS用户将会很快获得全新的高度可扩展的、安全的全新云服务(其中包括Amazon EC2裸机实例),该服务可通过NVIDIA T4 GPU和全新NVIDIA虚拟计算服务器(vComputeServer)软件进行加速。
使用这一企业级混合云平台,企业能够加速应用的现代化进程。从数据中心到AWS云,他们都能够基于一致的VMware基础架构来实现部署、迁移和运营的统一,以支持计算密集型工作负载,包括AI、机器学习和数据分析。
实时光线追踪是计算机图形学领域梦寐以求的技术,可实现栩栩如生的场景。借助逼真的实时渲染、AI增强型图形以及视频和图像处理,设计师和艺术家将使用全新方式开展内容创建。
NVIDIA T4是首款可用于云端的NVIDIA RTX光线追踪GPU。T4 GPU采用RT Core,这一专用型计算资源将告别过去昂贵的光线追踪方法,以非凡的效率实施光线追踪操作。
全新G4实例与NVIDIA Quadro 虚拟工作站(Quadro vWS)Amazon Machine Images相结合,支持最新光线追踪API,包括Microsoft DXR、NVIDIA Optix和Vulkan。传媒娱乐、建筑、制造、以及石油和天然气等行业的技术和创意专业人士可以在AWS云端运行最新图形软件应用。
有了AWS,只需不到5分钟就能部署虚拟工作站,简单快捷。用户可访问AWS Marketplace并选择NVIDIA Quadro vWS机器映像和G4实例,后者在Windows Server 2016和Windows Server 2019上可用。
T4采用的Turing架构也将NVIDIA在游戏领域的实力带到了AWS。该GPU的硬件编码器引擎可通过视频编解码SDK进行编程,使得要求最为严苛的游戏也能使用其进行渲染和流式传输。
游戏发行商可基于最新NVIDIA技术来构建自己的云游戏实例,而且几乎可以在任何设备端向玩家提供完整的PC游戏目录。
玩家可在高分辨率下以快速、流畅的帧速率尽享所有最新游戏的乐趣,而无需担心硬件升级或驱动程序、游戏补丁的更新。
支持此功能的NVIDIA驱动程序可通过AWS Marketplace获取,并可在Windows Server 2016、Windows Server 2019和Linux OS操作系统中的AWS G4实例上运行。
首批采用Amazon EC2 G4实例的客户包括Clarifai、Electronic Arts、GumGum和PurWeb,他们利用NVIDIA T4的全能算力和性能,能够大规模运行各类计算密集型工作负载。这几家公司都能够为客户提供强大的服务,同时降低客户的服务构建和部署成本。
未来几周内,G4实例还将支持Amazon Elastic Inference,用户可在Amazon EC2或Amazon SageMaker实例中添加GPU加速,以更低的成本实现更快速的推理,最高可节省75%的成本。
好文章,需要你的鼓励
尽管AI实验广泛开展,但大多数AI项目缺乏成熟度无法规模化。93%的组织在使用或构建AI系统,但仅不到10%建立了强健的治理框架。研究显示,超过50%的AI实验从未投产,仅1%的项目实现真正变革性成果。缺乏数据和AI主权是关键障碍,而拥有主权的组织AI项目成功率提升2倍,回报率增长5倍。
香港中文大学等顶尖院校联合研究发现,当前最先进的AI视频生成技术已能制作出连顶级检测系统都无法识别的假视频。研究团队开发了Video Reality Test平台,测试结果显示最强生成模型Veo3.1-Fast的假视频仅有12.54%被识别,而最强检测系统Gemini 2.5-Pro准确率仅56%,远低于人类专家的81.25%。研究还发现检测系统过度依赖水印等表面特征,音频信息能提升检测准确性,但技术发展已对信息真实性判断带来严峻挑战。
企业正竞相释放AI的变革潜力,但真正的瓶颈不在技术而在人力准备度。Gartner研究显示,56%的CEO计划在未来五年削减管理层级,但91%的CIO未跟踪AI引发的技能变化。超过80%的领导者根本不衡量AI准确性。AI价值取决于员工适应和与智能机器共同发展的能力。CIO必须应对五个关键人力障碍:AI退出效应、中层管理困境、行为副产品、准确性悖论和影子AI现象,这些深层次的行为反射和组织动态如不解决将阻碍转型。
Google DeepMind团队提出了革命性的"扩散预览"模式,通过ConsistencySolver技术实现AI图像生成的"预览+精修"工作流程。该技术能在5-10步内生成高质量预览图像,与传统40步完整生成保持高度一致性,用户体验测试显示总体时间节省近50%,大大提高了创作效率和创意探索的自由度。