近日起,Google Cloud 面向全球各地推出NVIDIA T4 GPU,为包括高性能计算(HPC)、机器学习训练及推理、数据分析和图形处理等在内的各类云工作负载提供加速。今年1月,Google Cloud宣布推出了NVIDIA T4 GPU公测版,帮助客户以更快的速度和更低的成本运行推理工作负载。今年四月早些时候,在Google Next '19上,Google Cloud宣布在八个地区率先推出NVIDIA T4,使Google Cloud成为全球第一家基于NVIDIA T4提供服务的主要供应商。
每个T4 GPU都拥有16 GB的GPU内存,提供多精度(或数据类型)支持(FP32,FP16,INT8和INT4),具有可为训练提供加速的NVIDIA Tensor核心,以及可用于更快速的光线追踪的RTX硬件加速平台。用户可以使用四个T4 GPU、96个vCPU、624 GB主机内存和高达3 TB的服务器本地SSD,来搭建最能满足其需求的自定义VM配置。
自发布之时,在抢占式VM实例上,T4实例的售价仅为每GPU每小时0.29美元。按需实例的售价为每GPU每小时0.95美元起,而且持续使用还可享受高达30%的折扣。
凭借NVIDIA Turing架构,T4 GPU引入了第二代Tensor核心。Tensor 核心首次亮相于NVIDIA V100 GPU之上(Google Cloud平台(GCP)也提供基于NVIDIA V100 GPU的服务),支持混合精度,可以为在机器学习工作负载中普遍采用的矩阵乘法运算提供加速。如果您的训练工作量还未达到需要使用功能更加强大的V100的程度,那么T4将能够以更低的价格为您提供Tensor 核心的加速优势。T4非常适合应用于大规模训练工作负载中,特别是当您扩展更多资源来加快训练或训练更大的模型的时候。
Tensor核心也可以为推理提供加速,或运用机器学习模型加速生成预测,以实现低延迟或高吞吐量。当以混合精度启用Tensor核心时,与仅以FP32运行相比,借助于TensorRT, GCP上的T4 GPU可以将ResNet-50的推理速度提高10倍以上。受益于全球供货和谷歌的高速网络,GCP上的NVIDIA T4能够以高性价比,为那些需要高效运作的全球性服务供应商提供服务。例如,Snap就在使用NVIDIA T4为其全球用户群创建更有效的算法的同时,保持了低成本。
借助于Google Cloud上的深度学习VM镜像(Deep Learning VM images),可以在NVIDIA T4 GPU上快速启动和运行机器学习模型的训练和服务推理工作负载。这些应用包括了您需要的所有软件:驱动程序,CUDA-X AI库,以及主流AI框架,如TensorFlow和PyTorch。此外,Google Cloud会为您进行软件更新,使您不必再为了兼容性和性能优化的问题额外费心。您只需创建一个新的Compute Engine实例,选择您的镜像,单击Start,几分钟后,您就可以访问和启用您的由T4赋能的实例。您也可以在Google Cloud的AI平台上启动您的实例,这是一个端到端的开发环境,可帮助机器学习开发人员和数据科学家在任何地方构建、共享和运行机器学习应用程序。一旦准备就绪,只需几行代码,您就可以借助于Tensor核心的自动混合精度实现加速。
NVIDIA T4 GPU还能为HPC批量计算和渲染工作负载带来卓越的性能和效率,将大规模部署的效用价值最大化。
T4 GPU也是运行虚拟工作站的绝佳选择,能够为工程师和专业创意人员提供支持。借助于GCP Marketplace中的NVIDIA Quadro虚拟工作站,用户可以运行基于NVIDIA RTX平台的应用程序,能在任何地方体验新一代计算机图形技术,包括实时光线追踪和AI增强型图形,以及视频和图像处理。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。