2023 年 8 月 8 日 — NVIDIA 于今日宣布推出搭载全新 NVIDIA® L40S GPU 的 NVIDIA OVX™ 服务器。这款功能强大的通用数据中心处理器将通过 NVIDIA Omniverse™ 平台,加速计算密集型的复杂应用,包括 AI 训练与推理、3D 设计与可视化、视频处理以及工业数字化等。
这款全新 GPU 将加速生成式 AI 的计算工作负载。生成式 AI 为各行各业的工作流和服务都带来了变革,如文本、图像和视频生成、聊天机器人、游戏开发、产品设计以及医疗等。
NVIDIA 专业可视化副总裁 Bob Pette 表示:“生成式 AI 为各行各业都带来了变革,企业也更需要为数据中心寻求大规模计算资源。配备 NVIDIA L40S GPU 的 OVX 系统能够加速 AI、图形和视频处理工作负载,满足不断增加的复杂且多样的应用对性能的严苛要求。”
强大的 AI 和图形性能
NVIDIA OVX 系统的每台服务器最多支持 8 块 NVIDIA L40S GPU,每块 GPU 的显存为 48GB。基于 NVIDIA Ada Lovelace GPU 架构的 L40S 搭载第四代 Tensor Core 和 FP8 Transformer Engine,可提供超过 1.45 PFLOP 的张量处理能力。对于拥有数十亿个参数和多种数据模式(如文本和视频)的复杂 AI 工作负载,与 NVIDIA A100 Tensor Core GPU 相比,L40S 能够将生成式 AI 的推理性能和训练性能分别提高 1.2 倍和 1.7 倍。
为了支持实时渲染、产品设计、3D 内容创建等高保真专业可视化工作流,NVIDIA L40S GPU 搭载 142 颗第三代 RT Core,可提供 212 TFLOP 的光线追踪性能,使专业创作者能够创建沉浸式的视觉体验和逼真的内容。
针对计算要求严苛的工作流,如工程和科学模拟等,NVIDIA L40S 搭载 18,176 颗 CUDA® Core,可提供近 5 倍于 NVIDIA A100 GPU 的单精度浮点计算(FP32)性能,以加快复杂计算和数据密集型分析的速度。
早期采用情况
专注于大规模 GPU 加速工作负载领域的CoreWeave 是首批提供 L40S 实例的云服务提供商之一。
CoreWeave 首席技术官 Brian Venturo 表示:“随着生成式 AI 的爆发式增长,我们各行各业的客户都在寻求性能强大的计算产品和规模上的扩展,以应对从交互式视频到 AI 设计和自动化等各类工作负载的复杂性。NVIDIA L40S GPU 将进一步扩大我们丰富的 NVIDIA 解决方案阵容,使 CoreWeave 成为首家提供这些新资源的专业云服务提供商,为下一批生成式 AI 应用提供快速、高效、经济的加速计算。”
提升 AI 性能的软件
部署 L40S GPU 的企业将受益于 NVIDIA AI Enterprise 软件。该软件今日发布了重大更新,能够为 100 多个框架、预训练模型、工具套件和软件提供生产就绪型企业级支持和安全,其中包括用于模拟的 NVIDIA Modulus、用于数据科学的 NVIDIA RAPIDS™ 和用于生产型 AI 的 NVIDIA Triton™ 推理服务器。
Omniverse的功能日益丰富
NVIDIA 还发布了对 Omniverse 平台的重大更新,新推出的各种功能和平台升级将助力开发者借助生成式AI的强大功能,加速并推进 OpenUSD 工作流程和工业数字化应用。支持Omniverse Cloud 的下一代 NVIDIA OVX 系统将配备 L40S GPU,为大幅加速生成式 AI 流程和 Omniverse 工作负载提供所需的 AI 和图形性能。
供应情况
NVIDIA L40S 将于今年秋季上市。包括华硕、戴尔科技、技嘉、慧与、联想、QCT、超微在内的全球系统构建商近期将提供搭载 NVIDIA L40S GPU 的 OVX 系统。该服务器将帮助全球专业人士推进 AI 的发展。并为各行各业的用户带来智能聊天机器人、搜索和摘要工具等生成式AI应用。
好文章,需要你的鼓励
微软研究院联合北京大学、清华大学提出"强化预训练"新方法,让AI在预测下一个词前先进行深度思考推理。该技术将传统的模式匹配升级为真正的逻辑推理,显著提升了语言模型的预测准确性和推理能力,为人工智能从"背诵"向"理解"的转变开辟了新路径。
上海交通大学与StepFun联合推出的OneIG-Bench是AI图像生成领域首个全维度评测基准,涵盖语义对齐、文字渲染、知识推理、风格化、多语言等六大维度,包含超过2400个测试案例。该研究对19个顶级AI模型进行了史上最全面的对比评测,发现GPT-4o综合表现最佳,Seedream 3.0在文字渲染方面独领风骚,揭示了当前AI模型的优势与不足,为未来技术发展指明了方向。
伊利诺伊大学研究团队开发了SAFFRON安全防护系统,通过创新的"多路分叉奖励模型"技术,让AI在面对恶意诱导攻击时能够实时进行安全筛选。该系统将AI安全防护的攻击成功率从89.7%降至40.9%,同时保持回复的自然性和多样性,为AI安全领域开辟了全新的"推理时计算"防护路径。
上海人工智能实验室等机构联合发布的最新研究,开发出能够像人类专家一样"阅读"化学分子图像的AI系统GTR-Mol-VLM。该系统采用模仿人类思维的"图遍历视觉思维链"方法,在处理含缩写的复杂分子图像时准确率达84.50%,比现有最佳方法高出约14个百分点,为药物研发和材料科学等领域的数字化转型提供了重要技术支撑。