赞助文章 尽管生成式 AI 和 GPU 加速 AI 训练与推理已经席卷全球,但全球数据中心仍然需要认真考虑 CPU 的问题。
首先,在大多数公司中,有数百到数千个后台工作负载在支撑业务运营,这些负载有时还需要关系型数据库的支持。毫无疑问,维护这些设备至关重要。
同时,对这些设备进行现代化改造也是一种方式,可以帮助支付未来几年在 AI 基础设施方面的巨额投资,无论公司是购买训练好的模型还是自行创建。无论如何,GenAI 都将是一项昂贵的投资,而通过降低通用服务器机群的成本,不仅可以减少这部分传统服务器机群的电力和冷却支出,还能同时提升其性能。
此外,配备大量核心、强大 I/O 和内存带宽的现代处理器,也是提高昂贵 AI 服务器机群投资回报的一种方式。根据 AMD 在配备八个 GPU 的服务器节点上进行的基准测试,像 "Turin" AMD Epyc 9575F 这样的高速 CPU 可以将 AI 推理性能提升高达 8%,AI 训练性能提升高达 20%。考虑到 GPU 的高昂成本,这种性能提升带来的收益远远超过了在 AI 主机上购买更快 CPU 所需的增量成本。
最后,在许多情况下,直接在 CPU 上运行 AI 算法是有意义的,因为现今的 CPU 完全有能力执行 AI 推理和轻量级 AI 训练所需的向量运算。因此,即使是在通用服务器机群中,拥有高性能 CPU 也很重要。
我们就这些问题与 AMD 服务器解决方案部门的公司副总裁 Madhu Rangarajan 进行了讨论,他负责产品管理、规划和营销工作。我们还探讨了一个观点:现在比以往任何时候都更需要考虑在数据中心部署单插槽服务器,摆脱传统的双插槽服务器思维。
如需了解更多关于 AMD 更新数据中心服务器机群的战略,请观看上方视频。
好文章,需要你的鼓励
通用汽车与英伟达扩大合作,旨在将人工智能应用于汽车制造的各个方面。这项合作涵盖工厂自动化、机器人技术和自动驾驶汽车开发。英伟达将为通用汽车提供 AI 基础设施和技术支持,助力其打造下一代智能工厂、优化生产流程,并推进自动驾驶技术的发展。这一战略合作反映了汽车行业向智能化、数字化转型的趋势。
企业AI不仅要考虑推理成本和性能,还需确保模型满足严格的安全、隐私和合规要求。建立可信赖的AI系统是关键,这意味着企业除了优化成本和性能外,还需优先考虑模型的完整性和安全性。在选择基础模型时,应采用全面的评估方法,包括安全性、偏见、合规性等多个方面,而不仅仅是关注单一指标。
英伟达推出革命性的共封装光学网络解决方案,大幅提升AI数据中心性能。新技术可将光学收发器数量减少4倍,能效提高3.5倍,信号完整性提升63倍,网络弹性增加10倍,部署时间缩短1.3倍。这一突破性进展将助力数据中心满足代理型AI对计算资源的巨大需求,标志着共封装光学技术实现量产的重要里程碑。
英伟达宣布与迪士尼研究院和谷歌 DeepMind 合作开发 Newton 物理引擎,用于模拟真实环境中的机器人动作。迪士尼将率先使用 Newton 驱动其下一代娱乐机器人,如星球大战风格的 BDX 机器人。英伟达计划于 2025 年晚些时候发布 Newton 的早期开源版本。这项合作将为迪士尼主题公园带来更具表现力和精确性的机器人体验。