数据中心硬件一直在幕后默默运行,为现代计算的关键系统提供动力。虽然它可能不像 AI 突破或绿色能源计划那样引人注目,但硬件领域正在快速发展,当前的创新正在重塑着数据中心的未来运作方式。
从前沿芯片架构到先进存储解决方案和智能管理技术,硬件发展趋势在推动效率和性能提升方面发挥着关键作用。
让我们来探讨将在 2025 年塑造行业的五个关键数据中心硬件议题。
1. AI 加速器硬件投资
如果您近年来关注 AI 对数据中心的影响,您可能已经知道,许多 AI 工作负载在专用 AI 加速器硬件上运行时表现最佳。
因此,当前最重要的数据中心硬件趋势之一就是对 AI 加速器的投资。
我个人认为,随着 AI 技术日趋成熟,企业不再持续启动 AI 实验或概念验证项目,数据中心对 AI 友好型硬件的需求最终将受到限制。但不可否认的是,到 2025 年,AI 加速器将占据数据中心硬件中越来越大的份额。
2. DPU 部署增长
除了专门为 AI 设计的硬件设备外,2025 年还将见证数据中心其他类型硬件优化的增长投资,例如数据处理单元 (DPU)。
DPU 可以处理网络流量管理等原本由 CPU 承担的任务。通过这种方式,DPU 减轻了 CPU 的负载,最终为应用程序提供更大的计算能力。
DPU 已经存在多年,但作为提升资源密集型工作负载(如 AI 训练)性能的方式,它们变得尤为重要。(需要明确的是,DPU 不是 AI 加速器,但可以与 AI 加速器一起使用,使服务器更有效地处理计算密集型任务。)这就是为什么我认为 DPU 即将迎来它们的高光时刻。
3. 先进硬件散热技术的扩展应用
数据中心硬件会产生大量热量。在典型的数据中心中,散热策略几十年来几乎没有改变,主要依靠向服务器吹送空气。
但还有其他方法,包括直接芯片冷却和液体浸没冷却。这些方法的能源效率要高得多,还可能通过减少过热事件来延长硬件寿命。
历史上,由于安装先进冷却系统的高成本,更复杂的数据中心冷却技术的使用受到限制。但随着 AI 和热浪带来越来越大的冷却挑战,先进的硬件冷却解决方案可能在 2025 年及以后对数据中心运营商更具吸引力。
4. 关注硬件安全风险
近期事件凸显了与物理硬件设备相关的安全威胁风险。虽然我怀疑目前没有人打算通过在服务器内放置秘密炸弹来炸毁数据中心,但我确实怀疑有威胁者正在试图做一些事情,比如在服务器上植入恶意固件,作为他们入侵数据中心的后门。
因此,我认为在 2025 年,我们将看到对验证数据中心硬件来源的更多关注,确保在制造和运输过程中没有未经授权的方访问设备。传统的安全控制仍然重要,但我认为硬件安全将在未来一年成为更受关注的领域。
5. 数据中心对 Arm 服务器的兴趣增长
我将以一个可能证明是错误但合理的预测来结束 2025 年数据中心硬件趋势清单:2025 年可能是 Arm 服务器在数据中心中变得普及的一年。
Arm 服务器是使用 Arm 架构而不是 x86 架构的服务器,后者历来是几乎所有服务器使用的芯片设计。Arm 架构可能带来包括更好的能源效率在内的多种好处。
长期以来一直有在数据中心更广泛部署 Arm 芯片的讨论。到目前为止,这种情况尚未发生。但有充分理由相信这种情况可能在 2025 年出现,特别是由于 AI 时代数据中心能源消耗问题日益受到关注。从理论上讲,Arm 服务器可以提高数据中心的能源效率,这不仅限于托管 AI 工作负载的数据中心。
总的来说,我不会押太多赌注认为 2025 年将成为 Arm 服务器之年,主要是因为迁移到 Arm 需要对软件进行的更改超出了大多数组织的准备程度。但引用我年轻时麦当劳的广告语:"嘿,这是可能发生的。"
好文章,需要你的鼓励
丰田第六代RAV4搭载高通骁龙数字底盘平台,提供个性化、直观且无缝连接的驾驶体验。新车基于丰田Arene软件开发平台,推进软件定义汽车发展,配备紧急驾驶停止系统和突然加速抑制功能。车载多媒体系统支持个性化主屏幕定制和更准确的语音识别。通过与高通技术公司合作,利用先进AI技术增强用户体验,提供更智能、直观和安全的出行方案。
上海AI实验室开发RePro训练方法,通过将AI推理过程类比为优化问题,教会AI避免过度思考。该方法通过评估推理步骤的进步幅度和稳定性,显著提升了模型在数学、科学和编程任务上的表现,准确率提升5-6个百分点,同时大幅减少无效推理,为高效AI系统发展提供新思路。
Chainguard发布可信开源软件季度报告,基于1800多个容器镜像项目和近5亿次构建的数据分析。报告显示:Python因AI需求成为最受欢迎的开源镜像;超半数生产环境运行在热门项目之外的长尾镜像上;98%的漏洞出现在非热门项目中,安全负担主要集中在不太显眼的技术栈部分;44%客户在生产环境中使用FIPS镜像以满足合规要求;Chainguard平均在20小时内修复关键漏洞。
MIT团队开发的VLASH技术首次解决了机器人动作断续、反应迟缓的根本问题。通过"未来状态感知"让机器人边执行边思考,实现了最高2.03倍的速度提升和17.4倍的反应延迟改善,成功展示了机器人打乒乓球等高难度任务,为机器人在动态环境中的应用开辟了新可能性。