数据中心硬件一直在幕后默默运行,为现代计算的关键系统提供动力。虽然它可能不像 AI 突破或绿色能源计划那样引人注目,但硬件领域正在快速发展,当前的创新正在重塑着数据中心的未来运作方式。
从前沿芯片架构到先进存储解决方案和智能管理技术,硬件发展趋势在推动效率和性能提升方面发挥着关键作用。
让我们来探讨将在 2025 年塑造行业的五个关键数据中心硬件议题。
1. AI 加速器硬件投资
如果您近年来关注 AI 对数据中心的影响,您可能已经知道,许多 AI 工作负载在专用 AI 加速器硬件上运行时表现最佳。
因此,当前最重要的数据中心硬件趋势之一就是对 AI 加速器的投资。
我个人认为,随着 AI 技术日趋成熟,企业不再持续启动 AI 实验或概念验证项目,数据中心对 AI 友好型硬件的需求最终将受到限制。但不可否认的是,到 2025 年,AI 加速器将占据数据中心硬件中越来越大的份额。
2. DPU 部署增长
除了专门为 AI 设计的硬件设备外,2025 年还将见证数据中心其他类型硬件优化的增长投资,例如数据处理单元 (DPU)。
DPU 可以处理网络流量管理等原本由 CPU 承担的任务。通过这种方式,DPU 减轻了 CPU 的负载,最终为应用程序提供更大的计算能力。
DPU 已经存在多年,但作为提升资源密集型工作负载(如 AI 训练)性能的方式,它们变得尤为重要。(需要明确的是,DPU 不是 AI 加速器,但可以与 AI 加速器一起使用,使服务器更有效地处理计算密集型任务。)这就是为什么我认为 DPU 即将迎来它们的高光时刻。
3. 先进硬件散热技术的扩展应用
数据中心硬件会产生大量热量。在典型的数据中心中,散热策略几十年来几乎没有改变,主要依靠向服务器吹送空气。
但还有其他方法,包括直接芯片冷却和液体浸没冷却。这些方法的能源效率要高得多,还可能通过减少过热事件来延长硬件寿命。
历史上,由于安装先进冷却系统的高成本,更复杂的数据中心冷却技术的使用受到限制。但随着 AI 和热浪带来越来越大的冷却挑战,先进的硬件冷却解决方案可能在 2025 年及以后对数据中心运营商更具吸引力。
4. 关注硬件安全风险
近期事件凸显了与物理硬件设备相关的安全威胁风险。虽然我怀疑目前没有人打算通过在服务器内放置秘密炸弹来炸毁数据中心,但我确实怀疑有威胁者正在试图做一些事情,比如在服务器上植入恶意固件,作为他们入侵数据中心的后门。
因此,我认为在 2025 年,我们将看到对验证数据中心硬件来源的更多关注,确保在制造和运输过程中没有未经授权的方访问设备。传统的安全控制仍然重要,但我认为硬件安全将在未来一年成为更受关注的领域。
5. 数据中心对 Arm 服务器的兴趣增长
我将以一个可能证明是错误但合理的预测来结束 2025 年数据中心硬件趋势清单:2025 年可能是 Arm 服务器在数据中心中变得普及的一年。
Arm 服务器是使用 Arm 架构而不是 x86 架构的服务器,后者历来是几乎所有服务器使用的芯片设计。Arm 架构可能带来包括更好的能源效率在内的多种好处。
长期以来一直有在数据中心更广泛部署 Arm 芯片的讨论。到目前为止,这种情况尚未发生。但有充分理由相信这种情况可能在 2025 年出现,特别是由于 AI 时代数据中心能源消耗问题日益受到关注。从理论上讲,Arm 服务器可以提高数据中心的能源效率,这不仅限于托管 AI 工作负载的数据中心。
总的来说,我不会押太多赌注认为 2025 年将成为 Arm 服务器之年,主要是因为迁移到 Arm 需要对软件进行的更改超出了大多数组织的准备程度。但引用我年轻时麦当劳的广告语:"嘿,这是可能发生的。"
好文章,需要你的鼓励
生成式AI在电商领域发展迅速,但真正的客户信任来自可靠的购物体验。数据显示近70%的在线购物者会放弃购物车,主要因为结账缓慢、隐藏费用等问题。AI基础设施工具正在解决这些信任危机,通过实时库存监控、动态结账优化和智能物流配送,帮助商家在售前、售中、售后各环节提升可靠性,最终将一次性买家转化为忠实客户。
泰国SCBX金融集团开发的DoTA-RAG系统通过动态路由和混合检索技术,成功解决了大规模知识库检索中速度与准确性难以兼得的难题。系统将1500万文档的搜索空间缩小92%,响应时间从100秒降至35秒,正确性评分提升96%,为企业级智能问答系统提供了实用的技术方案。
存储供应商Qumulo发布多租户架构Stratus,为每个租户提供独立的虚拟环境,通过加密技术和租户专用密钥管理系统实现隔离。该统一文件和对象存储软件支持本地、边缘、数据中心及AWS、Azure等云环境部署。Stratus采用加密隔离技术确保敏感数据安全,同时提供任务关键操作所需的灵活性和效率,帮助联邦和企业客户满足合规要求。
中科院和字节跳动联合开发了VGR视觉锚定推理系统,突破了传统AI只能粗略"看图"的局限。该系统能在推理过程中主动关注图片关键区域,像人类一样仔细观察细节后再得出结论。实验显示VGR在图表理解等任务上性能大幅提升,同时计算效率更高,代表了多模态AI"可视化推理"的重要进展。