这项新服务适用于那些想要私有AI超级计算机、但又缺乏支持这些系统的数据中心基础设施和专业知识的企业。Nvidia高管Charlie Boyle表示,这项服务将帮助渠道合作伙伴“更快地赚钱,更快地完成业务,并最终为客户提供更多的价值”。
Nvidia和Equinix表示,他们构建了一个解决方案,主要针对那些想要快速设置私有超级计算机来构建生成式AI应用、但缺乏支持系统的数据中心基础设施和专业知识的企业。
本周三宣布推出的这项Equinix Private AI with Nvidia DGX服务,被两家厂商描述为“交钥匙型”解决方案,其中Equinix负责托管和管理企业通过Nvidia渠道合作伙伴购买的Nvidia DGX超级计算机。
该方案是为出于各种原因(包括安全性、数据主权和可审计性)而不想将数据存储在公有云中的企业而设计的。
Nvidia DGX系统副总裁Charlie Boyle表示,新的解决方案将帮助Nvidia Partner Network中的合作伙伴通过DGX系统“更快地赚钱、更快地完成交易,并最终为客户提供更多的价值”。
“这使他们更容易售卖和完成交易,让客户更容易使用、启动和运行人工智能,因此这对于我们所有的[Nvidia Partner Network]合作伙伴来说将带来巨大的好处,可以加速他们已经忙了数月的交易,并让新的交易进入管道中。”
通过这项全面管理的服务,芯片巨头Nvidia和数据中心巨头Equinix希望解决许多企业面临的问题:在私人数据中心规划和部署Nvidia DGX系统集群需要花费大量时间,而且缺乏适当的设施来容纳此类系统,以及缺乏管理这些系统的人员。
Boyle在一份简报中表示:“客户想要世界一流的AI功能,但他们中的大多数人都没有数据中心基础设施,也不具备构建、管理和运行这些系统的专业知识。”
Equinix高级副总裁、数据中心服务总经理Jon Lin表示,凭借Equinix在建立和管理数据中心方面的专业知识,新的Private AI服务可以将部署DGX超级计算机的交付时间“从几个月缩短到几周,甚至是几天”。
Equinix Private AI With Nvidia DGX中包含哪些内容
Equinix的Private AI服务专注于Nvidia DGX BasePod或者SuperPod集群配置,根据Nvidia的文档显示,后者的范围可以从128个DGX H100系统扩展到多达2048个系统。
这些DGX系统每个都包含8个H100 GPU,使用Nvidia超低延迟的InfiniBand网络技术连接在一起,并由Equinix全球800多名员工组成的托管服务团队进行管理。
该服务的另一个关键组件是Nvidia AI Enterprise,一个面向芯片设计师的软件平台,其中包括了训练和运行AI模型所需的所有构建模块,从用于构建大型语言模型的NeMo框架到用于优化此类模型的TensorRT-LLM库。
据Equinix称,Private AI服务的客户可以在全球近250个Equinix International Business Exchange数据中心部署他们的DGX集群,其中包括位于北美、南美、欧洲、亚洲和非洲的数据中心。
Equinix数据中心内的DGX集群通过高速专用网络与外界连接,Equinix还为云服务和企业服务提供商提供了高带宽互连。
该服务提供了“企业级”的支持和安全性,其中包括Equinix员工在构建和部署自定义AI模型方面提供的帮助,以及与Nvidia专家建立联系。
Lin表示:“全球各地的企业都倾注了巨大的精力希望做到这一点,但要以既不会从网络安全的角度或者知识产权泄露的角度暴露自己的方式。那么,私有基础设施就会成为能够实现这一目标的一条关键途径。”
Private AI服务确保快速DGX部署而非快速交付
Boyle表示,虽然Nvidia和Equinix把Private AI服务定位为企业建立私有AI基础设施的一种快速而简单的方式,但它不会对DGX系统的交付周期产生影响。
“无论部署在哪里,所有DGX SuperPOD客户从订单到系统发货的交货时间都是相同的,”他说。
去年,原始设备制造商和渠道合作伙伴普遍抱怨说,配置了Nvidia H100 GPU(包括DGX)的系统交货时间过长。这是由于对处理器的高需求造成的,处理器因其高性能而受到无数AI开发者的欢迎,包括OpenAI等大公司。
过去几个月,Nvidia一直在努力增加H100的产量以满足需求,但有合作伙伴称,交货时间仍然很长。
一位Nvidia合作伙伴公司高管表示:“你只是在出售缺货订单,一个排队的位置。”他要求匿名以便能够坦率地谈论与这家芯片设计商之间的业务情况。
另一位Nvidia合作伙伴公司高管表示,基于H100的系统的交货时间正在有所改善,但面向客户的交货时间仍然需要四到八周,“保守一点的话”。他补充说,在某些情况下,系统的交付速度能更快一些。
好文章,需要你的鼓励
"当我看到梵高的每一笔中都有他的痛苦时,才明白我们看的不是作品,而是作者的人生。AI正以惊人的速度接近人类水平通用智能,让Google从'伦敦那帮疯子在搞AGI'转变为全公司共识。DeepMind让AI'合理地幻觉'来创造突破,就像Astra技术让用户第一次惊呼'AI能做到比想象更多'——这不仅是技术革命,更是重新定义创造力的开始。"
英伟达2025Q1营收440亿美元创纪录,数据中心业务暴涨73%至390亿美元。黄仁勋直言:"中国是全球最大AI市场,出口管制只会让美国失去平台领导权。Blackwell架构推动推理性能提升30倍,微软已部署数万块GPU,AI工厂正成为各国数字基础设施核心。"
来自耶路撒冷希伯来大学的研究团队开发了WHISTRESS,一种创新的无需对齐的句子重音检测方法,能够识别说话者在语音中强调的关键词语。研究者基于Whisper模型增加了重音检测组件,并创建了TINYSTRESS-15K合成数据集用于训练。实验表明,WHISTRESS在多个基准测试中表现优异,甚至展示了强大的零样本泛化能力。这项技术使语音识别系统不仅能理解"说了什么",还能捕捉"如何说"的细微差别,为人机交互带来更自然的体验。
这项研究提出了"力量提示"方法,使视频生成模型能够响应物理力控制信号。研究团队来自布朗大学和谷歌DeepMind,他们通过设计两种力提示——局部点力和全局风力,让模型生成符合物理规律的视频。惊人的是,尽管仅使用约15,000个合成训练样本,模型展现出卓越的泛化能力,能够处理不同材质、几何形状和环境下的力学交互。研究还发现模型具有初步的质量理解能力,相同力量对不同质量物体产生不同影响。这一突破为交互式视频生成和直观世界模型提供了新方向。