戴尔将推出一系列包括新服务器在内的基础设施产品,有望帮助企业更有效地训练和运行人工智能模型。
戴尔在近日Nvidia备受关注的GTC开发者大会上发布了这些产品。据戴尔称,这些新服务器产品和Nvidia首席执行官黄仁勋在活动中推出的B200 Tensor Core图形卡是兼容的。除了这些服务器之外,戴尔还将推出数据湖平台,升级存储产品组合,以及一系列其他产品更新。
theCUBE Research联合创始人、首席分析师Dave Vellante表示:“各个组织都在急于尝试AI,但实现投资回报率方面却面临着很多挑战,数据主权、法律和合规、数据质量都是首要考虑的问题,我们的研究表明,企业正在寻求戴尔和NVIDIA等行业领导者的帮助,以帮助提供AI的专业知识和服务,降低风险,更快地获得投资回报。”
推理优化的计算
戴尔已经开始向客户提供的PowerEdge XE9680服务器将配备Nvidia最新的B200 Tensor Core GPU,该芯片预计将执行推理任务,即在生产中运行经过训练的AI模型,速度比上一代芯片快15倍,而且更具成本效益。
B200是基于Nvidia Blackwell新型GPU架构的。据戴尔称,PowerEdge XE9680服务器还支持其他基于Blackwell的芯片以及H200 Tensor Core,后者将于11月推出,是H100的增强版,专门针对运行大型语言模型进行了优化。
在网络方面,戴尔的新服务器将搭配使用Nvidia Quantum-2和Spectrum-X交换机系列,分别针对使用InfiniBand和以太网数据传输协议的网络而构建。这两个交换机系列都包含了一系列软件功能,旨在降低延迟并减少拥塞连接对数据传输速度的影响。
数据存储和管理
PowerScale是戴尔的一个NAS产品线,针对运行AI模型等用例进行了优化。该系统将数据保存在采用横向扩展架构的闪存驱动器中,这使得在需要时添加更多容量变得相对简单一些。戴尔的OneFS存储操作系统主要用于管理容量扩展过程以及相关的维护任务。
据戴尔称,PowerScale系列现在已经成为第一批经过验证可与基于DGX H100的SuperPOD一起使用的以太网存储系统。DGX H100是Nvidia的一款数据中心设备,配备了8个H100 GPU。反过来,SuperPOD是DGX设备的集群。
戴尔表示,此次在GTC大会上详细介绍的产品更新不仅使数据存储变得更加容易,而且还让数据管理变得更加轻松。在推出新服务器的同时,戴尔还宣布Dell Data Lakehouse平台现已在全球上市,该产品让组织能够集中处理来自不同来源的信息。
企业以前主要采用两种类型的数据管理平台。数据仓库高度可靠,非常适合处理结构化记录,而数据湖能以经济高效的方式保存大量非结构化信息。而此次戴尔新推出的平台中,数据湖平台是将这两种技术的功能集结合在了一个产品中。
集成平台
戴尔还在GTC大会上推出了产品组合中的其他几款产品,每项新产品都将戴尔硬件产品组合的多个组件与软件、专业服务与Nvidia芯片进行了结合。
首先是Dell AI Factory,这是一套用于训练、调整和运行AI模型的“端到端AI企业解决方案”,它将Nvidia芯片与戴尔的计算、存储、客户端设备、软件产品组合以及专业服务相结合,这些服务有望简化准备AI数据集等任务。
其次是Dell Generative AI Solutions with NVIDIA – Model Training基础设施平台。据戴尔称,该平台可以帮助企业更轻松地训练针对特定领域任务优化的定制AI模型。第三款新产品是Dell Generative AI Solutions with NVIDIA – Retrieval-Augmented Generation,主要面向那些正在构建具有RAG功能的AI模型的企业。
Nvidia公司首席执行官黄仁勋表示:“NVIDIA和戴尔正在共同帮助企业打造AI工厂,将他们专有的数据转化为强大的洞察力。”
AI加速器产生的热量比典型CPU要多得多。戴尔详细介绍说,戴尔正在与Nvidia合作开发基于Nvidia Grace Blackwell Superchip的机架级液冷AI平台。用于数据中心冷却的水和其他液体相比空气能够更好地导热,因此在调节服务器温度方面也更加有效。
好文章,需要你的鼓励
OpenAI和微软宣布签署一项非约束性谅解备忘录,修订双方合作关系。随着两家公司在AI市场竞争客户并寻求新的基础设施合作伙伴,其关系日趋复杂。该协议涉及OpenAI从非营利组织向营利实体的重组计划,需要微软这一最大投资者的批准。双方表示将积极制定最终合同条款,共同致力于为所有人提供最佳AI工具。
中山大学团队针对OpenAI O1等长思考推理模型存在的"长度不和谐"问题,提出了O1-Pruner优化方法。该方法通过长度-和谐奖励机制和强化学习训练,成功将模型推理长度缩短30-40%,同时保持甚至提升准确率,显著降低了推理时间和计算成本,为高效AI推理提供了新的解决方案。
中国科技企业发布了名为R1的人形机器人,直接对标特斯拉的Optimus机器人产品。这款新型机器人代表了中国在人工智能和机器人技术领域的最新突破,展现出与国际巨头竞争的实力。R1机器人的推出标志着全球人形机器人市场竞争进一步加剧。
上海AI实验室研究团队深入调查了12种先进视觉语言模型在自动驾驶场景中的真实表现,发现这些AI系统经常在缺乏真实视觉理解的情况下生成看似合理的驾驶解释。通过DriveBench测试平台的全面评估,研究揭示了现有评估方法的重大缺陷,并为开发更可靠的AI驾驶系统提供了重要指导。