AI Factory旨在通过部署一套集成的基础架构、软件和服务(包括英伟达的AI基础架构和软件),帮助企业在运营中采用和扩展人工智能。
戴尔正在扩展集成机架可扩展系统(Integrated Rack Scalable Systems),将PowerEdge XE9685L和PowerEdge XE7740服务器装进名为Dell Integrated Rack 5000的标准19英寸机箱中。这两款产品将于明年第一季度上市。
IRSS计划是一个交钥匙工厂集成计划,提供满载的机架级系统,可选择水冷或风冷,并为整个机架提供集中服务和支持选项。IR5000的设计旨在节省空间并支持高密度应用,提供高性能和高能效。
PowerEdge XE9685L是一款高密度4U液冷服务器,专为人工智能、机器学习、高性能计算和其他数据密集型工作负载而设计。它采用双AMD第五代EPYC中央处理器,搭配Nvidia HGX H200显卡或Nvidia B200平台。
机架上有多达12个外围组件互连 Express 插槽,可优化存储连接和最大输入/输出速度。每个机架最多可容纳96个英伟达GPU。戴尔的服务器和网络产品高级副总裁Arunkumar Narayanan表示,新服务器支持196个CPU内核和96个GPU,将提供业界最高的GPU密度。
他表示:“我们将在AI Factory集成所有这些功能,因此客户只需要等着到货之后插上电源就可以了。”“液冷服务器和风冷服务器都将安装完毕,整个系统将作为一个解决方案运行。如果出现任何问题,只需给戴尔拨打一个支持电话,戴尔就会处理整个问题。”
4U风冷式PowerEdge XE7740采用了双英特尔Xeon 6处理器,它使用了Intel Performance Cores,并有多达8个双宽加速器——包括Intel Gaudi 3 AI加速器或者Nvidia H200 NVL Tensor Core GPUs——或者多达16个单宽加速器,例如Nvidia L4 Tensor Core GPU。P-Cores是一种针对高性能和密集型工作负载而优化的处理器内核。
戴尔的服务器和网络产品高级副总裁Arunkumar Narayanan表示,新平台的GPU容量是前代 R760X 的两倍。他表示:“我们预计这将是我们在人工智能企业推理类产品中最成功的平台。”
戴尔还表示,它计划用为Integrated Rack 7000设计的新型PowerEdge XE服务器支持即将推出的Nvidia GB200 Grace Blackwell NVL4 Superchip,Integrated Rack 7000是一种液冷高密度计算基础架构,具有可扩展的电源管理功能,该功能是上个月发布的。IR 7000 可在50OU标准机架中支持每个机架最多144个GPU。
今年早些时候宣布的Dell Data Lakehouse更新增加了对Apache Spark的支持,以实现大规模分布式数据处理,为数据分析、管理、处理和分析提供统一的方法。
Dell AI Factory with Nvidia更新增加了对英伟达HGX H200和H100NVL的支持,性能比Nvidia HGX H100高出1.9倍。这使用户能够利用PowerEdge、Dell PowerScale和Nvidia AI Enterprise软件及生成式人工智能工具执行更复杂的查询并加速检索增强生成操作。
新的人工智能个人电脑验证设计(Validated Designs for AI PC)现已推出,这些开源指南旨在促进Dell AI PCs上采用神经处理单元技术的人工智能应用的开发。开发人员可以定制模块化设计,将大型语言模型、视觉、文本和语音等功能集成到应用中,这些应用可以跨平台部署,不受处理器限制。
戴尔还在扩展专业服务产品线,包括可持续数据中心、数据管理服务、人工智能网络服务以及协助实施ServiceNow Inc.’s Now Assist,这是一款由人工智能驱动的生成式产品,利用生成式人工智能提高生产力和工作流程效率。
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
IDEA研究院等机构联合开发了ToG-3智能推理系统,通过多智能体协作和双重进化机制,让AI能像人类专家团队一样动态思考和学习。该系统在复杂推理任务上表现优异,能用较小模型达到卓越性能,为AI技术的普及应用开辟了新路径,在教育、医疗、商业决策等领域具有广阔应用前景。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
上海人工智能实验室提出SPARK框架,创新性地让AI模型在学习推理的同时学会自我评判,通过回收训练数据建立策略与奖励的协同进化机制。实验显示,该方法在数学推理、奖励评判和通用能力上分别提升9.7%、12.1%和1.5%,且训练成本仅为传统方法的一半,展现出强大的泛化能力和自我反思能力。