AI Factory旨在通过部署一套集成的基础架构、软件和服务(包括英伟达的AI基础架构和软件),帮助企业在运营中采用和扩展人工智能。
戴尔正在扩展集成机架可扩展系统(Integrated Rack Scalable Systems),将PowerEdge XE9685L和PowerEdge XE7740服务器装进名为Dell Integrated Rack 5000的标准19英寸机箱中。这两款产品将于明年第一季度上市。
IRSS计划是一个交钥匙工厂集成计划,提供满载的机架级系统,可选择水冷或风冷,并为整个机架提供集中服务和支持选项。IR5000的设计旨在节省空间并支持高密度应用,提供高性能和高能效。
PowerEdge XE9685L是一款高密度4U液冷服务器,专为人工智能、机器学习、高性能计算和其他数据密集型工作负载而设计。它采用双AMD第五代EPYC中央处理器,搭配Nvidia HGX H200显卡或Nvidia B200平台。
机架上有多达12个外围组件互连 Express 插槽,可优化存储连接和最大输入/输出速度。每个机架最多可容纳96个英伟达GPU。戴尔的服务器和网络产品高级副总裁Arunkumar Narayanan表示,新服务器支持196个CPU内核和96个GPU,将提供业界最高的GPU密度。
他表示:“我们将在AI Factory集成所有这些功能,因此客户只需要等着到货之后插上电源就可以了。”“液冷服务器和风冷服务器都将安装完毕,整个系统将作为一个解决方案运行。如果出现任何问题,只需给戴尔拨打一个支持电话,戴尔就会处理整个问题。”
4U风冷式PowerEdge XE7740采用了双英特尔Xeon 6处理器,它使用了Intel Performance Cores,并有多达8个双宽加速器——包括Intel Gaudi 3 AI加速器或者Nvidia H200 NVL Tensor Core GPUs——或者多达16个单宽加速器,例如Nvidia L4 Tensor Core GPU。P-Cores是一种针对高性能和密集型工作负载而优化的处理器内核。
戴尔的服务器和网络产品高级副总裁Arunkumar Narayanan表示,新平台的GPU容量是前代 R760X 的两倍。他表示:“我们预计这将是我们在人工智能企业推理类产品中最成功的平台。”
戴尔还表示,它计划用为Integrated Rack 7000设计的新型PowerEdge XE服务器支持即将推出的Nvidia GB200 Grace Blackwell NVL4 Superchip,Integrated Rack 7000是一种液冷高密度计算基础架构,具有可扩展的电源管理功能,该功能是上个月发布的。IR 7000 可在50OU标准机架中支持每个机架最多144个GPU。
今年早些时候宣布的Dell Data Lakehouse更新增加了对Apache Spark的支持,以实现大规模分布式数据处理,为数据分析、管理、处理和分析提供统一的方法。
Dell AI Factory with Nvidia更新增加了对英伟达HGX H200和H100NVL的支持,性能比Nvidia HGX H100高出1.9倍。这使用户能够利用PowerEdge、Dell PowerScale和Nvidia AI Enterprise软件及生成式人工智能工具执行更复杂的查询并加速检索增强生成操作。
新的人工智能个人电脑验证设计(Validated Designs for AI PC)现已推出,这些开源指南旨在促进Dell AI PCs上采用神经处理单元技术的人工智能应用的开发。开发人员可以定制模块化设计,将大型语言模型、视觉、文本和语音等功能集成到应用中,这些应用可以跨平台部署,不受处理器限制。
戴尔还在扩展专业服务产品线,包括可持续数据中心、数据管理服务、人工智能网络服务以及协助实施ServiceNow Inc.’s Now Assist,这是一款由人工智能驱动的生成式产品,利用生成式人工智能提高生产力和工作流程效率。
好文章,需要你的鼓励
Luminary Cloud宣布完成7200万美元B轮融资,专注开发"物理AI"技术。该公司云原生平台可将仿真速度提升100倍,利用物理信息模型实时预测汽车、飞机等产品性能。公司推出针对特定行业的预训练模型,包括与本田合作的汽车设计模型和与Otto航空合作的飞机开发模型。融资由西门子风投领投,将用于扩大研发团队和市场销售。
香港中文大学联合上海AI实验室推出Dispider系统,首次实现AI视频"边看边聊"能力。通过创新的三分式架构设计,将感知、决策、反应功能独立分离,让AI能像人类一样在观看视频过程中进行实时交流,在StreamingBench测试中显著超越现有系统,为教育、娱乐、医疗、安防等领域的视频AI应用开启新可能。
伦敦量子动态科技公司宣布交付业界首台采用传统半导体制造工艺的量子计算机。该系统已安装在英国国家量子计算中心,使用标准化300毫米硅晶圆,是首台自旋量子比特计算机。系统采用CMOS技术,占地约三个19英寸服务器机架,具备数据中心友好特性。公司开发的可扩展瓦片架构支持大规模生产,未来可扩展至每个量子处理单元数百万量子比特,为商业化应用奠定基础。
Atla公司发布Selene Mini,这是一个仅有80亿参数的AI评估模型,却在11个基准测试中全面超越GPT-4o-mini。通过精心的数据筛选和创新训练策略,该模型不仅能准确评判文本质量,还能在医疗、金融等专业领域表现出色。研究团队将模型完全开源,为AI评估技术的普及和发展做出贡献。