AI Factory旨在通过部署一套集成的基础架构、软件和服务(包括英伟达的AI基础架构和软件),帮助企业在运营中采用和扩展人工智能。
戴尔正在扩展集成机架可扩展系统(Integrated Rack Scalable Systems),将PowerEdge XE9685L和PowerEdge XE7740服务器装进名为Dell Integrated Rack 5000的标准19英寸机箱中。这两款产品将于明年第一季度上市。
IRSS计划是一个交钥匙工厂集成计划,提供满载的机架级系统,可选择水冷或风冷,并为整个机架提供集中服务和支持选项。IR5000的设计旨在节省空间并支持高密度应用,提供高性能和高能效。
PowerEdge XE9685L是一款高密度4U液冷服务器,专为人工智能、机器学习、高性能计算和其他数据密集型工作负载而设计。它采用双AMD第五代EPYC中央处理器,搭配Nvidia HGX H200显卡或Nvidia B200平台。
机架上有多达12个外围组件互连 Express 插槽,可优化存储连接和最大输入/输出速度。每个机架最多可容纳96个英伟达GPU。戴尔的服务器和网络产品高级副总裁Arunkumar Narayanan表示,新服务器支持196个CPU内核和96个GPU,将提供业界最高的GPU密度。
他表示:“我们将在AI Factory集成所有这些功能,因此客户只需要等着到货之后插上电源就可以了。”“液冷服务器和风冷服务器都将安装完毕,整个系统将作为一个解决方案运行。如果出现任何问题,只需给戴尔拨打一个支持电话,戴尔就会处理整个问题。”
4U风冷式PowerEdge XE7740采用了双英特尔Xeon 6处理器,它使用了Intel Performance Cores,并有多达8个双宽加速器——包括Intel Gaudi 3 AI加速器或者Nvidia H200 NVL Tensor Core GPUs——或者多达16个单宽加速器,例如Nvidia L4 Tensor Core GPU。P-Cores是一种针对高性能和密集型工作负载而优化的处理器内核。
戴尔的服务器和网络产品高级副总裁Arunkumar Narayanan表示,新平台的GPU容量是前代 R760X 的两倍。他表示:“我们预计这将是我们在人工智能企业推理类产品中最成功的平台。”
戴尔还表示,它计划用为Integrated Rack 7000设计的新型PowerEdge XE服务器支持即将推出的Nvidia GB200 Grace Blackwell NVL4 Superchip,Integrated Rack 7000是一种液冷高密度计算基础架构,具有可扩展的电源管理功能,该功能是上个月发布的。IR 7000 可在50OU标准机架中支持每个机架最多144个GPU。
今年早些时候宣布的Dell Data Lakehouse更新增加了对Apache Spark的支持,以实现大规模分布式数据处理,为数据分析、管理、处理和分析提供统一的方法。
Dell AI Factory with Nvidia更新增加了对英伟达HGX H200和H100NVL的支持,性能比Nvidia HGX H100高出1.9倍。这使用户能够利用PowerEdge、Dell PowerScale和Nvidia AI Enterprise软件及生成式人工智能工具执行更复杂的查询并加速检索增强生成操作。
新的人工智能个人电脑验证设计(Validated Designs for AI PC)现已推出,这些开源指南旨在促进Dell AI PCs上采用神经处理单元技术的人工智能应用的开发。开发人员可以定制模块化设计,将大型语言模型、视觉、文本和语音等功能集成到应用中,这些应用可以跨平台部署,不受处理器限制。
戴尔还在扩展专业服务产品线,包括可持续数据中心、数据管理服务、人工智能网络服务以及协助实施ServiceNow Inc.’s Now Assist,这是一款由人工智能驱动的生成式产品,利用生成式人工智能提高生产力和工作流程效率。
好文章,需要你的鼓励
这项由浙江大学与阿里巴巴通义实验室联合开展的研究,通过创新的半在线强化学习方法,显著提升了AI界面助手在多步骤任务中的表现。UI-S1-7B模型在多个基准测试中创造了7B参数规模的新纪录,为GUI自动化代理的发展开辟了新的技术路径。
阿里巴巴联合浙江大学开发的OmniThink框架让AI学会像人类一样慢思考写作。通过信息树和概念池的双重架构,系统能够动态检索信息、持续反思,突破了传统AI写作内容浅薄重复的局限。实验显示该方法在文章质量各维度均显著超越现有最强基线,知识密度提升明显,为长文本生成研究开辟了新方向。
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
腾讯混元3D 2.0是一个革命性的3D生成系统,能够从单张图片生成高质量的带纹理3D模型。该系统包含形状生成模块Hunyuan3D-DiT和纹理合成模块Hunyuan3D-Paint,采用创新的重要性采样和多视角一致性技术,在多项评估指标上超越现有技术,并提供用户友好的制作平台。作为开源项目,它将大大降低3D内容创作门槛,推动3D技术的普及应用。