AI Factory旨在通过部署一套集成的基础架构、软件和服务(包括英伟达的AI基础架构和软件),帮助企业在运营中采用和扩展人工智能。
戴尔正在扩展集成机架可扩展系统(Integrated Rack Scalable Systems),将PowerEdge XE9685L和PowerEdge XE7740服务器装进名为Dell Integrated Rack 5000的标准19英寸机箱中。这两款产品将于明年第一季度上市。
IRSS计划是一个交钥匙工厂集成计划,提供满载的机架级系统,可选择水冷或风冷,并为整个机架提供集中服务和支持选项。IR5000的设计旨在节省空间并支持高密度应用,提供高性能和高能效。
PowerEdge XE9685L是一款高密度4U液冷服务器,专为人工智能、机器学习、高性能计算和其他数据密集型工作负载而设计。它采用双AMD第五代EPYC中央处理器,搭配Nvidia HGX H200显卡或Nvidia B200平台。
机架上有多达12个外围组件互连 Express 插槽,可优化存储连接和最大输入/输出速度。每个机架最多可容纳96个英伟达GPU。戴尔的服务器和网络产品高级副总裁Arunkumar Narayanan表示,新服务器支持196个CPU内核和96个GPU,将提供业界最高的GPU密度。
他表示:“我们将在AI Factory集成所有这些功能,因此客户只需要等着到货之后插上电源就可以了。”“液冷服务器和风冷服务器都将安装完毕,整个系统将作为一个解决方案运行。如果出现任何问题,只需给戴尔拨打一个支持电话,戴尔就会处理整个问题。”
4U风冷式PowerEdge XE7740采用了双英特尔Xeon 6处理器,它使用了Intel Performance Cores,并有多达8个双宽加速器——包括Intel Gaudi 3 AI加速器或者Nvidia H200 NVL Tensor Core GPUs——或者多达16个单宽加速器,例如Nvidia L4 Tensor Core GPU。P-Cores是一种针对高性能和密集型工作负载而优化的处理器内核。
戴尔的服务器和网络产品高级副总裁Arunkumar Narayanan表示,新平台的GPU容量是前代 R760X 的两倍。他表示:“我们预计这将是我们在人工智能企业推理类产品中最成功的平台。”
戴尔还表示,它计划用为Integrated Rack 7000设计的新型PowerEdge XE服务器支持即将推出的Nvidia GB200 Grace Blackwell NVL4 Superchip,Integrated Rack 7000是一种液冷高密度计算基础架构,具有可扩展的电源管理功能,该功能是上个月发布的。IR 7000 可在50OU标准机架中支持每个机架最多144个GPU。
今年早些时候宣布的Dell Data Lakehouse更新增加了对Apache Spark的支持,以实现大规模分布式数据处理,为数据分析、管理、处理和分析提供统一的方法。
Dell AI Factory with Nvidia更新增加了对英伟达HGX H200和H100NVL的支持,性能比Nvidia HGX H100高出1.9倍。这使用户能够利用PowerEdge、Dell PowerScale和Nvidia AI Enterprise软件及生成式人工智能工具执行更复杂的查询并加速检索增强生成操作。
新的人工智能个人电脑验证设计(Validated Designs for AI PC)现已推出,这些开源指南旨在促进Dell AI PCs上采用神经处理单元技术的人工智能应用的开发。开发人员可以定制模块化设计,将大型语言模型、视觉、文本和语音等功能集成到应用中,这些应用可以跨平台部署,不受处理器限制。
戴尔还在扩展专业服务产品线,包括可持续数据中心、数据管理服务、人工智能网络服务以及协助实施ServiceNow Inc.’s Now Assist,这是一款由人工智能驱动的生成式产品,利用生成式人工智能提高生产力和工作流程效率。
好文章,需要你的鼓励
代理型AI正在颠覆在线会议平台,从被动观察者转变为主动参与者。Zoom、Microsoft等公司纷纷推出AI助手,不仅提供语音转录,还能回答问题、安排后续会议。Otter AI更是推出了能通过语音命令参与对话的AI会议代理。这些创新将大大提升会议效率,为企业带来实际价值。未来,AI将从工具演变为真正的协作伙伴,深度理解业务场景将成为关键竞争力。
谷歌与计算机历史博物馆联合发布了AlexNet的源代码,这是一个在2012年彻底改变人工智能领域的卷积神经网络。AlexNet证明了"深度学习"能够实现传统人工智能技术无法达成的目标,标志着人工智能领域的重大突破。此举不仅为AI爱好者和研究人员提供了一个窥探计算机历史关键时刻的机会,也为未来的历史学家提供了理解这项改变世界技术的宝贵资料。
Midjourney 与纽约大学合作,发布了一项提升大语言模型创造性写作能力的研究。他们提出了两种新技术:多样化直接偏好优化(DDPO)和多样化比值偏好优化(DORPO),旨在扩大模型输出的多样性,同时保持连贯性和可读性。这项研究不仅展示了 Midjourney 在文本领域的野心,也为企业 AI 团队、产品开发者和内容创作者提供了改进 AI 生成文本的新方法。
英伟达推出了一款名为G-Assist的实验性AI助手,可在本地GPU上运行,无需云端支持。这款AI助手旨在帮助玩家优化PC性能并提升游戏体验。G-Assist能够回答基本问题、调整系统设置、超频GPU等。虽然目前功能有限且存在一些性能问题,但它代表了本地AI应用的一个重要尝试,展示了未来GPU同时运行游戏和AI模型的潜力。