AI Factory旨在通过部署一套集成的基础架构、软件和服务(包括英伟达的AI基础架构和软件),帮助企业在运营中采用和扩展人工智能。
戴尔正在扩展集成机架可扩展系统(Integrated Rack Scalable Systems),将PowerEdge XE9685L和PowerEdge XE7740服务器装进名为Dell Integrated Rack 5000的标准19英寸机箱中。这两款产品将于明年第一季度上市。
IRSS计划是一个交钥匙工厂集成计划,提供满载的机架级系统,可选择水冷或风冷,并为整个机架提供集中服务和支持选项。IR5000的设计旨在节省空间并支持高密度应用,提供高性能和高能效。
PowerEdge XE9685L是一款高密度4U液冷服务器,专为人工智能、机器学习、高性能计算和其他数据密集型工作负载而设计。它采用双AMD第五代EPYC中央处理器,搭配Nvidia HGX H200显卡或Nvidia B200平台。
机架上有多达12个外围组件互连 Express 插槽,可优化存储连接和最大输入/输出速度。每个机架最多可容纳96个英伟达GPU。戴尔的服务器和网络产品高级副总裁Arunkumar Narayanan表示,新服务器支持196个CPU内核和96个GPU,将提供业界最高的GPU密度。
他表示:“我们将在AI Factory集成所有这些功能,因此客户只需要等着到货之后插上电源就可以了。”“液冷服务器和风冷服务器都将安装完毕,整个系统将作为一个解决方案运行。如果出现任何问题,只需给戴尔拨打一个支持电话,戴尔就会处理整个问题。”
4U风冷式PowerEdge XE7740采用了双英特尔Xeon 6处理器,它使用了Intel Performance Cores,并有多达8个双宽加速器——包括Intel Gaudi 3 AI加速器或者Nvidia H200 NVL Tensor Core GPUs——或者多达16个单宽加速器,例如Nvidia L4 Tensor Core GPU。P-Cores是一种针对高性能和密集型工作负载而优化的处理器内核。
戴尔的服务器和网络产品高级副总裁Arunkumar Narayanan表示,新平台的GPU容量是前代 R760X 的两倍。他表示:“我们预计这将是我们在人工智能企业推理类产品中最成功的平台。”
戴尔还表示,它计划用为Integrated Rack 7000设计的新型PowerEdge XE服务器支持即将推出的Nvidia GB200 Grace Blackwell NVL4 Superchip,Integrated Rack 7000是一种液冷高密度计算基础架构,具有可扩展的电源管理功能,该功能是上个月发布的。IR 7000 可在50OU标准机架中支持每个机架最多144个GPU。
今年早些时候宣布的Dell Data Lakehouse更新增加了对Apache Spark的支持,以实现大规模分布式数据处理,为数据分析、管理、处理和分析提供统一的方法。
Dell AI Factory with Nvidia更新增加了对英伟达HGX H200和H100NVL的支持,性能比Nvidia HGX H100高出1.9倍。这使用户能够利用PowerEdge、Dell PowerScale和Nvidia AI Enterprise软件及生成式人工智能工具执行更复杂的查询并加速检索增强生成操作。
新的人工智能个人电脑验证设计(Validated Designs for AI PC)现已推出,这些开源指南旨在促进Dell AI PCs上采用神经处理单元技术的人工智能应用的开发。开发人员可以定制模块化设计,将大型语言模型、视觉、文本和语音等功能集成到应用中,这些应用可以跨平台部署,不受处理器限制。
戴尔还在扩展专业服务产品线,包括可持续数据中心、数据管理服务、人工智能网络服务以及协助实施ServiceNow Inc.’s Now Assist,这是一款由人工智能驱动的生成式产品,利用生成式人工智能提高生产力和工作流程效率。
好文章,需要你的鼓励
Gartner预测,到2030年所有IT工作都将涉及AI技术的使用,这与目前81%的IT工作不使用AI形成鲜明对比。届时25%的IT工作将完全由机器人执行,75%由人类在AI辅助下完成。尽管AI将取代部分入门级IT职位,但Gartner认为不会出现大规模失业潮,目前仅1%的失业由AI造成。研究显示65%的公司在AI投资上亏损,而世界经济论坛预计AI到2030年创造的就业机会将比消除的多7800万个。
CORA是微软研究院与谷歌研究团队联合开发的突破性AI视觉模型,发表于2023年CVPR会议。它通过创新的"区域提示"和"锚点预匹配"技术,成功解决了计算机视觉领域的一大挑战——开放词汇目标检测。CORA能够识别训练数据中从未出现过的物体类别,就像人类能够举一反三一样。在LVIS数据集测试中,CORA的性能比现有最佳方法提高了4.6个百分点,尤其在稀有类别识别上表现突出。这一技术有望广泛应用于自动驾驶、零售、安防和辅助技术等多个领域。
人工智能正从软件故事转向AI工厂基础,芯片、数据管道和网络协同工作形成数字化生产系统。这种新兴模式重新定义了性能衡量标准和跨行业价值创造方式。AI工厂将定制半导体、低延迟结构和大规模数据仪器整合为实时反馈循环,产生竞争优势。博通、英伟达和IBM正在引领这一转变,通过长期定制芯片合同和企业遥测技术,将传统体验转化为活跃的数字生态系统。
中国电信研究院联合重庆大学、北航发布T2R-bench基准,首次系统评估AI从工业表格生成专业报告的能力。研究涵盖457个真实工业表格,测试25个主流AI模型,发现最强模型得分仅62.71%,远低于人类专家96.52%。揭示AI在处理复杂结构表格、超大规模数据时存在数字计算错误、信息遗漏等关键缺陷,为AI数据分析技术改进指明方向。