戴尔近日表示,正在扩展其生成式AI基础设施和服务套件。

戴尔的生成式AI硬件现在支持更多用例包括模型调整和推理,让客户能够在他们自己数据中心内的专有基础设施上部署最新的模型。
此外,戴尔还宣布扩展生成式AI专业服务能力,涵盖了数据准备、实施和教育。戴尔还和Starburst Data展开合作,帮助客户构建现代化的开放数据湖屋,为生成式AI应用提供支持。
戴尔的Validated Design for Generative AI with Nvidia为客户提供了戴尔最先进的服务器硬件和Nvidia的AI软件以及GPU,可以作为托管在客户自己数据中心而不是云端的生成式AI模型的基础。
该解决方案诞生于戴尔和Nvidia合作的Project Helix计划,将最强大的、支持AI的Dell PowerEdge服务和Nvidia最先进的GPU以及软件(例如Nvidia AI Enterprise和Nvidia NeMo,后者是一个用于训练、定制和部署生成式AI模型的框架)结合在一起。除了硬件和软件之外,客户还可以访问大量可定制的、预训练的AI模型,无需从零开始。
戴尔Validated Design for Generative AI with Nvidia的最初重点是AI训练,但此次更新之后,还将支持模型调整和推理,意味着客户还可以在本地部署模型。新功能现已通过传统渠道提供给客户,并将于本月晚些时候提供给戴尔APEX客户。
客户借助戴尔的Validated Design for Generative AI with Nvidia,可以在戴尔PowerEdge XE9680和PowerEdge XE8640服务器以及各种Nvidia GPU之间进行选择,对于那些希望构建生成式AI模型的同时在自己服务器内保持数据安全公司来说,这是一种理想的解决方案。
Constellation Research副总裁、首席分析师Andy Thurai认为,最强大的大型语言模型(例如GPT-4)由于其庞大的规模和资源需求,都是在云端专有环境中进行训练的。然而,一些企业正在寻找方法在他们自己的环境中训练他们自己的、规模小得多的大型语言模型。Thurai表示:“他们想要一种方法,能够在更小规模上做到这一点,以及根据自己的数据微调现有模型并在自己的基础设施上进行这一切。目前这还没有实现,但当它发生的时候,就需要对基础设施进行优化。”
普林斯顿大学就是已经这么开始做的客户之一。普林斯顿大学计算机科学系Charles C. Fitzmorris教授Sanjeev Arora解释说,普林斯顿大学已经在高性能计算集群中部署了戴尔和Nvidia的硬件来开发大型语言模型。他说:“该系统让自然科学、工程、社会科学和人文学科的研究人员有机会把强大的AI模型应用到可视化、建模和量子计算等领域的工作中。”
戴尔的Generative AI Professional Services服务已经扩展到数据准备领域。戴尔的专家可以确保客户拥有最干净的、最准确的数据集,并以正确的方式格式化,为他们的AI项目提供支持。戴尔表示,该服务还确保了数据集成和高质量的数据输出。
此外,戴尔还提供了新的实施服务,帮助客户建立一个可操作的生成式AI平台,用于推理和模型定制,并加快价值实现的速度,这实际上是为那些希望在自己数据中心内运行戴尔和Nvidia AI堆栈的客户提供完全托管的服务,使客户能够专注于开发自己的AI模型。
戴尔还为那些希望培训员工了解生成AI最新发展趋势的客户提供了新的教育服务。戴尔表示,以上这些新的服务都将在本月底推出。
最后,戴尔把PowerEdge计算和存储平台与Starburst业界领先的分析软件进行集成,帮助客户构建集中式的数据湖库,更轻松地从数据中提取洞察,预计这项集成将在2024年初在全球上市。
TECHnaanalysis Research分析师Bob O’Donnell表示,很明显,企业希望使用自己的数据来训练生成式AI模型,然而他们需要大量帮助来准备数据并确保其安全。他说:“戴尔最新的生成式AI解决方案和合作伙伴关系提供了一系列广泛的功能,可以帮助企业充分利用这一潜力,弥合知识差距,确保数据驱动可识别的、有影响力的业务成果。”
尽管如此Thurai认为,如果戴尔想在本地生成式AI开发方面赢得任何关注,就必须保持耐心。“这是一个有趣的概念,但戴尔首先需要吸引客户远离云端,因为所有的大型语言模型训练组件都已经在云端建立起来,但是要在本地设置所有这些东西、从云和分布式环境进行数据准备和数据移动,可能并不适合那些胆小的人。”
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。