作者:Maria deutscher
美国东部时间2023年5月23日13:00更新
戴尔和英伟达今天发布了一项名为Project Helix的联合计划,旨在帮助企业在内部数据中心运行生成式人工智能软件。

该计划已经推出了一系列验证设计产品。这是一些戴尔服务器,配备了该公司内部开发的管理工具以及英伟达的芯片和软件。这些系统经过了专门的优化,可以支持人工智能训练和推理用例。
英伟达首席执行官黄仁勋表示:“我们正处于一个历史性的时刻,生成式人工智能的惊人进步与企业降本增效的需求交织在一起。”“与戴尔合作,我们设计出了极具可扩展性、高效的基础架构,让企业能够安全地用自己的数据构建和运行生成式人工智能应用程序,以此改变其业务。”
Project Helix系统基于戴尔的PowerEdge服务器组合。该组合包括几台专门为人工智能用例优化的机器。R940xa是该人工智能优化阵容中最先进的系统之一,它结合了四个英特尔公司的处理器和四个英伟达的图形处理单元。
企业可以将戴尔的服务器与英伟达最新、最快的GPU——H100结合起来。该芯片具有800亿个晶体管,采用四纳米工艺生产。据英伟达称,它训练人工智能模型的速度比上一代芯片快九倍。
H100包括一个专门用于加速大型语言模型的模块,这是最流行的生成式人工智能类型之一。大型模型可以以多种数据格式组织它们摄入的信息。英伟达表示,H100的加速模块会自动选择格式,提供最快性能。
Project Helix让客户可以使用Nvidia AI Enterprise,这是英伟达配合其GPU提供的一个软件套件。该套件包含了五十多个用于构建和部署AI模型的工具。此外,它还提供了几个预包装的神经网络。
戴尔联合首席运营官Jeff Clarke表示:“Project Helix给企业提供了特制的人工智能模型,可以更快、更安全地从目前还没有得到充分利用的大量数据中获得价值。”
Project Helix系统配备的软件不仅来自英伟达,也有些来自戴尔。特别是用户可以使用戴尔的CloudIQ可观察性平台,检测其内部AI基础架构的潜在问题。戴尔表示,该平台使用了机器学习来自动发现故障。
Project Helix还包含了这家硬件制造商的安全组件验证(Secured Component Verification)技术。戴尔表示,数据生成之后,该技术会在服务器上安装一段被称为证书的加密数据。如果黑客试图在服务器传送给客户的过程中对数据进行篡改,该证书就会表明已经出现了恶意修改。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。