但目前价格尚未公布,希望数字友好。

HPE与英伟达表示正为客户提供构建模块,可用于组装同布里斯托大学Isambard-AI超级计算机同架构的迷你版本,用以训练生成式AI和深度学习项目。
两家公司正联手销售一款基于HPE Cray EX2500架构及英伟达Grace Hopper超级芯片的模块化机器,其上运行的则是两家公司共同提供的软件工具栈。
该系统将于本周在科罗拉多州召开的SC23高性能计算(HPC)大会上公开演示,设计目标是通过预配置和预测试的完整技术栈,让组织更轻松地启动并运行AI训练。当然,一切要等价格公布之后才有定论。
根据HPE的介绍,该系统是首款采用四GH200超级芯片节点配置的系统,就是说每个节点将包含4块英伟达高端芯片。每块超级芯片都拥有72核Arm架构Grace CPU与Hopper GPU,并配备480 GB的LPDDR5x内存与144 GB HBM3e高带宽内存。
这些节点采用HPE的Slingshot互连技术,这项技术属于以太网的超集,添加了高性能计算(HPC)所必需的诸多功能。
虽然硬件成本相当可观,但HPE表示这套特殊的解决方案允许客户先从小规模起步,随后根据需求灵活扩展。
HPE高性能计算、人工智能与实验室执行副总裁Juston Hotard在采访中表示,“已经有一部分客户发布了搭载Grace Hopper超级芯片的产品,但我们的EX2500仍然独一无二,因为它可作为统一的单位进行部署,全部冷却、供电和计算板件均部署在同一模块之内。”
他解释道,这意味着该系统“不仅为客户提供了非常简单的入门选项,同时还具备广阔的扩展空间。”
作为方案中的软件技术栈,HPE带来了自己的机器学习开发环境(Machine Learning Development Environment)。这是一套用于训练生成式AI模型的平台,主要基于HPE在2021年收购自Defined AI的技术。
方案中还包含英伟达的AI Enterprise套件,这是一系列AI工具和框架的集合,包括TensorFlow、PyTorch、英伟达RAPIDS与TensorRT软件库,以及Triton推理服务器等。客户还可以获得HPE的Cray编程环境,这是一套用于代码开发、移植和调试的工具组合。
Hotard表示,AI训练是目前计算密度最大的工作负载之一,因此对计算架构的要求也比较特殊。
“我们都知道,云架构是围绕单一服务器资源的最大化利用设计而成的。因此在面对工作负载时,这类方案倾向于将任务拆分成一个个较小的部分。”
“但AI工作负载,特别是训练和大规模微调类负载,则有着截然不同的特性。在某些情况下,这些工作负载需要将整座数据中心视为单一计算机来运行。AI工作负载需要运行在几百甚至数千个节点之上,并要求所有计算、互连和存储资源都要像在超级计算机内那样高度一致地规模化运行。”
当然,这套新系统的服务对象仅限那些掌握充足财务预算的组织,不过HPE目前拒绝透露关于成本的具体信息。Hotard表示价格将在不久之后对外公布。
英伟达科学项目经理Jack Wells宣称,基准测试结果显示,在使用Llama 2处理大语言模型(LLM)推理工作负载时,基于GH200的单一节点比双至强CPU服务器快100倍。
他声称,“生成式AI正在重构科学计算思路,并带动起极为巨大的市场需求。”他同时强调,HPE与英伟达的这款产品已经吸引到多家客户。
其中包括苏黎世联邦理工学院的超级计算机、波兰Cyfronet、洛斯阿拉莫斯国家实验室,以及布里斯托大学的Isambard-AI系统(计划部署5448块英伟达GH200超级芯片)。
HPE表示,该服务将从12月登陆30多个国家的市场。除了来自公共部门和研究机构的AI创新中心客户之外,该项目预计还将吸引到不少企业巨头的关注。
好文章,需要你的鼓励
随着员工自发使用生成式AI工具,CIO面临影子AI的挑战。报告显示43%的员工在个人设备上使用AI应用处理工作,25%在工作中使用未经批准的AI工具。专家建议通过六项策略管理影子AI:建立明确规则框架、持续监控和清单跟踪、加强数据保护和访问控制、明确风险承受度、营造透明信任文化、实施持续的角色化AI培训。目标是支持负责任的创新而非完全禁止。
NVIDIA研究团队开发的OmniVinci是一个突破性的多模态AI模型,能够同时理解视觉、听觉和文本信息。该模型仅使用0.2万亿训练样本就超越了使用1.2万亿样本的现有模型,在多模态理解测试中领先19.05分。OmniVinci采用三项核心技术实现感官信息协同,并在机器人导航、医疗诊断、体育分析等多个实际应用场景中展现出专业级能力,代表着AI向真正智能化发展的重要进步。
英国正式推出DaRe2THINK数字平台,旨在简化NHS全科医生参与临床试验的流程。该平台由伯明翰大学和MHRA临床实践研究数据链开发,能够安全传输GP诊所与NHS试验研究人员之间的健康数据,减少医生的管理负担。平台利用NHS现有健康信息,安全筛查来自450多家诊所的1300万患者记录,并使用移动消息系统保持试验对象参与度,为传统上无法参与的人群开辟了研究机会。
Salesforce研究团队发布BLIP3o-NEXT,这是一个创新的图像生成模型,采用自回归+扩散的双重架构设计。该模型首次成功将强化学习应用于图像生成,在多物体组合和文字渲染方面表现优异。尽管只有30亿参数,但在GenEval测试中获得0.91高分,超越多个大型竞争对手。研究团队承诺完全开源所有技术细节。