7月11日,浪潮信息联合英特尔发布面向生成式AI领域创新开发的新一代AI服务器NF5698G7。该AI服务器支持8颗OAM高速互联的Gaudi2加速器,具备高性能、高扩展、高能效和开放生态等优点,将为AI客户提供强大的大模型训练和推理能力。

浪潮信息NF5698G7
浪潮信息NF5698G7在6U空间支持8颗基于开放加速模组OAM高速互联的Gaudi2 AI加速器,每颗Gaudi2芯片配置96GB HBM高速内存,共提供2.1Tbps的P2P互联带宽,支持全互联拓扑,满足大模型训练张量并行的通信需求;搭载2颗第四代至强处理器,支持AMX/DSA等AI加速引擎。Gaudi2是英特尔推出的深度学习加速器,以多方位性能与能效比提升,为业界提供了高性能、高性价比的AI算力选项,在MLPerf的GPT-3、ResNet-50、Unet3D、BERT等基准测试中,均取得了优异的性能表现。
NF5698G7采用高扩展设计,支持12个PCIe5.0 X16的IO扩展,最大支持4800Gbps节点间互联带宽,满足大模型流水线并行和数据并行的通信需求,可扩展至万卡AI集群。NF5698G7通过精细化分区、智能散热调控、12V & 54V N+N双输入供电等创新设计,实现高功率负载动态匹配和低电源功率损耗,系统功耗降低8%。
NF5698G7基于全球开放计算OCP开放加速器规范 OAM/UBB进行产品设计,支持PyTorch、TensorFlow等主流AI框架和Megatron/DeepSpeed等流行开发工具,为生成式AI提供成熟、高性价比的开放生态产品方案。NF5698G7支持浪潮信息的AI算力资源平台AIStation,通过对计算资源、数据资源、深度学习软件栈资源进行统一管理,有效提升大模型算力平台的使用效率,助力客户加速AI大模型开发与部署。
浪潮信息高级副总裁、AI&HPC产品线总经理刘军表示:“NF5698G7为生成式AI应用提供了极具吸引力的AI算力平台,我们与英特尔紧密协作,优化了NF5698G7在多种生成式AI场景的性能表现,为AI客户提供强大的大模型训练和推理能力,加速AIGC创新步伐、赋力生成式AI产业创新。”
英特尔执行副总裁兼数据中心与人工智能事业部总经理Sandra Rivera表示:“英特尔致力于提供基于至强处理器和 Gaudi 深度学习加速器的业界领先的人工智能解决方案,以及开放、安全且易于编程的软件,降低AI应用门槛,让AI惠及所有人。对寻求高性能和高性价比的客户来说,浪潮信息 NF5698G7 是绝佳选择。我们将继续与浪潮信息合作,在人工智能时代不断创新。”
浪潮信息是全球领先的AI服务器厂商。据IDC数据报告显示,浪潮信息在中国AI服务器市场份额连续六年保持第一。
好文章,需要你的鼓励
微软宣布未来四年将在阿联酋投资152亿美元,包括首次向该国运输最先进的英伟达GPU芯片。美国已授权微软向阿联酋出口英伟达芯片,使该国成为美国出口管制外交的试验场和地区AI影响力锚点。这笔投资包括2023年以来的73亿美元支出和2026-2029年的79亿美元计划投入,涵盖数据中心建设、人才培训和AI基础设施扩展,目标到2027年培训100万当地居民。
特拉维夫大学研究团队开发了SAEdit方法,使用稀疏自编码器实现精确的AI图像编辑控制。该技术能像调节音量一样精确控制编辑强度,实现从微笑到大笑的连续调节,同时确保编辑的高度解耦性,避免意外修改其他图像元素。方法具有出色的通用性,可应用于多个AI图像生成平台,为图像编辑领域带来重大突破。
OpenAI与亚马逊云服务签署七年380亿美元协议,在微软Azure之外增加另一个超大规模云服务商来满足其不断增长的AI计算需求。该协议将让OpenAI立即获得AWS EC2 UltraServers访问权限,计算能力将在未来七年内扩展至数千万个CPU。AWS还将为OpenAI构建基于英伟达Blackwell芯片的定制基础设施。尽管签署了这一大额协议,OpenAI仍将继续依赖微软Azure作为其主要云计算合作伙伴。
Code4Me V2是荷兰代尔夫特理工大学开发的开源AI编程助手平台,专为学术研究设计。它解决了商业AI编程工具透明度不足、无法获取交互数据的问题,提供了模块化架构和完整的数据收集框架。该工具性能可媲美商业产品,代码补全延迟仅186.31毫秒,同时支持内联补全和聊天功能。通过透明、可控制、可扩展的设计,为AI辅助编程研究提供了重要的基础设施平台。