Nvidia 正在以色列北部投资约 5 亿美元,建造一台配备最新一代 Blackwell GPU 的 30 兆瓦研发超级计算机。
这个集群位于约克尼姆伊利特市附近的梅沃卡梅尔科技产业园内,占地 10,000 平方米。据 Nvidia 介绍,该设施将装配数百套采用液冷技术的 Blackwell 系统,以及 BlueField-3 SuperNIC、Spectrum-X800 和 Quantum-X800 交换机。
据了解,这台超级计算机将供 Nvidia 员工用于开发下一代数据中心技术。
具体部署的加速器数量尚未明确 - Nvidia 有多种搭载不同数量加速器的液冷 Blackwell 参考系统。但据以色列媒体报道,完整配置将包含"数千个" GPU,规模可与该国的 Israel-1 超级计算机媲美。
Israel-1 系统配备了 2,048 个 H100 加速器,通过 Nvidia 基于以太网的 Spectrum-X 系列交换机和 superNIC 连接,在科学计算方面可提供 69 (向量) 到 137 (矩阵) petaFLOPS 的峰值 FP64 性能,在 AI 应用方面可达到 8 exaFLOPS (稀疏 FP8)。
就单芯片而言,Blackwell 在大多数精度下的浮点性能是 Hopper 的 2.5 倍,在 4 位精度下可达到 5 倍。除了更高的计算性能外,Blackwell 的内存带宽也比前代产品提高了 1.66 到 2.38 倍。因此,即使加速器数量与 Israel-1 相同,新设施的整体性能也会更强。
据称系统建设始于去年,预计将在 2025 年上半年投入运营。
关于新出口规则
根据 Nvidia 的进展情况和计划部署的 GPU 数量,该公司可能会受到拜登政府最新一轮 AI 加速器出口管制的影响。
正如我们在 xAI 的 Colossus AI 超级计算机案例中看到的,Nvidia 及其合作伙伴完全有能力在几个月内部署大型系统。
根据周一公布的规则,以色列将被列为二级国家,在 2025 年至 2027 年的两年期间,高端 GPU 的进口上限为 50,000 个。
不过,这些规则将在公布后 120 天内生效,且在特朗普总统任期内可能不会继续实施。如果候任总统的政府继续推进这些计划,实施期可能会给 Nvidia 足够的时间完成集群所需的剩余发货。
另外,由于该超级计算机据信将专门用于内部研发用途,它可能不受出口限制约束或被排除在规则之外。
根据规定,计算能力相当于约 1,700 个高端 GPU 的芯片订单无需美国政府的特别许可,也不计入一个国家的芯片配额。
同时,符合美国安全标准的一级国家实体可以在世界其他国家部署其全球计算能力的 7%。
考虑到以色列与美国的密切关系,该国很可能会获得"国家验证最终用户"身份,使两年期间的进口上限提高到 320,000 个加速器。
尽管如此,这些规则已成为以色列科技公司的一大担忧,他们担心这些规则可能会削弱以色列在新兴 AI 领域的竞争能力。
好文章,需要你的鼓励
Xbox 部门推出了名为 Muse 的生成式 AI 模型,旨在为游戏创造视觉效果和玩法。这一举措反映了微软全面拥抱 AI 技术的战略,尽管游戏开发者对 AI 持谨慎态度。Muse 不仅可能提高游戏开发效率,还有望实现老游戏的现代化改造,但其实际效果和对行业的影响仍有待观察。
Sonar收购AutoCodeRover,旨在通过自主AI代理增强其代码质量工具。这项收购将使Sonar客户能够自动化调试和问题修复等任务,让开发者将更多时间用于改进应用程序而非修复bug。AutoCodeRover的AI代理能够自主修复有问题的代码,将与Sonar的工具集成,提高开发效率并降低成本。
人工智能正在推动数据中心的变革。为满足 AI workload 的需求,数据中心面临前所未有的电力消耗增长、散热压力和设备重量挑战。应对这些挑战需要创新的解决方案,包括 AI 专用硬件、可再生能源、液冷技术等。同时,数据中心还需平衡监管压力和社区关切。未来数据中心的发展将决定 AI 技术能否实现其变革性潜力。