Nvidia 正在以色列北部投资约 5 亿美元,建造一台配备最新一代 Blackwell GPU 的 30 兆瓦研发超级计算机。
这个集群位于约克尼姆伊利特市附近的梅沃卡梅尔科技产业园内,占地 10,000 平方米。据 Nvidia 介绍,该设施将装配数百套采用液冷技术的 Blackwell 系统,以及 BlueField-3 SuperNIC、Spectrum-X800 和 Quantum-X800 交换机。
据了解,这台超级计算机将供 Nvidia 员工用于开发下一代数据中心技术。
具体部署的加速器数量尚未明确 - Nvidia 有多种搭载不同数量加速器的液冷 Blackwell 参考系统。但据以色列媒体报道,完整配置将包含"数千个" GPU,规模可与该国的 Israel-1 超级计算机媲美。
Israel-1 系统配备了 2,048 个 H100 加速器,通过 Nvidia 基于以太网的 Spectrum-X 系列交换机和 superNIC 连接,在科学计算方面可提供 69 (向量) 到 137 (矩阵) petaFLOPS 的峰值 FP64 性能,在 AI 应用方面可达到 8 exaFLOPS (稀疏 FP8)。
就单芯片而言,Blackwell 在大多数精度下的浮点性能是 Hopper 的 2.5 倍,在 4 位精度下可达到 5 倍。除了更高的计算性能外,Blackwell 的内存带宽也比前代产品提高了 1.66 到 2.38 倍。因此,即使加速器数量与 Israel-1 相同,新设施的整体性能也会更强。
据称系统建设始于去年,预计将在 2025 年上半年投入运营。
关于新出口规则
根据 Nvidia 的进展情况和计划部署的 GPU 数量,该公司可能会受到拜登政府最新一轮 AI 加速器出口管制的影响。
正如我们在 xAI 的 Colossus AI 超级计算机案例中看到的,Nvidia 及其合作伙伴完全有能力在几个月内部署大型系统。
根据周一公布的规则,以色列将被列为二级国家,在 2025 年至 2027 年的两年期间,高端 GPU 的进口上限为 50,000 个。
不过,这些规则将在公布后 120 天内生效,且在特朗普总统任期内可能不会继续实施。如果候任总统的政府继续推进这些计划,实施期可能会给 Nvidia 足够的时间完成集群所需的剩余发货。
另外,由于该超级计算机据信将专门用于内部研发用途,它可能不受出口限制约束或被排除在规则之外。
根据规定,计算能力相当于约 1,700 个高端 GPU 的芯片订单无需美国政府的特别许可,也不计入一个国家的芯片配额。
同时,符合美国安全标准的一级国家实体可以在世界其他国家部署其全球计算能力的 7%。
考虑到以色列与美国的密切关系,该国很可能会获得"国家验证最终用户"身份,使两年期间的进口上限提高到 320,000 个加速器。
尽管如此,这些规则已成为以色列科技公司的一大担忧,他们担心这些规则可能会削弱以色列在新兴 AI 领域的竞争能力。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。