英伟达正在考虑通过让英特尔工厂为其生产部分芯片来进一步扩大供应规模。
英伟达公司首席执行官黄仁勋在本周三举行的线上新闻发布会中表示:“英特尔对于我们使用他们的代工厂很感兴趣,我们也有兴趣考虑这个选择。”
随着游戏玩家、加密货币挖矿者和其他用户争相购买GPU,市场对Nvidia GPU呈现供不应求的状态,这也推高了英伟达GPU的零售价格上涨。GPU的严重短缺,使得买家不得不付出更高的价格购买旧型号的产品,例如英伟达GeForce GTX 1080Ti,可以用于高级游戏和图形处理,当前价格比2017年发布时的价格还要高。
但这个情况对英伟达来说不是一件坏事,上个月英伟达公布财报实现巨额利润。也就是说,这家芯片设计厂商正在试图通过扩大供应商名单和调整产品组合来提高产量,以便能够向市场交付采用了较旧的和较新工艺节点的一系列组件。
正当英伟达试图尽可能多地预订工厂产能的时候,英特尔正在投资数十亿美元在美国和欧洲建造先进的工厂,供需双方一拍即合。
多样化的力量
黄仁勋表示:“我们已经构建了工艺节点数量的多样性,认证了越来越多的工艺节点,晶圆厂比以往任何时候都要多,过去两年中,我们的供应规模扩大了四倍。”
这一点符合英伟达同时售卖多代GPU的计划。在疫情爆发和流行期间,英伟达基于Ampere微架构和上一代Turing架构的GPU销售表现十分抢眼。
英伟达公司首席财务官Colette Kress本月早些时候在摩根士丹利的一次活动中表示:“这给了我们机会......继续销售当前一代和Turning一代。我们一直是这么做的,这样我们就可以为游戏玩家提供更多的供应量,未来类似的情况可能还会继续。这种策略通过Ampere取得了成功,未来还将继续实施下去。”
英伟达将自己的消费级GPU和企业级GPU都统一到Ampere微架构下,不过也有可能会再次将其分开。本周在GTC大会上,英伟达推出了台积电制造的、数据中心级的4nm H100 GPU,第一款基于最新Hopper微架构的芯片,而且据称英伟达正在针对消费级GPU开发单独的Lovelace架构。
Nvidia并未透露下一代消费级GPU的发布日期。Kress表示,市场对于Ampere芯片的需求尚未得到满足,向下一代游戏处理器的过渡也还要取决于实时光线追踪等技术取得的进展,目前该技术正在迅速成熟,并且被数百款游戏所采用。
Kress说:“Ampere的第二代光线追踪技术确实扩展了开发游戏的能力。三年前,当我们开始使用光线追踪时,这还是一个有关于先有鸡还是先有蛋的挑战——首先是基础设施还是游戏呢?现在答案就在这儿了。”
两位老朋友
有趣的是,黄仁勋与前VMware CEO、英特尔现任CEO Pat Gelsinger有着密切的工作关系。VMware是英伟达数据中心战略的一个重要组成部分。黄仁勋在新闻发布会上表示,英伟达将英特尔视为合作伙伴,而且英特尔在Gelsinger领导下专注于制造的战略是一个正确的选择。
他说:“我对英特尔所做的工作倍感鼓舞,我认为这是他们一个必然的前进方向,我们也有兴趣研究工艺技术。”
“我们必须在技术上达成一致,商业模式必须一致,能力必须一致,运营流程和性质必须一致,这需要相当长的时间和大量深入的讨论。”
(顺便说一句,我们不禁想起,英特尔不仅设计了自己的GPU,内置在x86芯片组中,而且还在努力模糊集成显卡和独立显卡之间的界限。单独为英伟达生产GPU对英特尔来说将是一件很重要的事情。)
英伟达与台积电和三星都有很紧密的代工合作伙伴关系,这为英伟达提供了设计和验证方面的专业知识可以让他们审视从制造到出货的芯片蓝图。英特尔必须投入到合作伙伴关系中。
和Apple一样,英伟达也和台积电有着密切的合作。两家厂商已经在合作研究如何通过捆绑一系列复杂技术来开发H100 GPU。这个容纳了800亿个晶体管芯片,采用台积电的4N工艺和芯片上晶圆基板封装技术,紧密结合HBM3 RAM和数学运算内核。
“作为一家代工厂,台积电的实力不适合胆小的人,”黄仁勋这里暗指的是英特尔。“我的意思是说,这不仅是工艺技术和资本投资上的变化,也是企业文化上的变化。”
黄仁勋说,台积电拥有与全球数百家企业在芯片设计、供应链物流和其他制造需求方面密切合作的经验,而相比之下,英特尔过去只为自己制造芯片,现在英特尔在与其他厂商合作的时候,也不得不去复制台积电的模式。
他重申:“要能和所有这些不同的运营团队、供应链团队合作,这本身并不适合胆小的人。”
要与英特尔建立生产制造上的合作伙伴关系,意味着英伟达就不得不调整自己的GPU设计,以适应英特尔的先进工艺技术,其中包括用于封装的Foveros技术,以及用于处理封装内块的高速通信链路EMIB技术。
小即是美
偏爱大型单片芯片的英伟达,也进一步阐明了自己的生产战略。
我们感觉,英伟达是支持使用小芯片的。这些是模片,包含了CPU内核、AI引擎、其他形式的硬件加速和其他IP块,并且单个芯片封装可以包含两个或多个小芯片。AMD在Zen系列微处理器中就采用小芯片。英特尔也在把自己的制造设施转向小芯片,试图吸引更多企业使用自己的制造设施。
具体来说,黄仁勋建议客户可以设计他们自己带有应用或者工作负载加速的小芯片,生产模片,并且在单个封装内和一个或者多个Nvidia GPU芯片放在一起。
黄仁勋表示:“未来我相信小芯片吗?你可以将一些很小的芯片直接连接到我们的芯片中,这样,客户只需很少的工程量就可以制作半定制的芯片,并连接到我们的芯片中,以他们自己特殊的方式数据中心使用。”
英伟达一定程度上也欢迎Universal Chiplet Interconnect Express (UCIe),一种通用语言互连,用于在芯片封装内连接各种GPU、CPU、AI引擎和其他加速器。
UCIe规范是在本月早些时候公布的,当时支持方包括英特尔、台积电、AMD和Arm,英伟达和Apple并未在列。黄仁勋本人并没有排除任何可能性。
他说:“一旦UCIe规范稳定下来,我们就会尽快将其纳入我们的芯片中。就像PCI Express 一样,需要大约五年左右的时间。”他对UCIe规范的认可,将为支持UCIe的Nvidia小芯片开辟一条途径,使其采用英特尔制造的高级节点封装。
“UCIe规范的好处是让我们能够把很多东西都连接到我们的芯片上,也让我们把我们的芯片连接到很多东西上。”
好文章,需要你的鼓励
DeepSeek 的 AI 模型在处理效率方面取得重大突破,可能对数据中心产生深远影响。尽管引发了科技股抛售,但业内专家认为,这项创新将推动 AI 应用普及,促进大规模和分布式数据中心基础设施需求增长。更高效的 AI 算法有望降低成本、扩大应用范围,从而加速数据中心行业发展。
Rivian 正全面推进 AI 技术整合,开发下一代电动车平台,以挑战特斯拉的市场地位。公司计划于 2025 年实现免手驾驶,2026 年达到 L3 级自动驾驶。Rivian 还将在车载系统中广泛应用 AI 技术,提供语音交互等功能,并计划推出更实惠的车型,扩大市场份额。
Postman 发布了 AI 代理构建器,这是一款创新的生成式 AI 工具。它允许开发者通过整合大语言模型、API 和工作流程来设计、构建、测试和部署智能代理。这一工具旨在简化 API 交互、优化工作流程,并支持创建能执行复杂任务的智能代理,标志着 API 优先的 AI 开发迈出了重要一步。
微软第二财季利润同比增长10%,人工智能年化收入达130亿美元。然而,云计算业务未达预期,下季度指引不及预期,导致盘后股价下跌。公司资本支出创新高,以满足AI和云需求。尽管Azure增长放缓,但微软对下半年增速加快持乐观态度。同时,中国AI初创公司DeepSeek的崛起引发业界对AI基础设施投资的重新审视。