英伟达公司今日宣布,其Blackwell芯片已在台湾积体电路制造公司的亚利桑那工厂进入批量生产阶段。
这一消息标志着这家显卡制造商将更多供应链引入美国的努力取得了重大里程碑。这些图形处理器是当前人工智能模型和应用热潮的主要驱动力。
作为全球最大的代工芯片制造商,台积电去年年底在凤凰城附近开设了首家工厂。该工厂生产基于公司四纳米制造工艺的处理器。该工艺比台积电最新的二纳米技术落后两代,二纳米技术计划于今年晚些时候进入大规模生产。
英伟达并不是该工厂的首个客户。去年年底,据报道苹果公司开始使用该工厂生产为其2022年iPhone系列提供动力的A16仿生系统级芯片。
英伟达首席执行官黄仁勋今天参观了该工厂,并在现场生产的第一块Blackwell晶圆上签名。黄仁勋表示:"这是美国近代历史上第一次由最先进的工厂在美国本土制造最重要的芯片。"
Blackwell架构相比英伟达上一代Hopper芯片设计引入了多项改进。其中包括内置Transformer引擎的新版本,这是一个专为运行大语言模型而优化的模块。英伟达还添加了一个名为解压缩引擎的组件,旨在加速数据库查询。
Blackwell架构是多款英伟达芯片的基础。最先进的产品Blackwell Ultra可为AI工作负载提供15 petaflops的性能。英伟达还将该架构集成到多款消费级显卡和为其新推出的DGX Spark工作站提供动力的芯片中。
台积电计划在本十年末在亚利桑那州再建设两座工厂。其中一座将能够生产基于公司即将推出的A16工艺的芯片,这是其二纳米工艺的计划继任者。该技术将采用增强的电源传输布线和由纳米片制成的晶体管。
英伟达与台积电的合作是一项涉及其他供应商的广泛制造计划的一部分。
在亚利桑那州,这家显卡制造商将与日月光科技和矽品精密工业合作生产芯片封装。这是英伟达用来将Blackwell芯片的不同组件连接成单一产品的技术。该公司的旗舰显卡包含两个独立的计算芯片和HSM内存模块。
在德克萨斯州,英伟达将与合作伙伴建设两个"超级计算机制造工厂"。该公司销售名为DGX系列的AI设备产品线,可以组装成超级计算机。英伟达预计这些工厂将在未来12至15个月内开始大规模生产。
Q&A
Q1:Blackwell芯片有什么特点和优势?
A:Blackwell架构引入了多项改进,包括新版本的内置Transformer引擎,专为运行大语言模型而优化,还添加了解压缩引擎来加速数据库查询。最先进的Blackwell Ultra可为AI工作负载提供15 petaflops的性能。
Q2:台积电亚利桑那工厂使用什么制造工艺?
A:台积电亚利桑那工厂使用四纳米制造工艺生产处理器。该工艺比台积电最新的二纳米技术落后两代,而二纳米技术计划于今年晚些时候进入大规模生产。
Q3:英伟达在美国还有哪些制造计划?
A:除了与台积电合作外,英伟达还将在亚利桑那州与日月光科技和矽品精密工业合作生产芯片封装,在德克萨斯州建设两个超级计算机制造工厂,用于生产DGX系列AI设备,预计12至15个月内开始大规模生产。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。