全新英特尔Stratix10 GX 10M FPGA拥有1020万个逻辑单元,针对ASIC原型设计和仿真市场
本文作者:英特尔网络和自定义逻辑事业部副总裁兼FPGA和电源产品营销总经理Patrick Dorsey
早前,多家客户已经收到全新英特尔Stratix10 GX 10M FPGA样片,该产品是全球密度最高的FPGA,拥有1020万个逻辑单元,现已量产。该款元件密度极高的FPGA,是基于现有的英特尔Stratix 10 FPGA架构以及英特尔先进的嵌入式多芯片互连桥接(EMIB)技术。其利用EMIB 技术融合了两个高密度英特尔Stratix 10 GX FPGA核心逻辑晶片(每个晶片容量为510万个逻辑单元)以及相应的I/O单元。
英特尔Stratix 10 GX 10M FPGA拥有1020万个逻辑单元,其密度约为Stratix 10 GX 1SG280 FPGA的3.7倍,后者为原英特尔Stratix 10系列中元件密度最高的设备。英特尔的EMIB技术只是多项IC工艺技术、制造和封装创新中的一项,正是这些创新的存在,让英特尔得以设计、制造并交付目前世界上密度最高(代表计算能力)的FPGA。
ASIC原型设计和仿真市场对当前最大容量的FPGA需求格外急切。有数家供应商提供商用现成(COTS)ASIC原型设计和仿真系统,对于这些供应商而言,能够将当前最大的FPGA用于ASIC仿真和原型设计系统中,就意味着获得了巨大的竞争优势。
此外,包括英特尔在内的很多大型半导体公司都开发了自定义原型设计和仿真系统,并在流片前使用该系统来验证自身最大规模、最复杂、风险最高的ASSP和SoC设计。ASIC仿真和原型设计系统可以帮助设计团队大幅降低设计风险。因此,包括英特尔Stratix 10 FPGA和更早的Stratix III、Stratix IV和Stratix V设备在内的英特尔FPGA,十多年来一直被用做很多仿真和原型设计系统的基础设备。
ASIC仿真和原型设计系统支持很多与IC和系统开发相关的工作,包括:
仿真和原型设计系统旨在帮助半导体厂商在芯片制造前发现和避免代价高昂的软硬件设计缺陷,从而节省数百万美元。芯片在制造完成后修复硬件设计缺陷的成本要高得多,通常需要昂贵的重新设计费用。当设备制造出来并交付给终端客户,解决这些问题的成本甚至会更高。正因为风险如此之高,且有可能节省的费用如此之多,这些原型设计和仿真系统为IC设计团队带来了实实在在的价值。仿真和原型设计系统的使用已经越来越普及,因为在经济风险如此之高的情况下,没有哪个设计团队负责人敢于忽视这项谨慎的验证性投资。
使用最大型的FPGA,就能够在尽可能少的FPGA设备中纳入大型ASIC、ASSP和SoC设计。英特尔Stratix 10 GX 10M FPGA是用于此类应用的一系列大型FPGA系列中的最新设备。该款全新的英特尔Stratix 10 FPGA支持仿真和原型设计系统的开发,适用于耗用亿级ASIC门的数字IC设计。包含1020万个逻辑单元的英特尔Stratix 10 GX 10M FPGA,现已支持英特尔Quartus Prime软件套件。该套件采用新款专用IP,明确支持ASIC仿真和原型设计。
英特尔 Stratix 10 GX 10M FPGA是第一款使用EMIB技术并在逻辑和电气上将两个FPGA构造晶片结合到一起的英特尔FPGA,实现高达1020万个逻辑单元密度。在该设备上,数万个连接通过多颗EMIB将两个FPGA构造晶片进行连接,从而在两个单片FPGA构造晶片之间形成高带宽连接。
以前,英特尔使用了EMIB技术将I/O和内存单元连接到FPGA构造晶片,从而实现了英特尔Stratix 10 FPGA家族的规模和种类不断扩张。例如,英特尔Stratix 10 MX设备集成了8GB或16GB的EMIB相连的3D堆叠HBM2 SRAM单元。最近发布的英特尔Stratix 10 DX FPGA则集成了EMIB相连的P tile,具备PCIe 4.0兼容能力。
英特尔Stratix 10 DX FPGA中使用的P tile是兼容PCIe 4.0的PCI-SIG系统集成设备清单中的首款组件级设备。最近发布的英特尔Agilex FPGA中也同样紧密集成了同款P tile,因而也能兼容PCIe 4.0设备。英特尔Stratix 10 DX和英特尔Agilex FPGA中使用的P tile是这一应用的又一绝佳范例,它展示了诸如EMIB的先进制造和生产技术,以及如何让英特尔将一系列新产品快速推向市场,并投入全面生产。
或许更重要的是,用来制造英特尔Stratix 10 GX 10M FPGA的半导体和封装技术,并不仅仅是为了制造世界上最大型的FPGA,这只是一个附加值,尽管相当重要,但并不是最重点。
而重点在于:这些技术让英特尔能够通过整合不同的半导体晶片,包括FPGA、ASIC、eASIC结构化ASIC、I/O单元、3D堆叠内存单元和光子器件等,用于将几乎任何类型的设备整合到封装系统(SiP)中,以满足特定的客户需求。这些先进技术彼此结合,构成了英特尔独特、创新且极具战略性的优势。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。