今年是首款商用现场可编程门阵列( FPGA )诞生 40 周年,其带来了可重编程硬件的概念。通过打造“与软件一样灵活的硬件”,FPGA 可重编程逻辑改变了半导体设计的面貌。这是开发人员第一次能在设计芯片时,如果规格或需求在中途、甚至在制造完成后发生变化,他们可以重新定义芯片功能以执行不同的任务。这种灵活性令新芯片设计的开发速度更快,从而缩短了新产品的上市时间,并提供了 ASIC 的替代方案。
FPGA 对市场的影响是惊人的。FPGA 催生了一个价值超过 100 亿美元的产业。过去四十年来,我们已向不同细分市场的超过 7,000 家客户交付了超过 30 亿颗 FPGA 和自适应 SoC(结合 FPGA 架构与片上系统和其他处理引擎的器件)。事实上,我们已连续 25 年位居可编程逻辑市场份额的领先地位,并且我们相信,凭借我们强大的产品组合和产品路线图,我们有能力继续保持市场领先地位。
加速创新
FPGA 是由已故的 Ross Freeman 发明的,他是赛灵思公司(现为 AMD 的一部分)联合创始人,也是一位工程师与创新者。Freeman 认为,除了标准的固定功能 ASIC 器件之外,一定存在一种更好、更经济高效的芯片设计方法。FPGA 为工程师提供了随时更改芯片设计的自由和灵活性,以在一天内开发和设计出定制芯片的能力。FPGA 还助力开创了“无晶圆厂”商业模式,彻底改变了整个半导体行业。通过消除对定制掩膜加工和相关的非经常性工程成本的需求,FPGA 助力加速硬件创新,证明企业不需要拥有晶圆代工厂来打造突破性的硬件——他们只需愿景、设计技能与 FPGA。
Ross Freeman(右)鸟瞰 XC2064 布局
(全球首款商用 FPGA XC2064 具备 85,000 个晶体管、64 个可配置逻辑块和 58 个 I/O 块。相比之下,今天最先进的 AMD FPGA 器件(例如 Versal Premium VP1902 )集成了 1,380 亿个晶体管、1,850 万个逻辑单元、2,654 个 I/O 块、至多 6,864 个 DSP58 引擎,以及用于内存、安全和接口技术的丰富硬 IP。)
自全球首款商用 FPGA( XC2064 )出货以来的 40 年里,FPGA 已在电子领域无处不在,并深深融入到日常生活中。如今,包括 FPGA、自适应 SoC 和系统模块( SOM )在内的自适应计算器件已遍布于从汽车、火车车厢与交通信号灯到机器人、无人机、航天器与卫星到无线网络、医疗和测试设备、智慧工厂、数据中心甚至高频交易系统等各个领域。
关键创新与产品里程碑
过去 40 年来,AMD 的创新和不断演进的市场需求推动 FPGA 技术取得了许多惊人的突破。
Vivado 和 Vitis 软件的推出对推动市场扩张具有重要意义。Vivado 软件通过高层次综合、机器学习优化和无缝 IP 核集成等高级功能,支持开发人员简化工作流程、缩短开发周期并实现更高的性能。
Vitis 开发环境带来了预优化的工具和抽象层,以助力加速 AI 推理。最新版本( 2024.2 )包含多项新功能,例如,面向嵌入式 C/C++ 设计的独立工具,以及简化搭载 AI 引擎的 AMD Versal 自适应 SoC 的使用的增强功能。我们持续投入于这些工具领域,令用户工作更加高效,同时能够利用新的和日益演进的数据类型与 AI 模型。
FPGA 技术的演变
边缘 AI
如今,大部分 AI 工作负载都在数据中心 GPU 上运行。然而,越来越多的 AI 处理发生在边缘。FPGA 技术居于各行各业 AI 融合应用快速增长的前沿。FPGA 和自适应 SoC 能实时提供针对传感器数据的低时延处理,从而加速边缘端 AI 推理。随着近来小型生成式 AI 模型的推出,我们可以看到“ChatGPT 时刻”即将来到边缘端,这些新的 AI 模型可以在边缘设备上运行,无论是在 AI PC 、在您的车辆中、在工厂机器人、在太空还是任何嵌入式应用中。
以下仅列举了 AMD 自适应计算技术目前如何支持边缘 AI 工作负载的几个示例:
展望未来
我们看到,基于 FPGA 的自适应计算正持续推动边缘 AI 应用的突破,这些应用涵盖自动驾驶、机器人和工业自动化、6G 网络、气候变化、药物研发、科学研究以及太空探索等领域。值此 FPGA 诞生 40 周年之际,我们为发明这项技术感到无比自豪,并回顾其发展历程及其在此后 40 年的巨大影响。致力于开发尖端和市场领先产品的开发人员持续运用 FPGA 技术推动创新芯片设计、支持硬件辅助验证并加快产品上市时间。AMD 致力于在未来数十年引领这项卓越技术的演进。
好文章,需要你的鼓励
Amazon旗下秘密研发机构Lab126新成立团队,专注在机器人上嵌入自主代理AI,实现通过自然语言完成复杂任务,从而提升仓储物流与配送效率,同时开发高精度地图技术。
这项研究介绍了一种新型多模态扩散模型,能够同时生成量子电路的离散结构和连续参数。由因斯布鲁克大学和NVIDIA公司研究人员开发,该模型利用两个独立但协同工作的扩散过程处理门类型选择和参数预测,克服了传统量子电路编译方法的效率瓶颈。研究证明了该模型在不同量子比特数量、电路深度和参数化门比例下的有效性,并通过快速电路生成创建了数据集,从中提取出有价值的结构见解,为量子电路合成提供了新方向。
SenseFlow是香港科技大学等机构联合开发的文本到图像蒸馏技术,解决了大型流匹配模型蒸馏的三大难题。研究团队提出隐式分布对齐(IDA)稳定训练过程,段内引导(ISG)优化时间步重要性分配,并设计基于视觉基础模型的判别器提升生成质量。实验表明,SenseFlow能将SD 3.5和FLUX等12B参数级模型成功蒸馏为仅需4步生成的高效版本,同时保持甚至超越原模型在多项指标上的表现,代表了AI图像生成效率提升的重要突破。