网络设备正从100G、400G迈向太比特级互联,视频处理从4K升级至8K乃至沉浸式应用,无线通信开始向6G演进,边缘侧Agentic AI也具备越来越复杂的推理能力。
这些变化共同推动嵌入式系统对内存容量和带宽提出更高要求:高速网络数据包处理、宽带RF信号处理、实时图像增强等任务,都需要比上一代更大的内存资源。

01 HBM为何在边缘侧“水土不服”?
与数据中心不同,嵌入式系统无法通过增加服务器节点、扩展机架来缓解内存压力。无论是专业摄像机、遵循OCP 3.0标准的智能网卡,还是PXI模块化测试仪器,都必须在有限的PCB空间内兼顾功耗、散热、尺寸和可靠性。
这使得行业面临着架构级矛盾。应用需求持续增长,系统物理空间却几乎没有扩展余地。如何在有限空间内提升内存容量和带宽,同时控制功耗、成本和设计复杂度,成为嵌入式系统设计的核心挑战。
借鉴数据中心的发展路径,引入HBM被业界认为是可行方案。然而,随着产品落地,HBM与嵌入式应用之间的矛盾也越来越明显。
其一是生命周期不匹配。工业控制、医疗设备等产品通常需要10至15年的持续供货,而HBM受数据中心市场驱动,产品迭代速度快,一旦某代器件停产,整个平台都可能面临重新设计。
其二是环境适应能力不足。大量工业级设备需要支持宽温,甚至需要低温环境运行,而现有HBM产品普遍难以满足工业级宽温认证要求,限制了其在关键场景中的应用。
其三是成本结构失衡。HBM依赖CoWoS、硅中介层等先进封装工艺,不仅制造成本高,还受到先进封装产能的限制。数据中心可以依靠大规模部署和高算力利用率摊薄成本,但嵌入式产品出货规模相对有限,更关注成本、功耗、尺寸和长期可靠性,HBM带来的高性能很难转化为相应的商业价值。
归根结底,对于嵌入式市场而言,需要的并非是数据中心的内存方案,而是能够在容量、带宽、尺寸、功耗、成本,以及长期供货之间实现平衡的新型内存架构。
02 MoP封装重塑“功耗、空间、性能”铁三角
面对行业的困境,AMD 最近推出了第二代 AMD Versal Premium MoP(Memory on Package,封装上内存)自适应SoC。

第二代 AMD Versal Premium Memory on Package( MoP )器件
其实,该器件并没有沿用 HBM所依赖的硅中介层和CoWoS 先进封装,而是采用“有机基板+无硅中介层”的 MoP 封装工艺,将符合JEDEC 标准的LPDDR5X 内存直接集成到自适应SoC封装内部。

这种路线选择源于嵌入式市场与数据中心截然不同的需求。AMD自适应与嵌入式计算事业部 高级产品管理经理Mike Rather强调,CoWoS成本高、先进封装产能紧张,更适合服务数据中心。而MoP则面向嵌入式系统对空间、功耗和成本的需求,重新定义了系统级内存集成方案。
从物理结构来看,第二代AMD Versal Premium MoP在封装顶部集成最高1.5M LUT 的计算芯片,底部则通过有机基板与四颗 LPDDR5X 组件直接互连。
具体来说,这一设计带来的价值首先体现在容量、带宽与空间的突破上。传统离散内存方案需要将计算芯片和外部内存颗粒分别焊接在PCB上,内存器件及高速布线占据了大量板级空间。
以第二代 AMD Versal Premium MoP的典型高性能系统为例,其采用分立方案(2VP3602 器件搭配8颗32bit LPDDR5X)时,整板面积约为107mm×74mm。而采用第二代AMD Versal Premium MoP(2VP3622)后,封装尺寸缩减至55mm×57.5mm,板级面积减少约60%。

更重要的是,这种缩减并非以牺牲性能为代价。2VP3622在LPDDR5X-9000配置下,仍可提供32GB内存容量和288GB/s内存带宽,似的容量、带宽与空间利用率的同步提升。
正因如此,PCIe HHHL(半高半长)插卡、OCP 标准网卡、企业级 EDSFF存储设备,以及各类小型化定制系统,都拥有了更大的设计空间。
相比空间节省,更大的改变来自开发流程。在传统高速DDR接口开发中,从器件选型、原理图设计,到电源完整性(PI)、信号完整性(SI)分析,再到高速PCB布线和板级验证,每一步都需要大量工程投入。
这其中,高速DDR布线往往还需要增加 PCB 层数,不仅推高制造成本,也增加了信号调试和反复流片的风险。
然而,第二代 AMD Versal Premium MoP将LPDDR5X 与计算芯片直接集成在同一封装内,并在出厂前完成内存互连及相关验证。封装内部互连间距仅0.4mm,对外引脚间距则达到0.92mm,可直接适配标准PCB 工艺。
这意味着,工程师无需再自行完成高速内存接口的设计、布线和调试,开箱即是已经验证完成的完整内存子系统,而非需要重新集成的内存颗粒。相比采用分立内存重新开发硬件平台,工程师可以省去高速DDR接口开发和验证环节,节省开发时间,缩短产品上市周期。

对于嵌入式系统来说,开发效率只是产品价值的一部分。工业控制、通信设备,以及关键基础设施等应用往往需要持续运行十年以上,相比峰值性能,用户企业更加关注产品能否长期稳定运行,以及核心器件能否持续供应。
其实,第二代 AMD Versal Premium MoP采用了符合JEDEC 标准的LPDDR5X,AMD能够提供超过15年的产品生命周期支持,使产品无需随着HBM快速迭代而被迫重新设计,从而降低因内存停产带来的平台维护成本。
除了可靠性和生命周期,MoP的封装结构本身还带来了额外的安全优势。由于内存芯片与计算核心集成在同一封装内,外部难以直接探测或接入内存信号,天然缩小了硬件层面的攻击面。
在此基础上,该器件通过进一步集成DDR内存加密(无需占用可编程逻辑资源)、PCIe 6.0 IDE 完整性保护与数据加密,以及硬化的400G高速加密引擎,可对静态数据和传输中的数据提供全链路保护,在保证吞吐性能的同时,满足金融等敏感行业的安全与合规要求。
03 深水区博弈:应用场景与供应链“新解法”
第二代AMD Versal Premium MoP在架构层面重新平衡了容量、带宽、尺寸和开发效率,而检验这套方案价值的,却需要落到具体应用场景中。
广播视频与测试测量,正是目前典型的两类场景。
其中,广播视频正在向IP化、智能化快速演进。新一代专业摄像机不仅需要同时处理多路4K、8K视频流,还要支持ST 2110确定性IP网络传输,并在边缘端完成目标检测、内容分析等AI推理任务。在有限的机身体积内,既要容纳更大的内存容量,也要集成更多计算资源,板级空间已经成为新的瓶颈。
测试测量领域同样如此。以PXI平台为例,厂商需要在标准3U PXI机箱内完成5G、6G宽带信号采集、深度缓存,以及高速回放,同时还要不断缩短新品研发周期。在固定尺寸下,每节省一块PCB面积,都意味着可以集成更多模拟前端、接口或计算资源。
面对这些场景,Mike Rather强调,不同应用有不同答案。例如,高端示波器更依赖持续的数据缓冲能力,因此需要容量和带宽兼顾;而网络设备、更紧凑的边缘计算平台,则更加看重有限空间内能够集成多少计算资源。MoP的价值是在容量、带宽、尺寸以及开发效率之间重新建立平衡,让不同类型的系统能够根据自身需求完成取舍。
另外,还值得注意的是,第二代AMD Versal Premium MoP并非完全重新设计的新平台,而是建立在第二代Versal Premium已经完成验证的架构基础之上。其绝大部分第二代的 Versal Premium IP,以及封装上内存的IP,都已经在 Versal Premium 的平台上获得了验证,所以MoP更多是在成熟平台上完成内存集成创新,这也是其能够进一步缩短开发周期的重要原因。

除了产品设计本身,在供应链方面,过去几年,大模型训练持续推高HBM与高性能内存需求,整个存储产业链的资源不断向数据中心领域倾斜,嵌入式行业也因此承受越来越大的采购压力。
对此,AMD正在发挥另一层价值。
由于采用符合JEDEC标准的LPDDR5X,并完成多家内存供应商的兼容性验证,AMD可以统一完成LPDDR5X的采购、验证和封装,再将完整器件交付客户。这意味着,客户采购的不再是FPGA与内存颗粒,而是已经完成系统级验证的计算平台。
对于很多嵌入式企业而言,这不仅减少了高速内存设计的工作量,也降低了单独采购LPDDR5X、进行兼容性验证以及应对供应波动的复杂度。
某种程度上,MoP所带来的不仅是新的封装,也是新的供应模式。
04 写在最后:后摩尔时代,更重要的是“工程平衡”
事实上,AMD并没有将MoP定义为唯一的发展方向。
此次更新的第二代Versal Premium系列,同时提供了采用传统外部内存方案的版本,支持最高4条RDIMM、超过512GB DDR5容量,以满足更大容量和灵活扩展需求;MoP版本则针对空间受限、开发周期敏感以及长期部署的嵌入式应用。

根据产品路线图,第二代Versal Premium非MoP版本样片已经推出,计划于2026年底量产;MoP版本样片预计于2026年第四季度供货,大规模量产则计划于2027年第三季度启动。
回顾半导体的发展历程,计算与存储之间的距离始终在不断缩短。从板级离散内存,到数据中心采用的HBM与CoWoS,再到将LPDDR5X集成进封装的MoP,每一次变化的背后,都对应着不同应用场景对系统架构提出的新要求。
这也意味着,MoP的价值并非在于取代HBM,也不是为了盲目追求最先进的封装技术,而是在嵌入式应用的现实需求下,为系统架构提供另一种选择。
随着边缘AI、物理AI、高速网络、工业自动化,以及专业视频系统不断提升对内存容量和带宽的需求,传统板级内存架构正在逼近空间和成本的双重瓶颈。第二代AMD Versal Premium MoP给出的答案,就是在成熟工艺、长期供货、开发效率和系统集成之间寻找新的工程平衡。
对于如今的嵌入式计算而言,这种面向应用场景的平衡,或许比单纯刷新性能参数,更加重要!
好文章,需要你的鼓励
开源AI智能体OpenClaw今日宣布正式推出iOS和Android应用。用户可通过手机连接OpenClaw Gateway路由层,调用AI智能体及其工具完成各类任务,涵盖编程、餐饮规划等场景。OpenClaw此前因MoltBook社交媒体实验走红,其创始人Peter Steinberger已于今年2月加入OpenAI。尽管MoltBook事件后来被揭露部分由真人假扮智能体,此次移动端上线标志着AI智能体正加速渗透日常生活。
多智能体AI系统常因无法精准定位错误来源而难以优化,GBC通过梯度计算为每个AI的输出建立影响力评分,实现跨智能体的精细归因与针对性提示词优化。
AMD 最近推出了第二代 AMD Versal Premium MoP(Memory on Package,封装上内存)自适应SoC。
香港大学与字节跳动研究团队提出"桥接动作"概念,通过只学习人类手腕的平移轨迹(丢弃噪声大且易误导机器人的旋转信息),实现从人类操作视频向双臂机器人的高效技能迁移。