在之前的几篇博文中,我们已经探讨过非易失性存储技术将如何在嵌入式及计算类应用程序当中扮演愈发重要角色。在今年8月的文章中,我还提到英特尔的Optane存储器很也许已经拥有充足的产能,能够在成本效益、特别是价格层面与DRAM一较高下。下图所示,为我们对于磁性随机存取存储器(MRAM)、3D XPoint(英特尔Optane存储器)以及其他更为常规的NAND闪存、DRAM的发货量增长预测。
3D XPoint, MRAM, DRAM以及NAND的出货量预测(单位为PB)。
有证据表明,从最近召开的台积电线上技术研讨会以及2020年IEEE Hot Chips大会的相关演讲来看,MRAM、电阻式RAM(RRAM)以及3D XPoint存储器的使用规模正在增长。此外,人工智能芯片厂商Ambiq公司也公布了其最新一代Apollo片上系统(SoC),表示将在架构设计中使用MRAM。
先从台积电说起,Kevin Zhang在线上技术研讨会中谈到了该公司的最新发展,包括7纳米、5纳米甚至3纳米半导体技术。此外,该公司的年度报告还提出一系列重要见解,探讨台积电将如何在嵌入式产品中使用新兴非易失性存储器技术。
台积电提出的物联网平台低功耗AI概念
该公司在年度报告中提到,台积电的22纳米电阻式RAM(RRAM)已经于2019年开始试产阶段中的风险生产,预计将在2020年完成IP可靠性认证。作为一项重要前提,该公司的40纳米RRAM消费级产品已经得到良好认可,并在低成本物联网微控制器MCU与AI存储器设备中发挥重要作用。
22纳米嵌入式磁性随机存取存储器(MRAM)技术IP有望在2020年完成可靠性认证。此外,台积电方面的16纳米MRAM也在开发当中且进展良好。预计eFlash式MRAM将在2021年第四季度进入风险生产阶段,而SRAM式MRAM则将在2022年第四季度面世。台积电公司认为,MRAM将凭借更高的可靠性在AI、物联网及车载AEWC-Q100 Grade-1等应用场景的MCU中全面取代eFlash。
作为台积电的客户之一,Ambiq公司正在开发新型芯片,旨在让下一代依靠电池供电的语音识别物联网终端设备始终处于运作状态。该公司的第四代Apollo SoC系列已经为超低功耗智能端点物联网设备建立起新的标准。Apollo 4采用台积电提供的22纳米ULL(超低漏电)工艺,同时配备具有浮点单元(FPU)与Arm Artisan物理IP的32位Arm Cortex-M4内核。
这款SoC芯片使用具备浅度睡眠电流模式的MRAM存储器,实现了低至3毫安/MHz的功耗水平,且配备有支持TurboSPOT(亚阈值功耗优化技术,简称SPOT)并在2D/2.5D架构下最高可达192MHz时钟频率的图形加速器,以及包含两条通道(单通道最高500 Mbps传输能力)的MIPI DSI 1.2。
下图所示,为这块芯片的设计框图,可以看到其中包含2MB MRAM以及高达1.8MB的SRAM。黄色部分的BLE Radio模块仅限于该芯片的蓝牙版本。
Ambiq Apollo4 SoC配置性能框图。
Ambiq方面表示,Apollo 4拥有充足的计算与存储资源,能够处理复杂的算法与神经网络,同时显示出生动、清晰且平滑的图形。如果需要额外的存储器,则可通过Ambiq提供的多位SPI及e.MMC接口实现。
根据Ambiq公司的介绍,Apollo 4将专门作为电池供电型终端设备的应用处理器与协处理器,具体涵盖智能手表、儿童手表、健身带、动物追踪器、远距离语音遥控器、预测性健康与护理设备、智能安全设备以及智能家居设备等等。
这款芯片专门用于支持需要持续提供在线语音处理功能的智能终端物联网设备。
在2020 IEEE Hot Chips大会上,也出现了不少跟新兴存储器相关的有趣公告。英特尔方面发表了关于Ice Lake服务器产品相关的演讲,介绍称其总存储器加密(TME)机制将使用AES-XTS-128位加密技术对DRAM中的数据进行加密。他们还提到,英特尔Optane Persistent 200系列(Barlow Pass)存储器也将正式投入使用。
英特尔方面还介绍了新系列在延迟与一致性层面的优化效果,表示这些优化将进一步提升现有产品对于包括Optane在内的各类存储器的使用效果。英特尔还特别强调称,其能够最大程度降低持久性存储器对于性能的衰乱。在Tiger Lake主题演讲中,英特尔还将非易失性存储器视为处理器家族之间的一种差异化因素,并提到未来的计算系统必然需要与新的高容量、低功耗与低延迟存储器紧密结合起来。
英特尔对于计算与存储器间的未来结合方式提出规划愿景。
IBM公司谈到,他们面向超级计算机用例的最新一代POWER 10处理器(由三星7纳米代工厂负责制造)中同样包括对非易失性存储器(SCM)的支持。如下图所示,其中的开放存储器接口(OMI)将为DIMM插槽(类似于Optane DIMM)提供高容量且经过加密的持久性存储器资源。蓝色巨人表示,POWR 10能够实现对高达2 PB容量的负载/存储内存进行寻址。
用于IBM POWER 10芯片中的存储型内存。
IBM公司还发现,使用开放式一致性加速器接口(OPpenCAPI)能够将高容量、经过加密的持久性SCM与FPGA或基于ASIC的加速器对接起来,从而为POWER 10主机带来更高传输带宽与更低延迟水平。POWER 10还能够将其他系统的内存映射为自有内存,借此将多个系统组织为集群,并以PB级规模实现各节点间的内存共享。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。