在之前的几篇博文中,我们已经探讨过非易失性存储技术将如何在嵌入式及计算类应用程序当中扮演愈发重要角色。在今年8月的文章中,我还提到英特尔的Optane存储器很也许已经拥有充足的产能,能够在成本效益、特别是价格层面与DRAM一较高下。下图所示,为我们对于磁性随机存取存储器(MRAM)、3D XPoint(英特尔Optane存储器)以及其他更为常规的NAND闪存、DRAM的发货量增长预测。
3D XPoint, MRAM, DRAM以及NAND的出货量预测(单位为PB)。
有证据表明,从最近召开的台积电线上技术研讨会以及2020年IEEE Hot Chips大会的相关演讲来看,MRAM、电阻式RAM(RRAM)以及3D XPoint存储器的使用规模正在增长。此外,人工智能芯片厂商Ambiq公司也公布了其最新一代Apollo片上系统(SoC),表示将在架构设计中使用MRAM。
先从台积电说起,Kevin Zhang在线上技术研讨会中谈到了该公司的最新发展,包括7纳米、5纳米甚至3纳米半导体技术。此外,该公司的年度报告还提出一系列重要见解,探讨台积电将如何在嵌入式产品中使用新兴非易失性存储器技术。
台积电提出的物联网平台低功耗AI概念
该公司在年度报告中提到,台积电的22纳米电阻式RAM(RRAM)已经于2019年开始试产阶段中的风险生产,预计将在2020年完成IP可靠性认证。作为一项重要前提,该公司的40纳米RRAM消费级产品已经得到良好认可,并在低成本物联网微控制器MCU与AI存储器设备中发挥重要作用。
22纳米嵌入式磁性随机存取存储器(MRAM)技术IP有望在2020年完成可靠性认证。此外,台积电方面的16纳米MRAM也在开发当中且进展良好。预计eFlash式MRAM将在2021年第四季度进入风险生产阶段,而SRAM式MRAM则将在2022年第四季度面世。台积电公司认为,MRAM将凭借更高的可靠性在AI、物联网及车载AEWC-Q100 Grade-1等应用场景的MCU中全面取代eFlash。
作为台积电的客户之一,Ambiq公司正在开发新型芯片,旨在让下一代依靠电池供电的语音识别物联网终端设备始终处于运作状态。该公司的第四代Apollo SoC系列已经为超低功耗智能端点物联网设备建立起新的标准。Apollo 4采用台积电提供的22纳米ULL(超低漏电)工艺,同时配备具有浮点单元(FPU)与Arm Artisan物理IP的32位Arm Cortex-M4内核。
这款SoC芯片使用具备浅度睡眠电流模式的MRAM存储器,实现了低至3毫安/MHz的功耗水平,且配备有支持TurboSPOT(亚阈值功耗优化技术,简称SPOT)并在2D/2.5D架构下最高可达192MHz时钟频率的图形加速器,以及包含两条通道(单通道最高500 Mbps传输能力)的MIPI DSI 1.2。
下图所示,为这块芯片的设计框图,可以看到其中包含2MB MRAM以及高达1.8MB的SRAM。黄色部分的BLE Radio模块仅限于该芯片的蓝牙版本。
Ambiq Apollo4 SoC配置性能框图。
Ambiq方面表示,Apollo 4拥有充足的计算与存储资源,能够处理复杂的算法与神经网络,同时显示出生动、清晰且平滑的图形。如果需要额外的存储器,则可通过Ambiq提供的多位SPI及e.MMC接口实现。
根据Ambiq公司的介绍,Apollo 4将专门作为电池供电型终端设备的应用处理器与协处理器,具体涵盖智能手表、儿童手表、健身带、动物追踪器、远距离语音遥控器、预测性健康与护理设备、智能安全设备以及智能家居设备等等。
这款芯片专门用于支持需要持续提供在线语音处理功能的智能终端物联网设备。
在2020 IEEE Hot Chips大会上,也出现了不少跟新兴存储器相关的有趣公告。英特尔方面发表了关于Ice Lake服务器产品相关的演讲,介绍称其总存储器加密(TME)机制将使用AES-XTS-128位加密技术对DRAM中的数据进行加密。他们还提到,英特尔Optane Persistent 200系列(Barlow Pass)存储器也将正式投入使用。
英特尔方面还介绍了新系列在延迟与一致性层面的优化效果,表示这些优化将进一步提升现有产品对于包括Optane在内的各类存储器的使用效果。英特尔还特别强调称,其能够最大程度降低持久性存储器对于性能的衰乱。在Tiger Lake主题演讲中,英特尔还将非易失性存储器视为处理器家族之间的一种差异化因素,并提到未来的计算系统必然需要与新的高容量、低功耗与低延迟存储器紧密结合起来。
英特尔对于计算与存储器间的未来结合方式提出规划愿景。
IBM公司谈到,他们面向超级计算机用例的最新一代POWER 10处理器(由三星7纳米代工厂负责制造)中同样包括对非易失性存储器(SCM)的支持。如下图所示,其中的开放存储器接口(OMI)将为DIMM插槽(类似于Optane DIMM)提供高容量且经过加密的持久性存储器资源。蓝色巨人表示,POWR 10能够实现对高达2 PB容量的负载/存储内存进行寻址。
用于IBM POWER 10芯片中的存储型内存。
IBM公司还发现,使用开放式一致性加速器接口(OPpenCAPI)能够将高容量、经过加密的持久性SCM与FPGA或基于ASIC的加速器对接起来,从而为POWER 10主机带来更高传输带宽与更低延迟水平。POWER 10还能够将其他系统的内存映射为自有内存,借此将多个系统组织为集群,并以PB级规模实现各节点间的内存共享。
好文章,需要你的鼓励
这项由浙江大学与阿里巴巴通义实验室联合开展的研究,通过创新的半在线强化学习方法,显著提升了AI界面助手在多步骤任务中的表现。UI-S1-7B模型在多个基准测试中创造了7B参数规模的新纪录,为GUI自动化代理的发展开辟了新的技术路径。
阿里巴巴联合浙江大学开发的OmniThink框架让AI学会像人类一样慢思考写作。通过信息树和概念池的双重架构,系统能够动态检索信息、持续反思,突破了传统AI写作内容浅薄重复的局限。实验显示该方法在文章质量各维度均显著超越现有最强基线,知识密度提升明显,为长文本生成研究开辟了新方向。
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
腾讯混元3D 2.0是一个革命性的3D生成系统,能够从单张图片生成高质量的带纹理3D模型。该系统包含形状生成模块Hunyuan3D-DiT和纹理合成模块Hunyuan3D-Paint,采用创新的重要性采样和多视角一致性技术,在多项评估指标上超越现有技术,并提供用户友好的制作平台。作为开源项目,它将大大降低3D内容创作门槛,推动3D技术的普及应用。