本周在IEEE国际电子元件会议上,IBM研究院(IBM Research)公布了在“计算内存架构”方面所取得的一项突破性成果,该架构可以为混合云平台中的人工智能计算工作负载实现卓越的性能水平。

研究人员开发出了号称第一个嵌入式磁阻随机存取存储器(Magnetoresistive Random-Access Memory)技术,采用14纳米架构,并称其是Spin Transfer Torque MRAM(STT-MRAM),这一新架构有助于解决数据密集型混合云和AI工作负载中的关键内存瓶颈。
IBM在博客文章中表示,随着企业将那些要求最苛刻的工作负载迁移到混合云平台,他们将面临“计算内存瓶颈”的问题,这是由于系统中处理器比现有内存系统速度快得多而导致内存短缺的问题。
IBM表示,这种新型STT-MRAM架构可以解决内存和处理器之间的瓶颈,实现更高的内存性能。
STT-MRAM利用电子自旋将数据存储在磁畴中,并将静态RAM的高速度与传统DRAM的更高密度结合在一起,从而提供了一种更可靠的内存架构。IBM表示,最后一级CPU缓存中部署STT-MRAM,将可以减少数据密集型工作负载所需的内存读写操作,从而降低系统延迟和功耗,同时增加带宽。
IBM在今日发表的白皮书中称,这项14纳米嵌入式STT-MRAM CMOS技术是有史以来最先进的MRAM系统,将为混合云中的AI工作负载提供一个“效率更高、性能更高的系统”。
IBM在另外一份白皮书详细介绍了这个新型架构所使用的高级磁性材料,这种材料让STT-MRAM系统具有更高的密度,存储量是原来的两倍,从而大大提高了数据恢复性能。
IBM还透露了有关“模拟内存计算”研究的最新信息,这种技术将计算和内存结合到单一设备中,用于处理要求更为苛刻的AI工作负载。IBM说,这种专有硬件可以用于训练越来越复杂的AI模型,能效大幅提升。
打造用于AI的专用模拟内存计算硬件,面对的挑战之一,就是“突触权重映射问题”。突触权重用于指示神经网络中两个节点之间的连接强度,需要将其精确地映射到模拟非易失性内存设备上,以实现深度学习推理,但做到这一点面临巨大挑战,IBM说.
IBM在第一份题为《相变内存设备中进行深度学习推理编程的突触权重精确度》白皮书中讨论了依赖于脉冲编码调制的、基于模拟电阻的存储设备如何用于解决这一映射难题,并描述了一种通过分析和通过阵列级实验准确映射突触权重的方法。
在另外一份题为《“无辅助的真实模拟神经网络训练芯片》的白皮书描述了IBM模拟神经网络芯片的概念,其本质上是一种“电阻处理单元”(RPU),具有出色的实时性能,堪比同类的数字系统,从而在运行AI推理时可实现承诺的“模拟优势”。
好文章,需要你的鼓励
大众汽车旗下ID. Polo与Cupra Raval已在西班牙马托雷尔工厂正式下线投产。两款车型起售价分别为24,995欧元和26,000欧元,均基于MEB+平台打造,搭载37kWh或52kWh电池组,续航里程最高可达454公里。这是大众"电动城市车家族"系列的首批产品,预计今年夏末秋初开始交付。大众集团通过跨品牌资源整合,实现约6亿欧元的成本节约,后续还将推出ID. Cross等新成员。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
三星宣布将于6月8日起为Samsung Health应用推出重磅功能更新,赶在Galaxy Watch 9传闻发布之前落地。新版本将引入多项AI驱动的生物特征分析功能,包括:综合心率、血氧、皮肤温度等数据的每日活力评分(Vitals)、结合体成分数据评估长期心脏健康的心脏健康评分、优化训练强度的每日有氧负荷追踪,以及横向对比用户群体的健身指数。此外,应用界面将重新划分为睡眠、营养、活动、正念和体征五大板块,并新增抗氧化指数、年龄指数和听力保护等个性化功能。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。