IBM Research称,已经开发出了一种内存计算新方法,可以为微软和谷歌寻求的高性能和机器学习应用的硬件加速器提供答案。
在今天Nature Electronics期刊上发表的一篇论文中,IBM研究人员描述了这种新的“混合精度内存计算”方法。
IBM关注传统计算体系结构的不同看法,在这种体系结构中,软件需要在单独的CPU和RAM单元之间进行数据传输。
据IBM称,这种被称为“冯诺依曼”的体系结构设计,为数据分析和机器学习应用制造了一个瓶颈,这些应用需要在处理单元和内存单元之间进行更大的数据传输。传输数据也是一个耗能的过程。
应对这一挑战,IBM给出的一种方法是模拟相变内存(PCM)芯片,该芯片目前还处于原型阶段,500万个纳米级PCM器件组成500×2000交叉阵列。
PCM的一个关键优势是可以处理大多数密集型数据处理,而无需将数据传输到CPU或GPU,这样以更低的能量开销实现更快速的处理。
IBM的PCM单元将作为CPU加速器,就像微软用于加速Bing和加强机器学习的FPGA芯片一样。
据IBM称,研究表明在某些情况下,其PCM芯片能够以模拟的方式进行操作,执行计算任务,并提供与4位FPGA存储器芯片相当的准确度,但能耗降低了80倍。
模拟PCM硬件并不适合高精度计算。所幸的是,数字型CPU和GPU是适合的,IBM认为混合架构可以实现更高性能、更高效率和更高精度的平衡。
这种设计将大部分处理留给内存,然后将较轻的负载交给CPU进行一系列的精度修正。
根据IBM苏黎世实验室的电气工程师、也是该论文的主要作者Manuel Le Gallo称,这种设计有助于云中的认知计算,有助于释放对高性能计算机的访问。
Le Gallo表示:“凭借我们现在的精确度,我们可以将能耗降低到是使用高精度GPU和CPU的1/6。”
“所以我们的想法是,为了应对模拟计算中的不精确性,我们将其与标准处理器结合起来。我们要做的是将大量计算任务转移到PCM中,但同时得到最终的结果是精确的。”
这种技术更适合于如数字图像识别等应用,其中误解少数像素并不会妨碍整体识别,此外还有一些医疗应用。
“你可以用低精度完成大量计算——以模拟的方式,PCM会非常节能——然后使用传统处理器来提高精度。”
对于只有1兆字节大小的IBM原型内存芯片,现在还处于初期阶段。为了适用于现代数据中心的规模化应用,它需要达到千兆字节的内存量级,分布在数万亿个PCM中。
尽管如此,IBM认为可以通过构建更大规模的PCM设备或使其中PCM并行运行来实现这一目标。
好文章,需要你的鼓励
微软宣布为Word和Excel推出基于OpenAI的AI代理模式,通过简单提示即可自动生成文档和分析数据。Word用户可享受"氛围写作"功能,利用现有文档组装报告和提案。Excel代理能分析电子表格数据并生成可视化报告。尽管在SpreadsheetBench基准测试中准确率仅为57.2%,低于人类平均水平71.3%,但微软强调其针对实际工作场景优化。此外,微软还发布了基于Anthropic的Office代理,显示其正逐步减少对OpenAI的依赖。
北卡罗来纳大学研究团队通过深入分析手指触控过程中的动态特征,开发出新型触控识别算法,能够理解触控过程中的压力分布、接触面积变化等信息,比传统方法准确率提高15-28%。该技术采用分层处理架构解决计算效率问题,已在真实设备上验证效果,将为个性化交互、情感感知等未来应用奠定基础,有望显著改善用户的触控体验。
OpenAI为美国ChatGPT用户推出"即时结账"功能,用户可在对话中直接购买Etsy和Shopify商品,无需跳转至外部网站。该功能支持Apple Pay、Google Pay等多种支付方式,并计划接入超过100万家Shopify商户。OpenAI还将开源其代理商务协议技术,与谷歌的代理支付协议形成竞争。这标志着电商购物模式的重大转变,AI聊天机器人可能重塑在线零售发现和支付生态系统。
Perfios公司研究团队开发了创新的AI理财顾问训练框架,通过行为心理学驱动的数据生成方法,让8B参数的小模型在个人理财建议方面达到了与32B大模型相当的性能,同时运营成本降低80%。该方法首次将用户心理状态分析作为独立训练阶段,显著提升了AI建议的个性化程度和人性化表达,为普及化AI理财服务提供了技术路径。