IBM取得内存计算突破削减人工智能训练成本

作者：ZDNet

IBM Research称，已经开发出了一种内存计算新方法，可以为微软和谷歌寻求的高性能和机器学习应用的硬件加速器提供答案。

在今天Nature Electronics期刊上发表的一篇论文中，IBM研究人员描述了这种新的“混合精度内存计算”方法。

IBM关注传统计算体系结构的不同看法，在这种体系结构中，软件需要在单独的CPU和RAM单元之间进行数据传输。

据IBM称，这种被称为“冯诺依曼”的体系结构设计，为数据分析和机器学习应用制造了一个瓶颈，这些应用需要在处理单元和内存单元之间进行更大的数据传输。传输数据也是一个耗能的过程。

应对这一挑战，IBM给出的一种方法是模拟相变内存（PCM）芯片，该芯片目前还处于原型阶段，500万个纳米级PCM器件组成500×2000交叉阵列。

PCM的一个关键优势是可以处理大多数密集型数据处理，而无需将数据传输到CPU或GPU，这样以更低的能量开销实现更快速的处理。

IBM的PCM单元将作为CPU加速器，就像微软用于加速Bing和加强机器学习的FPGA芯片一样。

据IBM称，研究表明在某些情况下，其PCM芯片能够以模拟的方式进行操作，执行计算任务，并提供与4位FPGA存储器芯片相当的准确度，但能耗降低了80倍。

模拟PCM硬件并不适合高精度计算。所幸的是，数字型CPU和GPU是适合的，IBM认为混合架构可以实现更高性能、更高效率和更高精度的平衡。

这种设计将大部分处理留给内存，然后将较轻的负载交给CPU进行一系列的精度修正。

根据IBM苏黎世实验室的电气工程师、也是该论文的主要作者Manuel Le Gallo称，这种设计有助于云中的认知计算，有助于释放对高性能计算机的访问。

Le Gallo表示：“凭借我们现在的精确度，我们可以将能耗降低到是使用高精度GPU和CPU的1/6。”

“所以我们的想法是，为了应对模拟计算中的不精确性，我们将其与标准处理器结合起来。我们要做的是将大量计算任务转移到PCM中，但同时得到最终的结果是精确的。”

这种技术更适合于如数字图像识别等应用，其中误解少数像素并不会妨碍整体识别，此外还有一些医疗应用。

“你可以用低精度完成大量计算——以模拟的方式，PCM会非常节能——然后使用传统处理器来提高精度。”

对于只有1兆字节大小的IBM原型内存芯片，现在还处于初期阶段。为了适用于现代数据中心的规模化应用，它需要达到千兆字节的内存量级，分布在数万亿个PCM中。

尽管如此，IBM认为可以通过构建更大规模的PCM设备或使其中PCM并行运行来实现这一目标。

来源：至顶网服务器频道

0赞

好文章，需要你的鼓励

CES上杨元庆首谈AGI，碾压人类的叙事不会让AI更聪明

很多人担心被AI取代，陷入无意义感。按照杨元庆的思路，其实无论是模型的打造者，还是模型的使用者，都不该把AI放在人的对立面。

人工智能

递归算法

长文本处理

2026-01-09

MIT递归语言模型：突破AI上下文限制的新方法

MIT研究团队提出递归语言模型（RLM），通过将长文本存储在外部编程环境中，让AI能够编写代码来探索和分解文本，并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度，在多项长文本任务上显著优于现有方法，同时保持了相当的成本效率，为AI处理超长文本提供了全新解决方案。

人工智能

邮件管理

功能升级

2026-01-09

Gmail新增Gemini驱动AI功能，智能优先级和摘要来袭

谷歌宣布对Gmail进行重大升级，全面集成Gemini AI功能，将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图，可按优先级自动分组邮件；"帮我快速了解"功能提供邮件活动摘要；扩展"帮我写邮件"工具至所有用户；支持复杂问题查询如"我的航班何时降落"。部分功能免费提供，高级功能需付费订阅。谷歌强调用户数据安全，邮件内容不会用于训练公共AI模型。

人工智能

代码修复

监督学习

2026-01-09

华为研究团队突破代码修复瓶颈，8B模型击败32B巨型对手！

华为研究团队推出SWE-Lego框架，通过混合数据集、改进监督学习和测试时扩展三大创新，让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率，加上扩展技术后提升至49.6%，证明了精巧方法设计胜过简单规模扩展的技术理念。

IBM取得内存计算突破 削减人工智能训练成本

来源：至顶网服务器频道

2018

04/19

14:21

分享

点赞

联想集团混合式AI实践获权威肯定，CES期间获评“全球科技引领企业”

CES上杨元庆首谈AGI，碾压人类的叙事不会让AI更聪明

CES 2026 | 重大更新：NVIDIA DGX Spark开启“云边端”模式

Gmail新增Gemini驱动AI功能，智能优先级和摘要来袭

研究发现商业AI模型可完整还原《哈利·波特》原著内容

Razer在2026年CES展会推出全息AI伴侣项目

CES 2026：英伟达新架构亮相，AMD发布新芯片，Razer推出AI奇异产品

通过舞蹈认识LimX Dynamics的人形机器人Oli

谷歌为Gmail搜索引入AI概览功能并推出实验性AI智能收件箱

DuRoBo Krono：搭载AI助手的智能手机尺寸电子阅读器

OpenAI推出ChatGPT Health医疗问答功能

Anthropic寻求3500亿美元估值融资100亿美元

EB级的数据洪流下，互联网企业如何突围？

IBM称光纤技术可以将人工智能训练时间和能耗减少80%

IBM宣布将最强大的Granite AI模型引入AWS云端

IBM谈Power11发布：“让合作伙伴手上有了更多的工具”

IBM率先采用“以量子为中心的超级计算”开展科学研究

IBM Granite 3.0模型：为大规模企业AI应用指明方向

IBM收购红帽战果卓著，将于明年年初收回成本

IBM推出Guardium数据安全中心，应对人工智能、量子计算和混合云风险

IBM在欧洲开设首处量子数据中心

IBM在“宽松的”Apache许可下发布最新Granite基础模型

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

IBM取得内存计算突破削减人工智能训练成本