D-Matrix推出3D DRAM芯片架构突破AI"内存墙"瓶颈

人工智能计算初创公司D-Matrix发布了基于3D动态随机存取存储器技术的新实现方案，承诺将推理工作负载加速"数个数量级"。该技术在Hot Chips 2025大会上亮相，展示如何让前沿模型在效率和成本方面实现大幅提升。公司针对AI推理工作负载设计专用处理器，其Raptor架构集成高吞吐量3D DRAM，目标实现10倍内存带宽提升和10倍能效改进。

人工智能计算初创公司D-Matrix Corp.今日宣布，已开发出一种全新的3D动态随机存取内存技术实现方案，承诺将推理工作负载的性能提升"数个数量级"。

这项新技术在Hot Chips 2025会议上发布，该公司展示了这一技术如何让新一代前沿模型在效率和成本效益方面实现大幅提升。

D-Matrix专门设计针对AI推理工作负载的专用处理器和计算平台。推理是指AI模型用于对从未见过的数据进行预测或生成图像和文本，从而为最终用户提供帮助和见解。

该公司的主要产品包括内存高效的基于芯片组的D-Matrix Corsair平台（全球首个数字内存计算推理加速器）和连接高性能图形处理单元集群的高带宽外围互连卡。

**芯片内存瓶颈问题**

D-Matrix表示，其计算基础设施旨在解决大规模运行AI的经济挑战。该公司认为现有数据中心基础设施是不可持续的。随着越来越多公司竞相采用日益强大的AI模型并在其基础上构建服务，它们对现有数据中心基础设施造成了巨大压力。

一些最大的云基础设施提供商，如微软和谷歌云，已承认在这种需求下面临容量限制困难。但在他们急于建设新数据中心的同时，也在提高价格来帮助支付成本，同时限制使用量以试图服务更多客户。

D-Matrix表示，内存已成为AI扩展的最大瓶颈，并认为简单地向数据中心增加更多GPU无法解决问题。在一篇博客文章中，D-Matrix联合创始人兼首席技术官Sudeep Bhoja将这个问题称为"内存墙"，并指出虽然计算性能大约每两年增长三倍，但内存带宽却滞后，仅为1.6倍。

"结果是差距不断扩大，昂贵的处理器闲置等待数据到达，"Bhoja说。"这很重要，因为推理而非训练正迅速成为主导的AI工作负载。"

**突破内存墙**

D-Matrix希望帮助行业克服这一内存墙，为此决定将更高吞吐量的3D DRAM集成到其下一代芯片架构Raptor中。3D DRAM垂直堆叠多层内存单元，与传统2D DRAM相比，可实现更高的存储密度和改进的性能。它减少了空间和功耗，同时增加了数据访问速度，使其能够扩展高性能应用。

据Bhoja介绍，通过将3D DRAM与专用互连相结合，Raptor将能够突破内存墙，在AI性能和成本效率方面实现显著提升。他表示，与现有HBM4内存技术相比，公司目标是通过Raptor在运行推理工作负载时实现内存带宽10倍改进和能效10倍提升的雄心壮志。

"这些不是渐进式改进——而是重新定义大规模推理可能性的阶跃式改进，"Bhoja说。

Bhoja承认内存墙不容易克服，因为这是数十年形成的问题，但他指出公司自成立以来一直在研究这一挑战，相信终于接近解决这一问题。

"凭借我们对以内存为中心技术的承诺，D-Matrix正在开拓超越它的道路，为AI的未来构建可持续发展路径，"他说。

Q&A

Q1：什么是AI推理中的"内存墙"问题？

A：内存墙是指AI计算中内存带宽增长滞后于计算性能增长的问题。虽然计算性能大约每两年增长三倍，但内存带宽仅增长1.6倍，导致昂贵的处理器经常闲置等待数据到达，成为AI扩展的最大瓶颈。

Q2：D-Matrix的Raptor芯片架构有什么创新之处？

A：Raptor架构的核心创新是集成了3D DRAM技术，这种技术垂直堆叠多层内存单元，相比传统2D DRAM具有更高存储密度和性能。结合专用互连技术，目标实现内存带宽和能效各提升10倍。

Q3：为什么AI推理工作负载比训练更重要？

A：推理正迅速成为主导的AI工作负载，分析师预测未来2-3年内推理需求将占所有AI工作负载的85%以上。每个查询、聊天机器人响应和推荐都是大规模重复的推理任务，且都受到内存吞吐量限制。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

D-Matrix推出3D DRAM芯片架构突破AI"内存墙"瓶颈

来源：SiliconANGLE

2025

08/26

08:30

分享

点赞

超智算完成北京核心智算中心资产收购，加速构筑“3+X”全国算力网络新格局

走出“参数崇拜”：联想用“一体多端”重塑“人的尺度”

从“单点突破”到“一体多端”：拆解天禧AI 3.5进化背后三年的进化哲学

openGauss Summit 2025在京召开，加速行业智能化变革，共建繁荣数据库生态

2025联想天禧AI生态伙伴大会：天禧AI一体多端，与开发者共建个人AI生态

西班牙病毒如何将谷歌带到马拉加

LangChain核心库曝出严重漏洞，AI智能体机密信息面临泄露风险

Mill如何与亚马逊和全食超市达成合作协议

TechCrunch创业大赛中的9家顶尖生物技术初创公司

2025年印度科技领域十大重要发展

中科大发布Live Avatar：AI数字人无限聊天不翻车

从软件定义汽车到AI驱动质控：Testin云测助力车机测试数智化价值落地

生成式AI聊天机器人正在快速发展却伤害用户心理健康

AI在高等教育中走向系统化部署

AI可能改变世界的7大希望

印尼就业平台Pintarnya获得1670万美元A轮融资

ChatGPT新手入门指南：如何开始使用这个超人气AI聊天机器人

AI监控睡眠：智能家居系统全方位升级

Meta与谷歌达成100亿美元AI云服务合作协议

Y Combinator支持的Oway融资400万美元，打造去中心化"货运版Uber"

OpenCUA开源计算机操作智能体媲美OpenAI和Anthropic专有模型

MCP-Universe基准测试显示GPT-5在超半数真实业务场景中表现不佳

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: