人工智能计算初创公司D-Matrix Corp.今日宣布,已开发出一种全新的3D动态随机存取内存技术实现方案,承诺将推理工作负载的性能提升"数个数量级"。
这项新技术在Hot Chips 2025会议上发布,该公司展示了这一技术如何让新一代前沿模型在效率和成本效益方面实现大幅提升。
D-Matrix专门设计针对AI推理工作负载的专用处理器和计算平台。推理是指AI模型用于对从未见过的数据进行预测或生成图像和文本,从而为最终用户提供帮助和见解。
该公司的主要产品包括内存高效的基于芯片组的D-Matrix Corsair平台(全球首个数字内存计算推理加速器)和连接高性能图形处理单元集群的高带宽外围互连卡。
**芯片内存瓶颈问题**
D-Matrix表示,其计算基础设施旨在解决大规模运行AI的经济挑战。该公司认为现有数据中心基础设施是不可持续的。随着越来越多公司竞相采用日益强大的AI模型并在其基础上构建服务,它们对现有数据中心基础设施造成了巨大压力。
一些最大的云基础设施提供商,如微软和谷歌云,已承认在这种需求下面临容量限制困难。但在他们急于建设新数据中心的同时,也在提高价格来帮助支付成本,同时限制使用量以试图服务更多客户。
D-Matrix表示,内存已成为AI扩展的最大瓶颈,并认为简单地向数据中心增加更多GPU无法解决问题。在一篇博客文章中,D-Matrix联合创始人兼首席技术官Sudeep Bhoja将这个问题称为"内存墙",并指出虽然计算性能大约每两年增长三倍,但内存带宽却滞后,仅为1.6倍。
"结果是差距不断扩大,昂贵的处理器闲置等待数据到达,"Bhoja说。"这很重要,因为推理而非训练正迅速成为主导的AI工作负载。"
**突破内存墙**
D-Matrix希望帮助行业克服这一内存墙,为此决定将更高吞吐量的3D DRAM集成到其下一代芯片架构Raptor中。3D DRAM垂直堆叠多层内存单元,与传统2D DRAM相比,可实现更高的存储密度和改进的性能。它减少了空间和功耗,同时增加了数据访问速度,使其能够扩展高性能应用。
据Bhoja介绍,通过将3D DRAM与专用互连相结合,Raptor将能够突破内存墙,在AI性能和成本效率方面实现显著提升。他表示,与现有HBM4内存技术相比,公司目标是通过Raptor在运行推理工作负载时实现内存带宽10倍改进和能效10倍提升的雄心壮志。
"这些不是渐进式改进——而是重新定义大规模推理可能性的阶跃式改进,"Bhoja说。
Bhoja承认内存墙不容易克服,因为这是数十年形成的问题,但他指出公司自成立以来一直在研究这一挑战,相信终于接近解决这一问题。
"凭借我们对以内存为中心技术的承诺,D-Matrix正在开拓超越它的道路,为AI的未来构建可持续发展路径,"他说。
Q&A
Q1:什么是AI推理中的"内存墙"问题?
A:内存墙是指AI计算中内存带宽增长滞后于计算性能增长的问题。虽然计算性能大约每两年增长三倍,但内存带宽仅增长1.6倍,导致昂贵的处理器经常闲置等待数据到达,成为AI扩展的最大瓶颈。
Q2:D-Matrix的Raptor芯片架构有什么创新之处?
A:Raptor架构的核心创新是集成了3D DRAM技术,这种技术垂直堆叠多层内存单元,相比传统2D DRAM具有更高存储密度和性能。结合专用互连技术,目标实现内存带宽和能效各提升10倍。
Q3:为什么AI推理工作负载比训练更重要?
A:推理正迅速成为主导的AI工作负载,分析师预测未来2-3年内推理需求将占所有AI工作负载的85%以上。每个查询、聊天机器人响应和推荐都是大规模重复的推理任务,且都受到内存吞吐量限制。
好文章,需要你的鼓励
悉尼大学和微软研究院联合团队开发出名为Spatia的创新视频生成系统,通过维护3D点云"空间记忆"解决了AI视频生成中的长期一致性难题。该系统采用动静分离机制,将静态场景保存为持久记忆,同时生成动态内容,支持精确相机控制和交互式3D编辑,在多项基准测试中表现优异。
33年后,贝尔纳多·金特罗决定寻找改变他人生的那个人——创造马拉加病毒的匿名程序员。这个相对无害的病毒激发了金特罗对网络安全的热情,促使他创立了VirusTotal公司,该公司于2012年被谷歌收购。这次收购将谷歌的欧洲网络安全中心带到了马拉加,使这座西班牙城市转变为科技中心。通过深入研究病毒代码和媒体寻人,金特罗最终发现病毒创造者是已故的安东尼奥·恩里克·阿斯托尔加。
马里兰大学研究团队开发ThinkARM框架,首次系统分析AI推理过程。通过将思维分解为八种模式,发现AI存在三阶段推理节律,推理型与传统AI思维模式差异显著。研究揭示探索模式与正确性关联,不同效率优化方法对思维结构影响各异。这为AI系统诊断、改进提供新工具。