英特尔和美光在2015年7月大张旗鼓地推出了3D XPoint,这是几十年来问世的首个新内存架构。差不多五年之后,这些芯片终于在SSD和DIMM中出货了,但光芒却不那么耀眼了。
在众多数据中心芯片新品的发布中,英特尔首次公布了Optane DIMM和专有DDR-T协议的设计细节和性能细节,这也让我们有机会了解打造一款新内存芯片的难度有多大,也给像美光和三星这样未来可能会走类似路线的竞争对手一个警示。
磁性的、电阻式的、以及像Optane这样的相变内存已经存在于实验室中有很多年时间了。但是,要在计算机内存分层中为这些技术开辟出一个新的层来说,可能要让很多公司花费多年时间才能实现。
英特尔不得不对CPU、DDR内存协议和现有DIMM设计进行改动。而且目前最大的提升仍在进行中——也就是让合作伙伴对应用软件进行改动,以便支持持久性主内存。现在,Linux和微软的服务器操作系统的改动基本已经就绪。
英特尔因为在做所有这些工作的同时还定义和提升了新内存架构的开发备受赞誉,但不幸的是,这一切都发生在DRAM和NAND价格暴跌的一年中,使得英特尔的收入和利润前景变得有些黯淡。
Objective Analysis内存市场分析师Jim Handy表示:“2015年的时候,我曾预测英特尔在推出新内存架构的两年内将获得高达20亿美元的收入,但现在这个数字可能要低得多,更现实地说,可能只有10%或者说只有2亿美元,部分原因是我们正处在内存价格崩盘期。”
他认为,英特尔可能会为了吸引用户把Optane DIMM的售价定为大约是DRAM版本的一半。但考虑到升级Optane的成本,英特尔可能是目前唯一亏损的内存芯片厂商了。
Linley Group分析师Linley Gwennap认为:“Optane DIMM原本应该在2017年与Skylake-SP处理器一同上市,但被推迟了。现在,DRAM DIMM的最大容量已经有所提高,价格大幅下滑——但问题是,DRAM发展得越来越好。”
英特尔仅披露了专有DDR-T协议的粗略细节。(来源:英特尔)
更麻烦的是,Optane DIMM的计算性能优势说起来有点复杂,可能会因为应用和可编程功率(范围在12W至18 W不等)的不同而出现差异,例如读取延迟从180到340纳秒不等。
英特尔公布了经过测试的一些特定用例,每个用例都很重要,但既不具有广泛性也没有带来任何惊喜。例如,DIMM在运行微软HyperV的服务器上可支持多出30%的虚拟机,或者可以将此类服务器的成本降低三分之一。
同样地,SAP Hana用户也可以看到重启速度提高了12.5倍,或者大型内存数据库成本降低节省39%。除此之外,英特尔并没有详细介绍给其他目标应用带来的提升,例如Memcached、实时分析和Apache Spark。
英特尔工程师表示,需要花很长的时间来探索这项新技术的潜在用途。板卡厂商将为这款DIMM设定价格,但英特尔表示,预计它在目标工作负载上的性价比是DRAM的1.2倍。
但整体来看,这并没有让分析师们感到兴奋。
Gwennap说:“性能似乎并不怎么吸引人......而且在成本更高的情况下对比性能是不公平的,有些应用程序会从中受益......但达不到你通常对新技术期望的2-4倍的提升。”
目前尚不清楚这一情况是否会随着时间的推移有所好转。英特尔也没有就今天公布的20纳米Optane芯片路线图发表评论。Handy表示,英特尔可能会在迁移到更类似DRAM的工艺之前,先过渡到15纳米工艺。
“我对英特尔所做的努力印象最深刻。这个领域的初创公司都忘了,他们需要对操作系统和应用进行改动。”
英特尔的经验可能会让那些认为自己能填补某些内存市场空白的竞争对手三思而后行。如果他们继续前行,未来的市场发生一些变化。
一位负责Optane的高管认为,未来内存市场会变得很复杂,我们将看到市场中会有很多针对不同用途的不同产品。
Optane的性能说起来有些复杂,在不同功率和不同应用的条件下,性能也是不同的。(来源:英特尔)
英特尔分享了设计上的一些有趣信息。与固态驱动器一样,Optane DIMM有自己的SRAM控制器,以及用于地址查找表的电源管理IC、电容器和DRAM。
一个CPU最多可以使用6个Optane模块,还需要一些DRAM才能启动。Optane模块需要更靠近CPU以解决信号完整性的问题。
这些办卡最多可以封装11个Optane介质芯片,其中一些用于纠错和冗余,安全密钥保存在易失性内存和非易失性内存中。
英特尔表示,介质芯片的读写周期是五年。但是,数据仅在未使用时保留约三个月。
大多数新的Xeon Platinum和Gold版本都支持DIMM,并对内存单元做了一些改动,就像是缓存控制器一样,可以智能地把更高速度的DRAM芯片作为缓存一样使用。
英特尔表示,DDR-T协议支持异步命令和时序,使Optane DIMM比传统CPU管理模块更具控制力。与DDR类似,它支持访问64-B缓存行。
Optane DIMM被设计成了类似于小号的、精简的专用SSD。(来源:英特尔)
DIMM可以使用三种编程模型,可以在不改动软件的情况下看起来更像是DRAM;可以具备非易失性内存所不具备的独特特性;或者经过操作系统和应用的改动,看起来像是一个比SSD和硬盘速度更快的块存储层。
Cascade Lake CPU首席架构师Ian Steiner表示:“并非所有系统都将使用它,有些应用不喜欢这种DIMM,没关系。有些运行表现不会变的更好,例如流媒体数据,但有很多客户关心的好应用是可以有更好的运行表现的。”
“没有真正现成的应用是支持持久性的,而且短时间内也不会有,所以它能带来的短期好处就是让你能够获得比DRAM更大的主内存,”Handy说。
英特尔将继续与SAP等应用开发商合作,改变这种状况。与此同时,谷歌或高盛等拥有深厚软件实力和内部应用的企业可以使用这种DIMM——如果他们愿意修改代码并接受专有界面的话。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。