英特尔和美光在2015年7月大张旗鼓地推出了3D XPoint,这是几十年来问世的首个新内存架构。差不多五年之后,这些芯片终于在SSD和DIMM中出货了,但光芒却不那么耀眼了。
在众多数据中心芯片新品的发布中,英特尔首次公布了Optane DIMM和专有DDR-T协议的设计细节和性能细节,这也让我们有机会了解打造一款新内存芯片的难度有多大,也给像美光和三星这样未来可能会走类似路线的竞争对手一个警示。
磁性的、电阻式的、以及像Optane这样的相变内存已经存在于实验室中有很多年时间了。但是,要在计算机内存分层中为这些技术开辟出一个新的层来说,可能要让很多公司花费多年时间才能实现。
英特尔不得不对CPU、DDR内存协议和现有DIMM设计进行改动。而且目前最大的提升仍在进行中——也就是让合作伙伴对应用软件进行改动,以便支持持久性主内存。现在,Linux和微软的服务器操作系统的改动基本已经就绪。
英特尔因为在做所有这些工作的同时还定义和提升了新内存架构的开发备受赞誉,但不幸的是,这一切都发生在DRAM和NAND价格暴跌的一年中,使得英特尔的收入和利润前景变得有些黯淡。
Objective Analysis内存市场分析师Jim Handy表示:“2015年的时候,我曾预测英特尔在推出新内存架构的两年内将获得高达20亿美元的收入,但现在这个数字可能要低得多,更现实地说,可能只有10%或者说只有2亿美元,部分原因是我们正处在内存价格崩盘期。”
他认为,英特尔可能会为了吸引用户把Optane DIMM的售价定为大约是DRAM版本的一半。但考虑到升级Optane的成本,英特尔可能是目前唯一亏损的内存芯片厂商了。
Linley Group分析师Linley Gwennap认为:“Optane DIMM原本应该在2017年与Skylake-SP处理器一同上市,但被推迟了。现在,DRAM DIMM的最大容量已经有所提高,价格大幅下滑——但问题是,DRAM发展得越来越好。”
英特尔仅披露了专有DDR-T协议的粗略细节。(来源:英特尔)
更麻烦的是,Optane DIMM的计算性能优势说起来有点复杂,可能会因为应用和可编程功率(范围在12W至18 W不等)的不同而出现差异,例如读取延迟从180到340纳秒不等。
英特尔公布了经过测试的一些特定用例,每个用例都很重要,但既不具有广泛性也没有带来任何惊喜。例如,DIMM在运行微软HyperV的服务器上可支持多出30%的虚拟机,或者可以将此类服务器的成本降低三分之一。
同样地,SAP Hana用户也可以看到重启速度提高了12.5倍,或者大型内存数据库成本降低节省39%。除此之外,英特尔并没有详细介绍给其他目标应用带来的提升,例如Memcached、实时分析和Apache Spark。
英特尔工程师表示,需要花很长的时间来探索这项新技术的潜在用途。板卡厂商将为这款DIMM设定价格,但英特尔表示,预计它在目标工作负载上的性价比是DRAM的1.2倍。
但整体来看,这并没有让分析师们感到兴奋。
Gwennap说:“性能似乎并不怎么吸引人......而且在成本更高的情况下对比性能是不公平的,有些应用程序会从中受益......但达不到你通常对新技术期望的2-4倍的提升。”
目前尚不清楚这一情况是否会随着时间的推移有所好转。英特尔也没有就今天公布的20纳米Optane芯片路线图发表评论。Handy表示,英特尔可能会在迁移到更类似DRAM的工艺之前,先过渡到15纳米工艺。
“我对英特尔所做的努力印象最深刻。这个领域的初创公司都忘了,他们需要对操作系统和应用进行改动。”
英特尔的经验可能会让那些认为自己能填补某些内存市场空白的竞争对手三思而后行。如果他们继续前行,未来的市场发生一些变化。
一位负责Optane的高管认为,未来内存市场会变得很复杂,我们将看到市场中会有很多针对不同用途的不同产品。
Optane的性能说起来有些复杂,在不同功率和不同应用的条件下,性能也是不同的。(来源:英特尔)
英特尔分享了设计上的一些有趣信息。与固态驱动器一样,Optane DIMM有自己的SRAM控制器,以及用于地址查找表的电源管理IC、电容器和DRAM。
一个CPU最多可以使用6个Optane模块,还需要一些DRAM才能启动。Optane模块需要更靠近CPU以解决信号完整性的问题。
这些办卡最多可以封装11个Optane介质芯片,其中一些用于纠错和冗余,安全密钥保存在易失性内存和非易失性内存中。
英特尔表示,介质芯片的读写周期是五年。但是,数据仅在未使用时保留约三个月。
大多数新的Xeon Platinum和Gold版本都支持DIMM,并对内存单元做了一些改动,就像是缓存控制器一样,可以智能地把更高速度的DRAM芯片作为缓存一样使用。
英特尔表示,DDR-T协议支持异步命令和时序,使Optane DIMM比传统CPU管理模块更具控制力。与DDR类似,它支持访问64-B缓存行。
Optane DIMM被设计成了类似于小号的、精简的专用SSD。(来源:英特尔)
DIMM可以使用三种编程模型,可以在不改动软件的情况下看起来更像是DRAM;可以具备非易失性内存所不具备的独特特性;或者经过操作系统和应用的改动,看起来像是一个比SSD和硬盘速度更快的块存储层。
Cascade Lake CPU首席架构师Ian Steiner表示:“并非所有系统都将使用它,有些应用不喜欢这种DIMM,没关系。有些运行表现不会变的更好,例如流媒体数据,但有很多客户关心的好应用是可以有更好的运行表现的。”
“没有真正现成的应用是支持持久性的,而且短时间内也不会有,所以它能带来的短期好处就是让你能够获得比DRAM更大的主内存,”Handy说。
英特尔将继续与SAP等应用开发商合作,改变这种状况。与此同时,谷歌或高盛等拥有深厚软件实力和内部应用的企业可以使用这种DIMM——如果他们愿意修改代码并接受专有界面的话。
好文章,需要你的鼓励
Carma Technology 针对 Uber 提起专利侵权诉讼,称其侵犯了涉及拼车系统的五项专利。案情回溯至十年前,凸显专利保护对创新者的重要性,可能对 Uber 及其他公司带来巨大影响。
东京大学研究团队开发的WebChoreArena是一个全新的网页代理评估基准,它包含532个精心设计的任务,专注于测试AI代理处理繁琐、复杂网页任务的能力。研究结果显示,即使是最先进的语言模型(如Gemini 2.5 Pro)在这些挑战性任务上的表现也比常规任务降低了约14个百分点,证明了这一基准有效区分了不同模型的能力。WebChoreArena通过设计海量记忆、计算、长期记忆等类型的任务,为评估AI代理在实际应用场景中的表现提供了更严格的标准。
经过暂停战略调整,Automattic 宣布重返 WordPress 开发,包括核心、Gutenberg、Playground 等模块,计划今年推出 6.9 版本,并涉及与 WP Engine 的法律争端。
这项研究提出了一种名为LIFT的新型微调方法,通过在低秩近似后识别大语言模型中的主要权重进行稀疏微调。研究表明,仅更新5%的主要权重就能在推理任务上超越全参数微调,同时保持与LoRA相当的内存效率。LIFT在常识推理、算术推理等多项任务上表现优异,还能更好地平衡学习新知识与保留原有能力。这一方法揭示了大语言模型中关键参数的重要性,为资源高效的模型定制提供了新思路。