英特尔和美光在2015年7月大张旗鼓地推出了3D XPoint,这是几十年来问世的首个新内存架构。差不多五年之后,这些芯片终于在SSD和DIMM中出货了,但光芒却不那么耀眼了。
在众多数据中心芯片新品的发布中,英特尔首次公布了Optane DIMM和专有DDR-T协议的设计细节和性能细节,这也让我们有机会了解打造一款新内存芯片的难度有多大,也给像美光和三星这样未来可能会走类似路线的竞争对手一个警示。
磁性的、电阻式的、以及像Optane这样的相变内存已经存在于实验室中有很多年时间了。但是,要在计算机内存分层中为这些技术开辟出一个新的层来说,可能要让很多公司花费多年时间才能实现。
英特尔不得不对CPU、DDR内存协议和现有DIMM设计进行改动。而且目前最大的提升仍在进行中——也就是让合作伙伴对应用软件进行改动,以便支持持久性主内存。现在,Linux和微软的服务器操作系统的改动基本已经就绪。
英特尔因为在做所有这些工作的同时还定义和提升了新内存架构的开发备受赞誉,但不幸的是,这一切都发生在DRAM和NAND价格暴跌的一年中,使得英特尔的收入和利润前景变得有些黯淡。
Objective Analysis内存市场分析师Jim Handy表示:“2015年的时候,我曾预测英特尔在推出新内存架构的两年内将获得高达20亿美元的收入,但现在这个数字可能要低得多,更现实地说,可能只有10%或者说只有2亿美元,部分原因是我们正处在内存价格崩盘期。”
他认为,英特尔可能会为了吸引用户把Optane DIMM的售价定为大约是DRAM版本的一半。但考虑到升级Optane的成本,英特尔可能是目前唯一亏损的内存芯片厂商了。
Linley Group分析师Linley Gwennap认为:“Optane DIMM原本应该在2017年与Skylake-SP处理器一同上市,但被推迟了。现在,DRAM DIMM的最大容量已经有所提高,价格大幅下滑——但问题是,DRAM发展得越来越好。”
英特尔仅披露了专有DDR-T协议的粗略细节。(来源:英特尔)
更麻烦的是,Optane DIMM的计算性能优势说起来有点复杂,可能会因为应用和可编程功率(范围在12W至18 W不等)的不同而出现差异,例如读取延迟从180到340纳秒不等。
英特尔公布了经过测试的一些特定用例,每个用例都很重要,但既不具有广泛性也没有带来任何惊喜。例如,DIMM在运行微软HyperV的服务器上可支持多出30%的虚拟机,或者可以将此类服务器的成本降低三分之一。
同样地,SAP Hana用户也可以看到重启速度提高了12.5倍,或者大型内存数据库成本降低节省39%。除此之外,英特尔并没有详细介绍给其他目标应用带来的提升,例如Memcached、实时分析和Apache Spark。
英特尔工程师表示,需要花很长的时间来探索这项新技术的潜在用途。板卡厂商将为这款DIMM设定价格,但英特尔表示,预计它在目标工作负载上的性价比是DRAM的1.2倍。
但整体来看,这并没有让分析师们感到兴奋。
Gwennap说:“性能似乎并不怎么吸引人......而且在成本更高的情况下对比性能是不公平的,有些应用程序会从中受益......但达不到你通常对新技术期望的2-4倍的提升。”
目前尚不清楚这一情况是否会随着时间的推移有所好转。英特尔也没有就今天公布的20纳米Optane芯片路线图发表评论。Handy表示,英特尔可能会在迁移到更类似DRAM的工艺之前,先过渡到15纳米工艺。
“我对英特尔所做的努力印象最深刻。这个领域的初创公司都忘了,他们需要对操作系统和应用进行改动。”
英特尔的经验可能会让那些认为自己能填补某些内存市场空白的竞争对手三思而后行。如果他们继续前行,未来的市场发生一些变化。
一位负责Optane的高管认为,未来内存市场会变得很复杂,我们将看到市场中会有很多针对不同用途的不同产品。
Optane的性能说起来有些复杂,在不同功率和不同应用的条件下,性能也是不同的。(来源:英特尔)
英特尔分享了设计上的一些有趣信息。与固态驱动器一样,Optane DIMM有自己的SRAM控制器,以及用于地址查找表的电源管理IC、电容器和DRAM。
一个CPU最多可以使用6个Optane模块,还需要一些DRAM才能启动。Optane模块需要更靠近CPU以解决信号完整性的问题。
这些办卡最多可以封装11个Optane介质芯片,其中一些用于纠错和冗余,安全密钥保存在易失性内存和非易失性内存中。
英特尔表示,介质芯片的读写周期是五年。但是,数据仅在未使用时保留约三个月。
大多数新的Xeon Platinum和Gold版本都支持DIMM,并对内存单元做了一些改动,就像是缓存控制器一样,可以智能地把更高速度的DRAM芯片作为缓存一样使用。
英特尔表示,DDR-T协议支持异步命令和时序,使Optane DIMM比传统CPU管理模块更具控制力。与DDR类似,它支持访问64-B缓存行。
Optane DIMM被设计成了类似于小号的、精简的专用SSD。(来源:英特尔)
DIMM可以使用三种编程模型,可以在不改动软件的情况下看起来更像是DRAM;可以具备非易失性内存所不具备的独特特性;或者经过操作系统和应用的改动,看起来像是一个比SSD和硬盘速度更快的块存储层。
Cascade Lake CPU首席架构师Ian Steiner表示:“并非所有系统都将使用它,有些应用不喜欢这种DIMM,没关系。有些运行表现不会变的更好,例如流媒体数据,但有很多客户关心的好应用是可以有更好的运行表现的。”
“没有真正现成的应用是支持持久性的,而且短时间内也不会有,所以它能带来的短期好处就是让你能够获得比DRAM更大的主内存,”Handy说。
英特尔将继续与SAP等应用开发商合作,改变这种状况。与此同时,谷歌或高盛等拥有深厚软件实力和内部应用的企业可以使用这种DIMM——如果他们愿意修改代码并接受专有界面的话。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。