英特尔的研究人员可能已经研制出了一种能够取代几十年来微处理器、存储芯片和其他逻辑电路一直使用的技术的替代品。
这项研究很重要,因为基于互补性氧化金属半导体(Complementary Metal-Oxide Semiconductor,CMOS)技术的芯片已经接近其潜力的顶峰。 CMOS芯片是建立在通过由绝缘栅极控制可切换的半导体电导彼此连接的晶体管基础之上的。
自20世纪60年代以来,这项技术一直为行业提供良好的性能,但近年来也成为一个限制因素。这项技术的小型化——为了将更多的晶体管封装到电路板上并提高其计算能力——正在变得越来越困难。
因此,为了打造更强大的微处理器,英特尔正致力于利用新的量子材料弥补CMOS的不足。英特尔研究人员称,一种名为“可扩展的节能型电动旋转轨道逻辑”技术可能就是这个问题的答案。
与CMOS相比,这种所谓的MESO技术有可能将微芯片的电压降低到CMOS的五分之一,当结合“超低睡眠状态功率”的时候,能效可以提高10到30倍。
英特尔研究人员在《自然》杂志上发表的一篇论文中这样写道:“我们正在寻找革命性的、而不是进化性的、超越了CMOS时代的计算方法。MESO是围绕低压互连和低压磁电机构建的,将量子材料创新与计算结合在一起。我们对我们取得的进展感到非常兴奋,期待着未来能够展示进一步降低电压的潜力。”
英特尔研究人员已经使用由加州大学伯克利分校Ramamoorthy Ramesh和劳伦斯伯克利国家实验室开发的巨型电子和量子材料构建了MESO原型设备。
更具体地说,MESO在室温下使用所谓的多铁材料,产生“自旋 - 轨道转换效应”。该材料是磁性的——也就是原子全部对齐,如同常见的永久性磁铁——和铁磁性的,这两种状态是耦合在一起的,这意味着如果你改变其中一个,也要改变另一个。
研究人员表示:“在MESO设备中,电场会改变或翻转整个材料中的偶极子电场,这会改变或翻转产生磁场的电子自旋,”研究人员说。
图注:多铁性材料铋-铁-氧化物的单晶。铋原子(蓝色)在立方体的每个面上形成具有氧原子(黄色)的立方晶格,并且在中心附近形成铁原子(灰色)。稍微偏离中心的铁与氧相互作用以形成电偶极子(P),耦合到原子(M)的磁自旋,从而翻转电场(E)偶极子也会让磁矩发生翻转。该材料中原子集体磁自旋对二进制位0和1进行编码,从而可进行信息存储和逻辑运算。
Constellation Research分析师Holger Mueller表示,英特尔的研究令人鼓舞,因为这对于不断打破微处理器发展障碍、满足下一代应用工作负载需求来说是十分必要的。
Mueller说:“通过MESO,英特尔向前迈出了关键一步,让多状态铁材料帮助打造更高效的计算平台。这是一个充满希望的开端,现在这项新技术必须在实际应用得到检验。”
然而,这可能还有很长一段路要走。尽管MESO原型设备显示出了具有前景的结果,但Ramesh表示,该技术仍处于初期阶段,还需要进行更多研究,实际设备仍有可能至少需要十年时间。
Ramesh说:“还有很多工作要做。今天的电脑电压是3伏。Nature论文中提到的这个设备电压达到了100毫伏。我们需要更好地去理解物理学。”
好文章,需要你的鼓励
来自香港科技大学和MiniMax的研究团队开发了SynLogic,一个可合成35种逻辑推理任务的框架与数据集,填补了AI逻辑训练资源缺口。研究表明,在SynLogic上进行强化学习训练显著提升了模型逻辑推理能力,32B模型在BBEH测试中超越了DeepSeek-R1-Distill模型6个百分点。更值得注意的是,将SynLogic与数学和编程数据混合训练不仅提高了这些领域的学习效率,还增强了模型的泛化能力,表明逻辑推理是构建通用AI推理能力的重要基础。
这项研究揭示了大型语言模型的惊人能力:只需两个特殊训练的向量,冻结的语言模型就能在一次计算中生成数百个准确词汇,而非传统的逐词生成。研究者发现,这种能力要求特定的输入排列方式,且生成速度比自回归方法快约279倍。这一发现不仅展示了语言模型未被充分探索的并行生成潜力,还为快速文本重建开辟了新方向。
腾讯混元团队提出的"ConciseR"是一种通过两阶段强化学习实现大模型简洁推理的新方法。研究遵循"先走后跑"原则,先确保模型具备准确推理能力,再优化输出简洁性。第一阶段通过改进的群体相对策略优化(GRPO++)提升推理能力,第二阶段通过长度感知的群体相对策略优化(L-GRPO)减少输出长度。实验结果显示,该方法在AIME、MATH-500等多个基准测试中既减少了输出长度(平均20%以上),又保持或提高了准确率,展现出高效率-高准确率的理想平衡。
这项由香港科技大学团队开展的研究首次全面评估了压缩对大语言模型Agent能力的影响。研究发现,虽然4位量化能较好地保留工作流生成和工具使用能力(仅下降1%-3%),但在实际应用中性能下降达10%-15%。团队提出的ACBench基准测试横跨工具使用、工作流生成、长文本理解和实际应用四大能力,评估了不同压缩方法对15种模型的影响。结果显示,AWQ量化效果最佳,蒸馏模型在Agent任务上表现不佳,大型模型对压缩更具韧性。研究还提出ERank等创新分析方法,为实际部署提供了切实指导。