颇具影响力的芯片设计公司Nvidia已经提出以400亿美元收购Arm。本周二,Arm详细介绍了两款针对服务器市场设计的芯片,有望在性能上实现大幅提升。
Arm的半导体设计蓝图是全球大多数智能手机和其他无数设备的处理器基石。近年来,Arm还在数据中心领域站稳了脚跟。
本周Arm推出的Neoverse V1和N2芯片设计,可以被半导体制造商作为服务器级CPU的基础,是Arm现有产品Neoverse N1(已经被AWS在云平台中采用)的后续产品。除了AWS,七大超大规模数据中心运营商中有四家也已经采用了Neoverse N1。
V1和N2的性能分别比当前的N1高出50%和40%。Arm表示,V1专为那些每个线程都提供了较高性能的CPU设计,而N2是专门为有高核心数的CPU设计的。最适合采用哪种芯片主要取决于企业运行的哪种应用:例如,按CPU核心计费的软件产品,最好是运行在核心较少、单线程性能较高的CPU上。
Arm表示,V1和N2都兼容目前芯片业内所采用的最新5纳米制程工艺,此外还支持其他很多面向特定用途的技术。
另一项新增功能是SVE,这项技术让科学仿真和部署在超级计算机上的其他工作负荷从中受益,这些应用通常把那些以数据单元形式经过处理的数据保存为向量。SVE让芯片制造商可以根据客户的需求,自定义CPU可以处理向量的最大尺寸,这种灵活性让客户可以打造更加高效、更加精细的处理器。
还有一项名为Compute Express Link 的互连功能,通常用于将机器学习加速器和其他专用芯片连接到服务器。这是一个重要的补充,因为随着企业越来越多地采用人工智能,机器学习加速器也在普及,这是Arm现在应该更好去应对的一个重要行业趋势。
N2是针对开发高核心数CPU的芯片新设计,其目标不仅仅是服务器。Arm说,N2还可作为其他数据中心设备包括路由器和交换机的处理器基础。
目前已经有早期客户在测试N2,预计明年全面上市,V1则已经发布。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。