9月23日,ARM宣布推出两款全新的CPU IP: Arm Neoverse V1平台以及第二代的N系列平台Neoverse N2,两个新平台的推出丰富了Neoverse产品家族,也大大增强ARM进军基础设施市场的竞争实力。此举表明了ARM正持续兑现对Neoverse的承诺。
Neoverse是ARM 2018年首次对外宣布的一个全新产品系列,主要面向5G网络和下一代云端到边缘基础设施,Neoverse架构会有更高级别的性能、安全性和可扩展性,其从微架构设计到芯片、软件和系统进行的全面创新以满足整个计算领域多样化且不断变化的需求。
目前,基础设施市场的主流架构是x86,这个市场主要有英特尔、AMD占领。近年来,随着云计算、AI应用的持续爆发,异构计算开始普及,GPU、FPGA等新型计算架构得到广泛部署。ARM 架构因其低功耗在物理网、移动市场广泛应用,ARM希望将其低功耗、高能效的优势带到服务器、网络、存储等市场,Neoverse就是在这个背景下推出的。2019年上半年,Arm推出了Arm Neoverse平台的两款产品,即Neoverse N1平台和E1平台。
据Arm基础设施事业部高级副总裁兼总经理Chris Bergey介绍,Neoverse包括三个系列,分别是V系列、N系列、E系列,其中V系列主要面向对计算性能要求比较高的场景,E系列主要面向对能耗要求比较高的场景,N系列主要面向对可扩展性要求比较高的场景。
本次新推出的Neoverse V1是V系列的第一个平台,与N1相比,其单线程性能可提升超过50%,对于CPU性能与带宽更高要求的应用来说,是性能表现最佳的平台。重要的是,Neoverse V1支持可伸缩矢量扩展(Scalable Vector Extensions, SVE),为高性能云、高性能计算与机器学习等市场带来庞大的应用潜力。 SVE可基于未知宽度向量单元的软件编程模型,执行单指令流多数据流(SIMD)整数、bfloat16、浮点指令。SVE可确保软件编码的可移植性与使用寿命,同时兼顾高效的执行。
同为N系列的N2 与 N1相比,性能翻倍,同时可提供更高可扩展性。Neoverse N2被定位为可提供更高性能计算的解决方案,用来满足横向扩展的性能需求,其用例可横跨云、智能网卡(SmartNICs)、企业网络到功耗受限的边缘设备。 此外,相比于Neoverse N1,Neoverse N2在保持相同水平的功率和面积效率之余,单线程性能提升了40%。
处理器架构的落地离不开软件的支持,特别是对于一个有别于X86的全新架构。Chris Bergey在接受采访时就表示,Neoverse落地的一大挑战是如何与其他软硬件协作以充分发挥其价值。这需要整个生态系统的共同努力。
为此,Arm致力于为合作伙伴的持续创新与设计灵活性提供必要的组件。其中的关键任务在于Arm的芯片级接口,Arm在CCIX与CXL的投资就是为了确保其生态系统得以快速且高效地推出相关的技术。Arm现在不但提供领先的处理器核,还为合作伙伴提供可扩展性的交换网,用以支持大量的处理器核。
除了Arm的互连技术,Project Cassini的推出也将有合作伙伴的合作。通过标准、平台安全性与参考实施,Project Cassini让行业伙伴在基于Arm平台上部署“装机即用“的软件充满信心。同时,Arm也持续推动基础设施的基础软件支持。操作系统 、虚拟机管理程序,例如 Xen、KVM、Docker容器以及越来越多的Kubernetes,都已经陆续宣布支持Arm架构。许多初期由Arm推动的开源项目正在变得自主运转,同时,商用ISV应用程序也齐步演进。
Chris Bergey表示,Arm 将持续优化Neoverse,这一全新计算平台预计以每年增长30%的平台性能为指标,持续优化到2021年。
看得出,Arm对Neoverse抱有很强烈的期许,投入也很大。
好文章,需要你的鼓励
韩国科学技术院研究团队提出"分叉-合并解码"方法,无需额外训练即可改善音视频大语言模型的多模态理解能力。通过先独立处理音频和视频(分叉阶段),再融合结果(合并阶段),该方法有效缓解了模型过度依赖单一模态的问题,在AVQA、MUSIC-AVQA和AVHBench三个基准测试中均取得显著性能提升,特别是在需要平衡音视频理解的任务上表现突出。
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。