Arm今天公布了两款新的7纳米芯片设计,其中包括Arm号称首款能够与英特尔市场领先的数据中心处理器相竞争的服务器级产品。
Arm在数据中心领域占有重要的地位。Arm向其他半导体制造商提供芯片设计许可,并且主要用于针对网络安全等任务进行优化的专用系统。Arm最近在通用数据中心计算方面取得了显着的进展,但英特尔仍然在该领域占据着主导地位。
新推出的Neoverse N1芯片旨在减弱英特尔对该市场的控制。Arm称,与之前的Cortex-A72架构相比,该设计为某些服务器工作负载提供的处理能力提高了2.5倍。此外,当根据处理整数(一个基本数据单元)的速度进行评估的时候,N1的速度则至少提高60%。
“Neoverse N1平台是Arm的第一个能够为更广泛数据中心工作负载提供服务的计算平台,其性能水平与公有云中采用的传统架构相匹敌,”Arm软件生态系统开发高级总监Kevin Ryan在一篇博文中这样写道。他说,该平台主要针对高性能进行了优化,但同时也是针对效率设计的,在相同的芯片制造过程中,其能效要比Cortex-A72高出30%。
该芯片相比上一代的另一个改进是支持人工智能。企业客户几乎总是在GPU上运行人工智能工作负载,因为GPU比通用芯片更适合于这种类型的任务,但是在某些情况下,Arm看到N1也可以用于一些特定场景。
AWS等大型云提供商有时会将人工智能工作负载从GPU卸载到其他处理器,以提高运营效率,这是一个高度专业化的用例,但考虑到云提供商是世界上最大的芯片买方之一,所以这种用例值得去满足需求。Arm称,N1可以运行机器学习算法,速度比Cortex-A7快6倍。
在实践中,速度可能会有很大的差异。Arm设计N1让半导体制造商可以使用该架构来构建具有4到128个处理核心的产品。
Arm 今天推出的第二款新产品是Neoverse E1,它的目标市场更狭窄一些。该芯片旨在为专门用于处理网络流量的蜂窝基站等系统提供动力。
Arm正在寻求抓住运营商们在全球范围转向5G的热潮中对大规模硬件的投资。5G是第五代无线标准,有望大幅加速移动连接。Arm称,E1传输数据的速度比早期芯片快2.7倍,能效高2.4倍,处理能力高出2.1倍,以对这些数据执行操作。
Arm 产品营销高级总监Brian Jeff在一篇博文中详细说:“Neoverse E1和Neoverse N1处理器在面向高性能系统的异构设计中结合使用。利用这种系统的一些示例设备包括,具有深度数据包检测和入侵检测功能的防火墙设备。”
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。