Arm今天公布了两款新的7纳米芯片设计,其中包括Arm号称首款能够与英特尔市场领先的数据中心处理器相竞争的服务器级产品。
Arm在数据中心领域占有重要的地位。Arm向其他半导体制造商提供芯片设计许可,并且主要用于针对网络安全等任务进行优化的专用系统。Arm最近在通用数据中心计算方面取得了显着的进展,但英特尔仍然在该领域占据着主导地位。
新推出的Neoverse N1芯片旨在减弱英特尔对该市场的控制。Arm称,与之前的Cortex-A72架构相比,该设计为某些服务器工作负载提供的处理能力提高了2.5倍。此外,当根据处理整数(一个基本数据单元)的速度进行评估的时候,N1的速度则至少提高60%。
“Neoverse N1平台是Arm的第一个能够为更广泛数据中心工作负载提供服务的计算平台,其性能水平与公有云中采用的传统架构相匹敌,”Arm软件生态系统开发高级总监Kevin Ryan在一篇博文中这样写道。他说,该平台主要针对高性能进行了优化,但同时也是针对效率设计的,在相同的芯片制造过程中,其能效要比Cortex-A72高出30%。
该芯片相比上一代的另一个改进是支持人工智能。企业客户几乎总是在GPU上运行人工智能工作负载,因为GPU比通用芯片更适合于这种类型的任务,但是在某些情况下,Arm看到N1也可以用于一些特定场景。
AWS等大型云提供商有时会将人工智能工作负载从GPU卸载到其他处理器,以提高运营效率,这是一个高度专业化的用例,但考虑到云提供商是世界上最大的芯片买方之一,所以这种用例值得去满足需求。Arm称,N1可以运行机器学习算法,速度比Cortex-A7快6倍。
在实践中,速度可能会有很大的差异。Arm设计N1让半导体制造商可以使用该架构来构建具有4到128个处理核心的产品。
Arm 今天推出的第二款新产品是Neoverse E1,它的目标市场更狭窄一些。该芯片旨在为专门用于处理网络流量的蜂窝基站等系统提供动力。
Arm正在寻求抓住运营商们在全球范围转向5G的热潮中对大规模硬件的投资。5G是第五代无线标准,有望大幅加速移动连接。Arm称,E1传输数据的速度比早期芯片快2.7倍,能效高2.4倍,处理能力高出2.1倍,以对这些数据执行操作。
Arm 产品营销高级总监Brian Jeff在一篇博文中详细说:“Neoverse E1和Neoverse N1处理器在面向高性能系统的异构设计中结合使用。利用这种系统的一些示例设备包括,具有深度数据包检测和入侵检测功能的防火墙设备。”
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。