本周一Red Hat Enterprise Linux for ARM正式推出,突显了英特尔x86-64平台在数据中心面临越来越激烈的竞争。
Red Hat在2015年首次公布了Linux for ARM的预览版,尽管该软件已经在使用多年时间了。自从这个预览版落地以来,Red Hat就在与高通等合作伙伴密切合作,后者刚刚推出了面向云提供商基于ARM SoC的Centriq 2400产品线,还有HPE也刚刚推出了首款基于ARM的HPC系统——Apollo 70。
Red Hat Enterprise Linux 7.4 for ARM是首个针对这个CPU架构的商业版RHEL。去年SUSE抨击Red Hat称,SUSE在出货完整的商用服务器级ARM Linux发行版产品方面击败了RHEL。
本周在一次采访中,Red Hat首席产品营销经理Yan Fisher解释说,Red Hat的多平台战略要追溯到12年或者13年前,那时候Red Hat一开始是与IBM围绕Power和Z系统合作的。
他说:“当我们意识到ARM将要成为这个领域一个强大的玩家时,我们就开始投资了。”
Red Hat首席ARM架构师Jon Masters表示,ARM团队成立于2011年3月1日。他回忆当时是把一个BeagleBoard与一个32位ARM芯片结合,后来某个时间点这个硬件转变为一台服务器。
“它必须是64位的,因为没有人想要32位的服务器,”他这样解释说。
英特尔的x64芯片将继续统治数据中心,但是随着64位ARMv8-A和其他支持功能的崛起,ARM硬件似乎得到了很多企业客户的青睐,让这个市场不太过于倾向一方。这一点得到了证明:英特尔去年宣布计划提供针对移动芯片的ARM技术许可。
Fisher表示,这种转变不会在一夜之间发生,也不是要取代其他架构,这是为创新——特别是专有的ARM设计——提供空间。
Fisher说:“我们正处于行业的拐点,人们需要有不同的解决方案选择。这使我们的客户能够从一个版本的硬件转向一个,并继续享受创新成果。”
最近由印度科学院计算与数据科学系Jayanth Kalyanasundaram和Yogesh Simmhan撰写的一篇研究论文,把AMD 64位基于ARMv8的A1170 SoC与AMD基于x64的Opteron 3338进行了对比。
该研究发现,AMD ARM服务器在基于整数和小型浮点工作负载方面与x86设备的性能相当。在更大型的浮点任务方面,AMD ARM芯片的FPU限制了其性能,但是研究人员指出,通过针对数据并行性调整Hadoop,ARM64硬件的性能可接近于x64设备。
基于ARM的服务器亮点在于能耗。该研究报告指出:“有能耗分析显示,ARM64服务器比x64服务器的基本能源负载要低3倍,即使在运行大数据应用的时候,增量负载也有类似的减少。我们还看到EDP[Energy Delay Product]方面,ARM64要比x64服务器高出71%。”
Kalyanasundaram和Simmhan表示,能耗在“是云数据中心运营成本中一个主要部分”,这使得ARM架构对于那些在意电费的人来说很有吸引力。
好文章,需要你的鼓励
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。
这项研究提出了"思想家"(Thinker)任务,一种受人类双重加工理论启发的新型AI训练方法。研究者将问答过程分解为四个阶段:快速思考(严格预算下给出初步答案)、验证(评估初步答案)、慢速思考(深入分析修正错误)和总结(提炼关键步骤)。实验表明,该方法使Qwen2.5-1.5B模型的准确率从24.9%提升至27.9%,DeepSeek-R1-Qwen-1.5B模型从45.9%提升至49.8%。显著的是,仅使用快速思考模式就能达到26.8%的准确率,且消耗更少计算资源,证明了直觉与深度推理作为互补系统的培养价值。
这项由ELLIS研究所和马克斯·普朗克智能系统研究所的科学家进行的研究,揭示了大语言模型安全测试的根本规律:越狱攻击成功率由攻击者与目标模型间的能力差距决定。通过评估500多个攻击者-目标组合,研究团队发现:更强的模型是更好的攻击者;当目标能力超过攻击者时攻击成功率急剧下降;社会科学能力比STEM知识更能预测攻击成功。基于这些发现,研究者建立了预测模型,表明随着AI进步,人类红队测试可能逐渐失效,提示需要发展自动化安全评估方法及更全面地评估模型的说服和操纵能力。
华中科技大学和香港中文大学研究团队提出SATORI-R1,一种通过空间定位和可验证奖励增强多模态推理的新方法。该方法将视觉问答任务分解为图像描述、区域定位和答案预测三个可验证阶段,解决了自由形式推理中注意力分散和训练收敛慢的问题。实验证明,SATORI-R1在七个视觉问答基准上一致提升性能,最高达15.7%,并展示出更聚焦的视觉注意力和更低的训练方差。