这意味着占用空间更小、能源消耗更低
计算设备并不一定越大越好。IBM对此明显深有体会,因此决定更新其z16大型机,同时公布了全新一代LinuxOne 4的真容。这两款产品均开始采用机架安装与单框体配置设计。
这些体积更小、能耗更低的新系统,明显是要吸引更广泛的市场受众。
这些服务器的配置经过了与现有z16高可用性产品组合相同的认证测试,同时匹配机架优化形式,能够与标准的19英寸数据中心机架和配电单元一同使用。
IBM zSystem及LinuxONE总经理Ross Mauri表示,“这些新方案让不同规模的企业,都能无缝将IBM z16和LinuxONE Rockhopper 4同分布式基础设施整合起来。”
其中z16最初公布于一年之前,采取的是多框体设计,搭载新的7纳米Telum处理器。这款处理器增加了片上AI推理功能,可为金融交易中的实时欺诈检测等功能提供算力支持。
LinuxONE产品线则是IBM大型机的纯Linux版本,其中Rockhopper 4机型引入了去年9月推出的LinuxOne Emperor 4中的技术,因此形制更为紧凑。
别看经过瘦身,但二者仍是极为强大的系统,能够处理原本需要多个x86系统的大量工作负载。IBM宣称,将一台Rockhopper 4所能运行的Linux工作负载,至少需要36台x86服务器才能承接。这意味着其能将能耗减少75%,物理空间占用降低67%。
Rockhopper 4最多可配置68个运行频率为4.6 GHz的Integrated Facility for Linux(IFL)处理器和高达16 TB的内存。IBM表示,这样的优势配置能让该系统在单服务器上运行大规模数据库,无需另做分片。
IBM已经不是第一次在产品发布之后,尝试将大型机缩小至标准机架尺寸。此前,蓝色巨人也曾对z系列的早期型号做过同样的探索。
IBM公司表示,缩小硬件的物理尺寸能够让系统与其他服务器、存储、SAN和交换机集成在同一机架之内,从而成为分布式环境中的组成部分。
IBM Z与LinuxONE产品管理副总裁Tina Tarquinio写道,新的机架式配置将成为IBM吸引具有特定数据中心设计需求的受众群体的重要机会。
她解释道,“凭借分区电源监控和其他环境指标,单框体与机架安装配置有望帮助客户减少碳足迹。”
Omdia数据中心计算与网络首席分析师Manoj Sukumaran则表示,这代表着有趣的发展趋势,可能有助于将大型机推向传统金融服务/交易处理之外的市场空间。
“IBM Z系统大多以集成式机架进行交付,导致客户无法灵活地添加大型机及其他数据中心硬件。”
而瘦身配置的好处,在于降低了硬件的获取成本,也让大型机的使用门槛有所下降。Sukumaran表示,“对LinuxONE和各类Red Hat技术的集成,也使其较传统的大型机服务器更像是云基础设施,能够更轻松地集成到混合基础设施当中,帮助用户在x86和z16系统之间转移工作负载。”
IBM上个月还公布了z/OS 3.1的预览版,这个新一代大型机操作系统版本计划于今年第三季度推出。
IBM公司表示,z16和LinuxONE 4的单框体与机架安装产品,将从5月开始由IBM及授权商业合作伙伴投放市场。
好文章,需要你的鼓励
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。
这项研究提出了"思想家"(Thinker)任务,一种受人类双重加工理论启发的新型AI训练方法。研究者将问答过程分解为四个阶段:快速思考(严格预算下给出初步答案)、验证(评估初步答案)、慢速思考(深入分析修正错误)和总结(提炼关键步骤)。实验表明,该方法使Qwen2.5-1.5B模型的准确率从24.9%提升至27.9%,DeepSeek-R1-Qwen-1.5B模型从45.9%提升至49.8%。显著的是,仅使用快速思考模式就能达到26.8%的准确率,且消耗更少计算资源,证明了直觉与深度推理作为互补系统的培养价值。
这项由ELLIS研究所和马克斯·普朗克智能系统研究所的科学家进行的研究,揭示了大语言模型安全测试的根本规律:越狱攻击成功率由攻击者与目标模型间的能力差距决定。通过评估500多个攻击者-目标组合,研究团队发现:更强的模型是更好的攻击者;当目标能力超过攻击者时攻击成功率急剧下降;社会科学能力比STEM知识更能预测攻击成功。基于这些发现,研究者建立了预测模型,表明随着AI进步,人类红队测试可能逐渐失效,提示需要发展自动化安全评估方法及更全面地评估模型的说服和操纵能力。
华中科技大学和香港中文大学研究团队提出SATORI-R1,一种通过空间定位和可验证奖励增强多模态推理的新方法。该方法将视觉问答任务分解为图像描述、区域定位和答案预测三个可验证阶段,解决了自由形式推理中注意力分散和训练收敛慢的问题。实验证明,SATORI-R1在七个视觉问答基准上一致提升性能,最高达15.7%,并展示出更聚焦的视觉注意力和更低的训练方差。