面对来自至强SP系统的激烈竞争压力,IBM公司正着手推出一系列速度更快的POWER9服务器产品。
就在去年12月推出其颇具吸引力的AC922 AI服务器之后,蓝色巨人以发布了六款基于POWER9 CPU的2U与4U服务器,且具体分为单插槽与双插槽机型。总体来讲,这批新机型相较于上代POWER8在内存容量方面迎来倍增,具有更快的内部互连速度,且具体面向三种不同操作系统/系统软件环境作出针对性调整:
使用H922与H924机型时,其中四分之一的计算核心要被分配给AIX七IBM i操作系统。
第四代PCIe连接能够带来两倍于第三代PCIe的系统IO,且机柜尺寸将具体影响到连接数量与存储容量:
L922 – 8 x SFF驱动器
S914 – 12或18 x SFF驱动器
S922 – 8 x SFF驱动器
S924 – 12或 18 x SFF驱动器
H922 – 8 x SFF驱动器
H924 – 12或18 x SFF驱动器
除了L992之外,其它五款机型都能够添加内置RDX介质,同时支持4块400 GB M.2 NVMe闪存驱动器。S914采用塔式外形以及2U机架式机箱,如果客户不需要那么多计算核心,亦可在出厂时对其进行重新配置。
目前我们还无法将这些服务器产品与主流至强SP系列服务器进行直接比对。但可以肯定的是,相关测试基准将在今年晚些时候出现。
另外,如果大家希望了解与这些产品相关的更多细节信息,不妨直接在谷歌上搜索“IBM+服务器名称”——例如H924与S922说明文档——这种作法在效果上远胜于访问蓝色巨人提供的官方网站。
好文章,需要你的鼓励
这项研究提出了R1-Searcher++框架,通过两阶段训练策略使大语言模型能像人类一样灵活利用内部知识和外部信息。该方法创新性地采用强化学习激励模型优先使用内部知识,并引入记忆机制将检索到的信息转化为内部知识,实现动态知识获取。实验表明,R1-Searcher++不仅在多步问答任务上表现优异,还大幅减少了检索次数,显著提高了推理效率。
这项研究提出了AutoRefine,一种革新性的强化学习框架,为大语言模型引入了"边思考边搜索和完善"的全新范式。与传统方法不同,AutoRefine在连续搜索调用之间添加知识完善步骤,让模型能够有效过滤和组织信息。通过结合答案正确性和检索质量双重奖励,该方法在七项问答基准测试中平均提升6.9%的准确率,特别在复杂多跳推理场景中表现突出,解决了现有检索增强推理的核心局限性。
这项研究揭示了一种新型网络安全威胁:利用普通网络广告攻击AI网页代理。中科院研究团队开发的AdInject攻击无需特殊权限,仅通过精心设计的广告内容就能误导AI代理点击恶意链接,成功率高达90%以上。研究使用严格的黑盒模型,更符合现实场景,暴露了当前AI代理面临的实际安全漏洞。实验还表明,即使添加专门的防御提示,这类攻击仍能成功率超过50%,凸显了设计更强大防御机制的紧迫性。
东北大学与快手科技联合研发的UNITE系统为多模态信息检索带来突破性进展。这项发表于2025年5月的研究首次系统分析了模态特定数据如何影响检索性能,并提出创新的模态感知掩码对比学习技术,有效解决不同模态间的竞争关系。UNITE能同时处理文本、图像、视频及其组合,在40多项测试中超越现有方法,即使与参数规模更大的模型相比也表现出色。研究发现视频-文本对在通用检索中表现优异,而文本-文本和文本-图像对对指令遵循任务至关重要,为未来多模态系统研究提供了宝贵指南。