近日IBM对Power10服务器产品线进行了扩充,推出了针对数据密集型和业务关键型工作负载的中端系统和横向扩展型系统,并新增了付费即用的选项。
最新推出的Power系统中包括了IBM E1080,这是IBM去年9月宣布推出的该产品组合中第一款系统,采用了IBM 7纳米的Power10处理器,该处理器具有多达15个核心,据称功耗降低了33%,内存带宽是之前Power9芯片的2倍。
IBM Power10 E1050
新增的中端系统E1050是一款四路机架式服务器,针对Java和ERP等数据密集型企业工作负载进行了优化,支持高达16TB内存,新增的横向扩展系统包括双路S1022和S1024系统,加上单路的S1014,是针对中小型企业和远程办分支机构的入门级选项。
和E1080一样,这些新推出的系统支持Power10芯片的透明内存加密功能,实现了OpenBMC开源主板管理控制器技术以应用系统更新。
IBM表示,这些最新系统经过优化,可以运行数据库和核心业务应用等工作负载,最大限度上提高了容器化应用的效率,而这一部分要归功于Red Hat OpenShift for Power系统让客户能够实施云原生服务。
IBM最近公布了IBM Power Private Cloud新增了付费即用和按分钟计费的灵活消费模式,这些模式和IBM Power Virtual Server目前现有的选择一起,为客户提供更大的灵活性。
IBM最近还为向IBM i软件堆栈引入了基于订阅的定价模式,该堆栈最初是针对AS/400系统的平台。此举让客户能够选择不同的期限(包括1年到5年)运行操作系统。IBM表示,现在还提供了跨所有操作环境的计量方式,包括IBM i、AIX、Linux和OpenShift。
IBM还提到了IBM Power10系列对运行SAP软件的适用性,称中端E1050系统为使用RISE with SAP的客户提供了更大的规模和性能。IBM称,更新后的Power10产品组合旨在提供SAP S/4HANA等数据密集型工作负载所需的灵活性和性能。
IBM Power产品管理副总裁Steve Sibley在一份声明中表示,正确的IT投资对于业务和运营弹性来说,是至关重要的。
他说:“新的Power10系统为客户提供了多种灵活的混合云选择,其敏捷性和自动化程度最能满足他们的需求,而不会牺牲性能、安全性或者弹性。”
不过根据Omdia首席分析师Roy Illsley的说法,更新的Power10产品组合最有可能吸引那些希望升级以获得更高性能的IBM Power系统现有企业客户,尽管IBM正试图扩大在企业服务器市场的份额。
他说:“Power的市场份额不到1%,但根据我们的数据,Power仍在以高个位数或低两位数的速度同比增长。Power主要吸引Power的客户,这次推出的新服务器似乎是在把AI/ML工作负载和K8s工作负载转移到Linux上。”
Illsley还表示,外界对于供应链和芯片制造地点的担忧表明,IBM可以很好地控制其Power处理器,以便能够更好地提供客户想要的性价比。
好文章,需要你的鼓励
这篇研究介绍了KVzip,一种创新的查询无关KV缓存压缩方法,通过上下文重建机制为大型语言模型提供高效存储解决方案。该技术能将KV缓存大小减少394倍,同时提高解码速度约2倍,在各种任务上性能几乎不受影响。不同于传统查询相关的压缩方法,KVzip创建可在多种查询场景下重用的通用压缩缓存,特别适合个性化AI助手和企业信息检索系统。研究在LLaMA3.1-8B、Qwen2.5-14B和Gemma3-12B等多种模型上进行了验证,处理长度高达17万词元的文本,并能与KV缓存量化等其他优化技术无缝集成。
腾讯与上海交通大学联合推出的DeepTheorem研究突破了大型语言模型在数学定理证明领域的限制。该项目创建了包含12.1万个IMO级别非形式化定理的大规模数据集,开发了专门的RL-Zero强化学习策略,并设计了全面的评估框架。研究表明,通过使用自然语言而非传统形式化系统,即使是7B参数的模型也能在复杂定理证明上取得显著成果,超越许多更大的专业模型。这一成果为AI数学推理开辟了新途径,使语言模型能够像人类数学家一样思考和证明。
MAGREF是字节跳动智能创作团队开发的多主体视频生成框架,能从多张参考图像和文本提示生成高质量视频。该技术引入了区域感知动态遮罩机制,使单一模型灵活处理人物、物体和背景,无需架构变化;并采用像素级通道拼接机制,在通道维度上运作以更好地保留外观特征。实验表明,MAGREF在身份一致性和视觉质量方面优于现有技术,能将单主体训练泛化到复杂多主体场景,为内容创作者提供了强大而便捷的视频生成工具。
这项研究揭示了大型语言模型(LLMs)偏好决策的内在机制。以色列理工学院和IBM研究院的团队开发了一种自动化方法,不需人工预设即可发现和解释影响AI判断的关键概念。研究横跨八个领域(从一般问答到安全评估),分析了12种偏好机制,发现人类评判者重视权威性和清晰度,而AI评判更关注事实准确性。他们提出的层次多领域回归模型不仅能准确预测偏好,还能清晰解释判断过程,为构建更透明、更符合人类价值观的AI系统提供了新途径。