北京 - 2021 年 4 月 28日:IBM Z 在市场上高歌猛进。过去一年,在 IBM 保密计算能力、数字资产托管等新工作负载的推动下,IBM Z 平台的销售势如破竹,令人兴奋;有 85 家客户积极规划或者正在 IBM Z 和 LinuxONE 上进行 Red Hat OpenShift 的方案验证。事实上,根据最近由 Deloitte 赞助的一项 Forrester 调研[1],74% 的受访者认为IBM Z作为组织的战略平台,仍具有长久的生命力。
对于许多客户而言,新冠病毒疫情也是使得他们加速向IBM Z平台迁移工作负载的一个推动因素。客户面临着与消费者行为不断变化相关的新型业务挑战,比如金融交易剧烈波动,以及在线零售交易持续增加等;因此,他们寻求 IBM Z 的帮助,希望以可预测、弹性而安全的方式管理激增的峰值业务量。事实上,与 2019 年第二季度相比,IBM Z 客户在 2020 年第二季度通过按需开/关容量 (On/Off Capacity on Demand) 功能,临时激活的通用容量增加了近 4 倍[2]。
但这并不意味着 IBM Z 家族系列只适用于当今最大型的企业。我之前多次提到 — 也花了很多时间介绍KodyPay 和 Ilara Health 这样的初创企业以及包括 Cognition Foundry 在内的业务合作伙伴,他们因为卓越的安全能力而选择 LinuxONE,将其作为自己在混合云市场上的差异化竞争优势。
在宣布将 IBM DS8910F Storage 部署到 IBM Z15 Model T02 机架中不到一周时间,IBM今天就发布新的入门级 LinuxONE 硬件 IBM LinuxONE III Express,以及针对IBM Z 硬件的灵活的新定价模式——随需使用计费模式。
发布 IBM LinuxONE III Express
IBM LinuxONE III Express 是面向初创企业、业务合作伙伴以及 ISV 的现成可用的平台,它在设计时就考虑了速度的提升,以便帮助客户快速启动并运行。
根据 IDC 2020 年第 4 季度的跟踪/预测报告,2021 年中端企业服务器的平均价格为 154,200美元。其中单一既定配置 LinuxONE III Express是为最热门的工作负载(包括数据服务和 Red Hat OpenShift)设计的一种经济实惠的新产品。IBM 内部测试表明,运行同样 WebSphere 和 Db2 工作负载的 12 核 IBM LinuxONE III LT2 Express 服务器需要的内核比同级别的 x86 服务器要少 18.7 倍,三年的总体拥有成本 (TCO) 要低 57%。3
LinuxONE III Express 将在 5 月 25 日正式推出,具有以下特性:
本次发布使IBM有机会将 LinuxONE 客户的范围扩大到更多的初创企业和 ISV,同时IBM还发布了一个新的定价模式,以帮助IBM Z 客户最大程度降低平台成本和提高生产效率。
提高硬件定价的灵活性
今天,IBM推出了一种新的类似云的硬件定价模式作为补充,即随需使用计费模式,使客户能够迅速响应动态工作负载和业务需求的变化。
根据最近的一项ParkMyCloud 调研,到 2021 年,在云上浪费的支出预计将达到 210 亿美元,这通常是由越来越常见的“高峰”工作负载和容量需求的意外增加造成的。
IBM发布的是针对硬件的基于使用量的消费模式,有助于遏制云上支出的浪费,控制不可预测性,为客户提高硬件定价可预见性,提供随时可用的备用容量“通道”,这种“通道”采用基于使用量的收费模式,以满足临时的业务高峰需求。借助 随需使用计费模式,客户现在可轻松扩展容量以满足业务需求,同时还能解决云成本失控问题。
“为了应对客户需求、市场变化及新的法规,我们的业务需求不断变化。IBM Z 在我们的运营中发挥着关键的作用,在网上银行和即时支付工作负载激增的情况下,它使我们能够快速扩展,提供高质量的客户服务。随需使用计费模式提供灵活透明的定价解决方案,以类似云的方式实现最理想的业务绩效,我们只需为使用的容量付费。”一家大型欧洲银行的高管这样表示。
如欲了解更多信息,请访问>>>IBM LinuxONE
获取更多相关资料请访问>>> IBM IT基础架构专区
[1]来源:Forrester Consulting 代表 Deloitte Consulting LLP 于 2020 年 6 月进行的一项委托调研
[2]按需开/关容量激活信息基于 2019 年 4 月至 6 月和 2020 年 4 月至 6 月间所有临时激活活动的 IBM 内部记录。潜在的事务率是根据 IBM 内部对专用 z15 环境中的 CICS 工作负载的衡量以及所有临时激活活动所激活的 CP 总容量的增幅来估算的。
3 这是一项 IBM 内部调研,旨在反映市场中典型 IBM 客户工作负载的使用情况。结果可能因具体环境而有所不同。工作负载包括在 WAS 和 Db2 上运行的事务型核心银行应用。核心银行应用运行八个实例,其中四个实例代表开发/测试/QA 环境,四个实例代表生产环境。根据 IT Economics 客户评估 x86 工作负载数据,开发/测试/QA 和生产环境的 CPU 使用率从 3% 到 20% 不等。在内部调研中,两个平台上的所有实例的平均汇总吞吐量在 5% 以内。在 LinuxONE 上,银行应用在采用 RHEL 7.6 操作系统的两个 LPAR(使用 z/VM 7.1)中运行,这两个 LPAR 分别采用 4GB 和 16 GB 内存以及 4 个虚拟 CP。运行工作负载所需的 LinuxONE 核心总数为 20 个。为了在 x86 上实现相同的工作负载吞吐量,银行应用在总共 24 个双处理器 Sandy Bridge、Haswell 和 Broadwell x86 系统上运行,这些处理器的主频在 2.4-3.2 GHz 之间,共有 448 个核心。实际测试在 z14 M04/LinuxONE Emperor II 上运行,当采用 12 个核心的配置时,它的性能不到 LinuxONE III LT2 Express 的 3%。X86 和 LinuxONE 环境访问相同的存储阵列。总体拥有成本包括三年期的硬件、软件、劳动力、网络、占地面积和能源成本。IBM 软件定价基于标准的美国价目表,含 40% 的折扣。LinuxONE Express、RHEL 和 z/VM 定价基于美国 2021 年 5 月的价格,x86 硬件定价基于 IBM 对 IDC 发布的截至 2021 年 4 月美国价格的分析。占地面积、网络、能源、劳动力和其他 x86 软件成本基于 IBM IT Economics 针对客户的评估数据。如欲获取 TCO 模型的更多信息,请联系 IBM IT Economics 团队:IT.Economics@us.ibm.com。
好文章,需要你的鼓励
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。
这项研究提出了"思想家"(Thinker)任务,一种受人类双重加工理论启发的新型AI训练方法。研究者将问答过程分解为四个阶段:快速思考(严格预算下给出初步答案)、验证(评估初步答案)、慢速思考(深入分析修正错误)和总结(提炼关键步骤)。实验表明,该方法使Qwen2.5-1.5B模型的准确率从24.9%提升至27.9%,DeepSeek-R1-Qwen-1.5B模型从45.9%提升至49.8%。显著的是,仅使用快速思考模式就能达到26.8%的准确率,且消耗更少计算资源,证明了直觉与深度推理作为互补系统的培养价值。
这项由ELLIS研究所和马克斯·普朗克智能系统研究所的科学家进行的研究,揭示了大语言模型安全测试的根本规律:越狱攻击成功率由攻击者与目标模型间的能力差距决定。通过评估500多个攻击者-目标组合,研究团队发现:更强的模型是更好的攻击者;当目标能力超过攻击者时攻击成功率急剧下降;社会科学能力比STEM知识更能预测攻击成功。基于这些发现,研究者建立了预测模型,表明随着AI进步,人类红队测试可能逐渐失效,提示需要发展自动化安全评估方法及更全面地评估模型的说服和操纵能力。
华中科技大学和香港中文大学研究团队提出SATORI-R1,一种通过空间定位和可验证奖励增强多模态推理的新方法。该方法将视觉问答任务分解为图像描述、区域定位和答案预测三个可验证阶段,解决了自由形式推理中注意力分散和训练收敛慢的问题。实验证明,SATORI-R1在七个视觉问答基准上一致提升性能,最高达15.7%,并展示出更聚焦的视觉注意力和更低的训练方差。