IBM商业价值研究院日前发布一份长达28页题为“大型机是数字化转型的支柱”的报告。报告发现,79%的IT高管都认为大型主机对于实现人工智能驱动的创新至关重要。报告指出,经过六十年的发展,大型机已成为存储和处理大量关键业务数据的支柱。在企业开始人工智能驱动数字化转型之旅之际,大型机将在提升数据价值方面发挥关键作用。
IBM 的担忧似乎在于,大型机用户不应该假定现代、生成性人工智能工作负载只是可以在公共云和/或企业数据中心中的 x86 和 GPU 服务器上运行。大型机同样也可以运行这一类的人工智能工作负载。
笔者在出版前有幸读了这份报告。报告的着笔点是大型机-公有云-边缘的混合方法,需将工作负载放在最合适的平台上。人工智能可用于加速大型机应用程序现代化、增强事务性工作负载和改善大型机运营。报告称,“将企业内部大型机与超大规模机相结合,可以创建一种集成运营模式。这种运营模式可以实现敏捷实践和促进应用程序之间的互操作性。”
报告建议大型机用户“利用人工智能获取交易之间的洞察,以增强业务用例,包括欺诈检测、反洗钱、信贷决策、产品推荐、动态定价和情感分析”。
大型机性能可以提升基于规则的人工智能信用评分,一家北美银行在公共云仅对20%的信用卡交易进行评分,每笔交易耗时80毫秒,而将应用程序迁移到大型机上则能够实现100%信用卡交易的评分,每秒可处理15,000笔交易,每笔交易耗时2毫秒,预计每年可节省2000万美元的防欺诈支出。
大型机配备了嵌入式片上人工智能加速器,“可以扩展到以极低的延迟每秒处理数百万个推理请求,这对于交易型人工智能用例(如检测支付欺诈)尤为重要” 。IBM表示,“传统人工智能可用于评估银行支付是否存在欺诈行为,而大型语言模型(LLM)则可用于提高预测的准确性。”
IBM 的 Ensemble AI (组合人工智能)方法就是这样做的:将现有的机器学习模型与更新的 LLM 结合起来。
人工智能可用于改善大型机管理。报告发现,“74% 的高管认为,将人工智能整合到大型机运营中并改变系统管理和维护非常重要。基于人工智能的自动化、预测分析、自我修复和自我调整等功能可以主动检测和预防问题,优化工作流程,提高系统的可靠性。”
大型机可以利用人工智能进行监控、分析、检测和应对网络威胁。此外,生成式人工智能大型语言模型和代码助手可以加速旧编码语言(Cobol)的工作,例如转换为 Java 和 JCL 开发,从而“通过使开发人员能够更快、更高效地实现现代化或构建应用程序,缩小大型机的技能差距”。
IBM 将在 2025 年推出的下一代 z16 大型机中采用人工智能专用 DPU(数据处理单元),从而实现人工智能处理卸载的方法。该系统将配备多达 32 个 Telum II 处理器,支持以 24 TOPS 的速度进行片上人工智能推理加速。Spyre 加速器将增加 32 个人工智能加速器核和 1GB DRAM,其性能与 Telum II 片上人工智能加速器相当。在下一代大型机中,最多可以与Telum II单元一起使用8个人工智能加速器。
不过,蓝色巨人并未打算在旗下大型机架构中添加 GPU。推理工作负载将在大型机上有效运行,但人工智能训练工作负载则不然。我们可以期待 IBM 会有一些实现进行大型机矢量化和矢量数据库功能的安排,以支持推理工作负载中的检索增强生成(RAG)。
对于笔者而言,为大型机添加 GPU 是一个重要的终极目标,原因是大型机配备了 GPU 就打开了在大型机这个经典的大型平台上运行人工智能训练工作负载的大门。或许,GPU 协处理器的概念将成为 z17 大型机的卖点。
好文章,需要你的鼓励
在迪拜Gitex 2025大会上,阿联酋成为全球AI领导者的雄心备受关注。微软正帮助该地区组织从AI实验阶段转向实际应用,通过三重方法提供AI助手、协同AI代理和AI战略顾问。微软已在阿联酋大举投资数据中心,去年培训了10万名政府员工,计划到2027年培训100万学习者。阿联酋任命了全球首位AI部长,各部门都配备了首席AI官。微软与政府机构和企业合作,在公民服务和金融流程等领域实现AI的实际应用,构建全面的AI生态系统。
查尔斯大学和意大利布鲁诺·凯斯勒基金会的研究团队首次系统性解决了同声传译AI系统延迟评估的准确性问题。他们发现现有评估方法存在严重偏差,常给出相互矛盾的结果,并提出了YAAL新指标和SOFTSEGMENTER对齐工具。YAAL准确性达96%,比传统方法提升20多个百分点。研究还开发了专门的长音频评估工具LongYAAL,为AI翻译技术发展提供了可靠的测量标准。
苹果与俄亥俄州立大学研究人员发布名为FS-DFM的新模型,采用少步离散流匹配技术,仅需8轮快速优化即可生成完整长文本,效果媲美需要上千步骤的扩散模型。该模型通过三步训练法:处理不同优化预算、使用教师模型指导、调整迭代机制来实现突破。测试显示,参数量仅1.7亿至17亿的FS-DFM变体在困惑度和熵值指标上均优于70-80亿参数的大型扩散模型。
印度理工学院团队构建了史上最大规模印度文化AI测试基准DRISHTIKON,包含64288道多语言多模态题目,覆盖15种语言和36个地区。研究评估了13个主流AI模型的文化理解能力,发现即使最先进的AI也存在显著文化盲区,特别是在低资源语言和复杂推理任务上表现不佳,为构建文化感知AI提供了重要指导。