IBM 发布了其最新的大型计算机系统 Z17,该系统据称重新定义了大规模人工智能。这款新一代大型机系统搭载 IBM Telum II 处理器,根据 IBM 的说法,它已针对生成式 AI 和智能代理 AI 等工作负载进行了优化。
在 AI 性能方面,IBM 表示 Z17 使企业能够对所有交易进行实时分析,与前代产品 Z16 相比,其每日 AI 推理运算能力提升了 50%。
Z17 的 AI 推理能力由 IBM 所称的"第二代片上 AI 加速器"提供支持,该加速器已集成在 IBM Telum II 处理器中。
这款 AI 加速器提供了更高的频率和计算能力,以及增大 40% 的缓存,IBM 表示这使其能够在一天内执行超过 4500 亿次推理运算,响应时间仅为一毫秒。
Z17 还提供了 IBM Spyre 加速器,该功能将于今年晚些时候推出。它提供了额外的 AI 计算能力,以补充 Telum II 处理器的功能。根据 IBM 的说法,Spyre 和 Telum II 加速器的组合意味着 Z17 可以支持多模型 AI。Spyre 为 Z17 增加了生成式 AI 功能,IBM 表示这使得大型机系统能够安全运行大语言模型 (LLM) 和 AI 助手。
IBM 基础设施高级副总裁 Ric Lewis 在谈到这将如何帮助使用 Z17 的企业时说:"业界正在迅速认识到,AI 的价值取决于其运行的基础设施。目前只有 1% 的企业数据被用于大语言模型。通过 Z17,企业可以以安全、经济的方式利用其尚未开发的企业数据进行 AI 应用。"
IBM 还通过集成 IBM Watsonx Code Assistant for Z 和 IBM Watsonx Assistant for Z 为 Z17 增加了 AIops 功能。IBM 表示,Watsonx Assistant for Z 将与 Z Operations Unite 集成,首次使用实时系统数据提供基于 AI 聊天的事件检测和解决方案。
除了 Z17,公司还发布了 IBM Z Operations Unite,它以 OpenTelemetry 格式整合了来自 IBM Z 多个来源的运营数据,据称可通过 AI 简化 IT 运营。
根据 IBM 的说法,这款 IT 工具帮助管理员更快地检测异常,使他们能够隔离潜在事件的影响,并将解决时间从数小时缩短到数分钟。IBM Z Operations Unite 提供了 IBM 所称的"来自多个来源的事件智能关联"。它还可以与 Watsonx Assistant for Z 协同工作,后者可以提供专家建议,并使 IT 运营团队能够基于这些指导采取行动。
IBM 还采取了措施帮助客户部署量子安全加密。IBM 首席产品官 Tina Tarquinio 表示:"我们的系统已具备量子安全加密功能,现在我们正在引入新工具,帮助客户更快地开启量子安全之旅。"她将量子安全技术的部署描述为"一项重要工作",涉及切换加密算法。
好文章,需要你的鼓励
惠普企业(HPE)发布搭载英伟达Blackwell架构GPU的新服务器,抢占AI技术需求激增市场。IDC预测,搭载GPU的服务器年增长率将达46.7%,占总市场价值近50%。2025年服务器市场预计增长39.9%至2839亿美元。英伟达向微软等大型云服务商大量供应Blackwell GPU,每周部署约7.2万块,可能影响HPE服务器交付时间。HPE在全球服务器市场占13%份额。受美国出口限制影响,国际客户可能面临额外限制。新服务器将于2025年9月2日开始全球发货。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
安全专业协会ISACA面向全球近20万名认证安全专业人员推出AI安全管理高级认证(AAISM)。研究显示61%的安全专业人员担心生成式AI被威胁行为者利用。该认证涵盖AI治理与项目管理、风险管理、技术与控制三个领域,帮助网络安全专业人员掌握AI安全实施、政策制定和风险管控。申请者需持有CISM或CISSP认证。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。