IBM公司今天推出了基于同名定制处理器的新服务器产品线——Power11系列。
该产品系列在发布时将包含四款机器。IBM还将通过其公有云提供Power11芯片的访问服务。据该公司称,与采用英特尔芯片的同类服务器相比,客户可以期待高达55%的核心性能提升。
Power11旨在提供99.9999%的可用性,这相当于每年停机时间不到40秒。补丁等维护任务不需要管理员将应用程序下线。当Power11服务器必须关闭以进行更改时,板载软件可以将其托管的应用程序移动到另一台机器上,从而避免停机。
据IBM称,Power11维护软件的另一个优势是它能自动化补丁工作流程。通常,更新重要服务器需要事先进行大量的规划和测试。Power11加快了这一过程,为管理员节省时间。
IBM将为该服务器系列配备名为Cyber Vault的网络安全技术。据该公司称,它可以使用量子计算机无法破解的加密算法对客户数据进行加密。
传统加密算法理论上可以使用大规模量子机器来绕过。这样的机器尚未开发出来,但该技术仍然存在风险。黑客可能窃取加密数据,然后等待能够解密的量子计算机问世。Power11系列使用的量子安全算法旨在降低这种风险。
Cyber Vault还执行其他任务。据IBM称,该技术能够在一分钟内检测到勒索软件。为了增加保护措施,它会创建勒索软件无法删除或加密的客户数据不可变副本。
能效是IBM设计Power11系列时的另一个重点。据该公司称,新的节能设置可以将工作负载的能耗降低多达28%。
新服务器产品线是Power产品组合中首个支持IBM Spyre加速器的产品。该加速器于去年预览发布,是一款拥有256亿个晶体管的人工智能芯片,这些晶体管被组织成32个核心和14英里的微观布线。该处理器封装在PCIe卡中,可以插入服务器以加速推理工作负载。
IBM Power Systems集团总经理Tom McPherson表示:"我们正在利用完整的IBM技术栈来提供混合云、AI和自动化功能,同时建立在我们数十年来作为关键工作负载可信混合基础设施的声誉之上。"
首批Power11产品阵容中的四款服务器由Power E1180领衔,它占据整个数据中心机架。它可以配备多达256个Power11核心和64TB的DDR5内存。该系列中最经济实惠的机器Power S1122采用相当小的机箱,最多可容纳60个Power11核心。
IBM将于7月25日正式推出这些服务器,同时在其公有云中推出基于Power11的虚拟机系列。Spyre加速器计划在第四季度发布。
好文章,需要你的鼓励
CPU架构讨论常聚焦于不同指令集的竞争,但实际上在单一系统中使用多种CPU架构已成常态。x86、Arm和RISC-V各有优劣,AI技术的兴起更推动了对性能功耗比的极致需求。当前x86仍主导PC和服务器市场,Arm凭借庞大生态系统在移动和嵌入式领域领先,RISC-V作为开源架构展现巨大潜力。未来芯片设计将更多采用异构计算,多种架构协同工作成为趋势。
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
Vast Data与云计算公司CoreWeave签署了价值11.7亿美元的多年期软件许可协议,这标志着AI基础设施存储市场的重要转折点。该协议涵盖Vast Data的通用存储层及高级数据平台服务,将帮助CoreWeave提供更全面的AI服务。业内专家认为,随着AI集群规模不断扩大,存储系统在AI基础设施中的占比可能从目前的1.9%提升至3-5%,未来五年全球AI存储市场规模将达到900亿至2000亿美元。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。