CP1服务器以性能换成本?
虽然说CP1源于POWER8,从理论上讲性能应该相差无几,但由于在内存控制方面的改动,对性能带来影响是肯定的。而在峰会上的CP1介绍环节,给出了CP1参考系统的主要性能测试数据,并与英特尔的第一代E5服务器进行了比较。
不过,峰会上给出的数据有误,英特尔至强E5-2690并非是12核心的产品,而是8核心(16线程)。由于E5-2690已经是3年前的产品,笔者就此进一步整理了其他几代E5与POWER7和POWER8平台的性能,在此做一个汇总,来看看CP1在当前市场上所处的水平。主要对比的就是整数和浮点性能,成绩全面来自SPEC官方网站,均是相关平台的最佳成绩。
虽然峰会上将E5-2690的核心数标错了,但其成绩基本正确。如果CP1平台的性能为1的话,领先E5-2690的幅度为5%,但对于E5-2690 v2和v3就力不从心了,分别只有它们的81%和65%,至于目前最顶级的E5-2699 v3,则只有49%。相较POWER平台,也没有超过仍然在售的POWER7+,只有它的83%,较标准的POWER8更是不如,只有42%。
在浮点性能方面,与整数性能测试差不多,不过仍然保持了POWER8架构的浮点计算的优势传统,领先E5-2690达26%,与2690v2基本持平,同时也超过了POWER7+,但对于2690 v3和2699 v3还是有差距的,分别是它们的79%和66%,相对于老大哥POWER8,则只有47%。
CP1服务器整数与浮点性能的测试,很明显体现出了内容带宽的影响。虽然核心的架构与POWER8相同,但由于内存带宽降低了一半,性能也就随之有了明显的降低。这也是为什么我会说它以性能换价格的原因。
不过,从现在的POWER生态角度来说,价格更接地气似乎更为重要,而在性能方面,POWER8的架构也提供了借助外援加速的可能,这就是CAPI,也是RedPOWER在介绍中着重强调的。
CAPI(Coherent Accelerator Processor Interface,一致性加速器接口),是IBM宣称将POWER8开放的一个重要标志,也是OpenPOWER基金会的一个重要发力点和研发方向。
IBM CAPI工作原理,它大大降低了操作系统与设备驱动的系统开销,并打开了系统软件、中间件与企业应用的开发想象空间——透过CAPI,借助相应的ASIC或FPGA芯片进行相关算法与事务处理的定向加速,这一技术目前在x86平台上还没有出现
CAPI只是一个协议的名称,物理连接依托于PCIe 3.0总线,关键组件通过它具备直接访问CPU的内存空间(一致性) 的能力,从而大大提高了外设的运行效率,为系统总体表现“加速”。比如通过CAPI协议可以让外置的闪存PCIe卡的系统开销大幅度降低,减少了不必要的总线占用,根据IBM的内部测试,非数据传输的总线开销(指令传送与响应)可降低50倍,对降低延迟有明显好处。而这一接口,也为POWER8的开放硬件平台提供了基础。
事实上,OpenPOWER基金会的大部分成员都会专注于对CAPI的利用上,比如将外置的网络、GPU、闪存、FPGA(Field Programmable Gate Array,现场可编程门阵列)等设备直接与CPU相连接,并在此基础上,配合相应的软件应用(主要是开源软件),根据不同的主流应用场景进行开放的、定制化的系统设计。
Alpha Data采用赛灵思公司(Xilinx)的FPGA,配合CAPI开发的Alpha Data ADM-PCIE-7V3 PCIe加速卡
RedPOWER的发言人强调,借助FPGA加速卡的CAPI直连,针对键值存储数据库(KVS,Key-Value Store,比如著名的Redis就是KVS数据库的典型代表)加速后的性能,较x86服务器提升了20倍。我觉得,RedPOWER所提到的,应该就是Alpha Data的ADM-PCIE-7V3 PCIe加速卡,在赛灵思(OpenPOWER基金会银牌会员)的官方介绍中,强调该FPGA加速方案在10x X~ 100x低延迟的状况下确保将性能功耗比提升36倍,适合memcached 和NoSQL等领域的应用广泛的大数据工作负载加速引擎。
所以,单纯的CPU性能比拼,并不能代表CP1与OpenPOWER系统级平台的整体实力,而随着这类加速设计所能针对的场景越来越多,也必然会带来更多的竞争优势,配合价格成本的同步降低,显然带给x86平台的压力也会进一步加大。由于x86平台已经被英特尔事实统治,所以这又必然引出了另一个话题:OpenPOWER的开放与英特尔的开放,谁更有优势呢?
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。